我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

Ubuntu各种衍生版本
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#1

帖子 寺島聰子 » 2018-04-22 18:41

最近中古の医療用白黒モニターを購入して、マルチディスプレイを構築しようとしてます。
いま、マニュアルを最初から精読してる。
PDFのテキストを取り出してコピー・アンド・ペーストしたいのですが文字化けします。
最近我購買了一台二手醫療黑白顯示器,並試圖建立一個多顯示器。
我從現在開始閱讀手冊。
我想檢索PDF文本並複制並粘貼它,但它出現亂碼。
​​例、ඒɁɛșȽ᝝ȶȲ᫖ໃ૚ፖɥȪȽȗ

どう考えていけばよいでしょうか?
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#2

帖子 poloshiao » 2018-04-22 20:16

ඒɁɛșȽ᝝ȶȲ᫖ໃ૚ፖɥȪȽȗ
1. As Single-byte Character_sets :
https://r12a.github.io/uniview/?charlis ... 8%BD%C8%97
ඒ ‎0D92 SINHALA LETTER EEYANNA
Ɂ ‎0241 LATIN CAPITAL LETTER GLOTTAL STOP
ɛ ‎025B LATIN SMALL LETTER OPEN E
ș ‎0219 LATIN SMALL LETTER S WITH COMMA BELOW
Ƚ ‎023D LATIN CAPITAL LETTER L WITH BAR
᝝ ‎175D [Unassigned code point]
ȶ ‎0236 LATIN SMALL LETTER T WITH CURL
Ȳ ‎0232 LATIN CAPITAL LETTER Y WITH MACRON
᫖ ‎1AD6 [Unassigned code point]
ໃ ‎0EC3 LAO VOWEL SIGN AY
૚ ‎0ADA [Unassigned code point]
ፖ ‎1356 ETHIOPIC SYLLABLE PO
ɥ ‎0265 LATIN SMALL LETTER TURNED H
Ȫ ‎022A LATIN CAPITAL LETTER O WITH DIAERESIS AND MACRON
Ƚ ‎023D LATIN CAPITAL LETTER L WITH BAR
ȗ ‎0217 LATIN SMALL LETTER U WITH INVERTED BREVE
最近我購買了一台二手醫療黑白顯示器
2. You must install framebuffer module to show CJK (Chinese/Japanese/Korean) characters from terminal.
2-1. https://en.wikipedia.org/wiki/Linux_framebuffer
Linux framebuffer
2-2. Check the specification content to see whether
your black/white monitor is compatible with framebuffer module.

3. Advance referance :
3-1. http://jkorpela.fi/chars.html
A tutorial on character code issues
3-2. https://en.wikipedia.org/wiki/Character ... code_pages
Character sets, character maps and code pages
3-3. https://communities.bmc.com/message/296783
What is difference Between Single byte language and Multi - byte Language
3-4. https://en.wikipedia.org/wiki/DBCS#In_C ... _computing
In CJK (Chinese/Japanese/Korean) computing
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#3

帖子 寺島聰子 » 2018-04-23 20:37

poloshiao様いつも詳細な回答をありがとうございます。
大変恐縮ですが、申し上げます。
很對不起,我想。
1. As Single-byte Character_sets :
https://r12a.github.io/uniview/?charlis ... 8%BD%C8%97
ඒ ‎0D92 SINHALA LETTER EEYANNA
Ɂ ‎0241 LATIN CAPITAL LETTER GLOTTAL STOP
ɛ ‎025B LATIN SMALL LETTER OPEN E
ș ‎0219 LATIN SMALL LETTER S WITH COMMA BELOW
Ƚ ‎023D LATIN CAPITAL LETTER L WITH BAR
᝝ ‎175D [Unassigned code point]
ȶ ‎0236 LATIN SMALL LETTER T WITH CURL
Ȳ ‎0232 LATIN CAPITAL LETTER Y WITH MACRON
᫖ ‎1AD6 [Unassigned code point]
ໃ ‎0EC3 LAO VOWEL SIGN AY
૚ ‎0ADA [Unassigned code point]
ፖ ‎1356 ETHIOPIC SYLLABLE PO
ɥ ‎0265 LATIN SMALL LETTER TURNED H
Ȫ ‎022A LATIN CAPITAL LETTER O WITH DIAERESIS AND MACRON
Ƚ ‎023D LATIN CAPITAL LETTER L WITH BAR
ȗ ‎0217 LATIN SMALL LETTER U WITH INVERTED BREVE
こちらのサイトを使って、このように分析できることは、わかりました。
使用這個網站,它已經發現,可以通過這種方式進行分析。
しかしながら、当初の目的である「PDFのテキストを取り出してコピー・アンド・ペーストしたいのですが文字化けします」
但是,最初的目的是“我想要取出PDF文本並複制並粘貼它,但它會變成亂碼。”
これの解決方法がわかりません。該解決方案不知道。
これがわからないと、マニュアル内の理解しがたい箇所についてネット検索その他が不便です。
If I do not understand this, WEB search and others are inconvenient about the unintelligible part in the manual.
わたしがダウンロードした
um_ja_RadiForceG22.pdf
で上記願いを達成するための具体的方途をお示しください。
我下載了它
um_ja_RadiForceG22.pdf
請說明達到上述願望的具體方式。
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#4

帖子 poloshiao » 2018-04-23 20:59

um_ja_RadiForceG22.pdf
1. Give us the download address of the above pdf.
最近我購買了一台二手醫療黑白顯示器,並試圖建立一個多顯示器。
2. Mint 17.2 or mate 16.04 ?
3. What session do you login ?
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#5

帖子 寺島聰子 » 2018-04-24 0:27

まず最初に返事が非常に遅いことをおわびします。
マルチディスプレイの構成で複雑化し、その状態に慣れておらず、イメージ通りにできず、poloshiaoさんへの回答を何回書いてもミス操作で送信前に閉じて消してしまう、ということを繰り返し(しかもなぜこのミスが起こるのか未解明)ゆえに最小限のことだけ、書きます。
首先我很抱歉,答复很晚。 它是複雜的多顯示器的配置,它不習慣於這種狀態,不能根據圖像做到,它重複它關閉和消失之前發送錯誤的操作,無論多少次的答复poloshiao寫 我不知道為什麼會發生這樣的錯誤)所以我只寫最小的東西。

(中国語でpoloshiaoさんのお名前にどういった敬語をつけるのが適切なのかもわからず、失礼があればお許しください)
(请不要知道中文中poloshiao的名字是什么样的敬语,请原谅我,如果它是粗鲁的。)
1. Give us the download address of the above pdf.
https://drive.google.com/file/d/1Feryow ... sp=sharing
ひじょうに煩瑣な登録作業をしないとダウンロードできないため、グーグルドライブの共有です。これでよかったでしょうか?
這是Google Drive的共享,因為它不能下載,除非它是非常麻煩的註冊工作。 這很好嗎?
2. Mint 17.2 or mate 16.04 ?
ずーっとmint17.2です。
3. What session do you login ?
この質問の意味が理解できません。今の場合、「session」とは何でしょうか?
我不明白这个问题的意思。 在这种情况下,什么是“session”?
附件
Screenshot-モニタの設定.png
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#6

帖子 寺島聰子 » 2018-04-24 0:37

2. You must install framebuffer module to show CJK (Chinese/Japanese/Korean) characters from terminal.
これが回答ですね。すいません、トラブルに会いまくって見落としていました。
明日、調べます。
这是答案。 我很抱歉,我错过了自己,并忽略了它。
我将在明天进行调查。
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#7

帖子 poloshiao » 2018-04-24 14:36

この質問の意味が理解できません。今の場合、「session」とは何でしょうか?
我不明白这个问题的意思。 在这种情况下,什么是“session”?
1. 把下面指令 複製 貼進終端機 執行
echo $DESKTOP_SESSION
把結果直接複製貼上來
1-1. 上面的結果 就是你登入的 desktop-session
1-2. 參閱
https://en.wikipedia.org/wiki/Session_( ... management
Desktop session management
ずーっとmint17.2です。
これが回答ですね。すいません、トラブルに会いまくって見落としていました。
明日、調べます。
2. Your mint17.2 has installed framebuffer module already if you booted to the desktop session.

3. 把下面指令 複製 貼進終端機 執行
3-1. xrandr -q --verbose
3-2. locale
把結果直接複製貼上來
最近我購買了一台二手醫療黑白顯示器
4. 黑白顯示器 連接在哪個接口 ?
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#8

帖子 寺島聰子 » 2018-04-25 21:43

m@m ~ $ echo $DESKTOP_SESSION
mate
m@m ~ $
desktop-sessionとはDesktop Environmentのことだったんですね!
桌面會話是關於桌面環境!

代码: 全选

m@m ~ $ xrandr -q --verbose
Screen 0: minimum 320 x 200, current 1200 x 1600, maximum 8192 x 8192
HDMI-0 disconnected (normal left inverted right x axis y axis)
	Identifier: 0x51
	Timestamp:  48665
	Subpixel:   horizontal rgb
	Clones:    
	CRTCs:      0 1
	Transform:  1.000000 0.000000 0.000000
	            0.000000 1.000000 0.000000
	            0.000000 0.000000 1.000000
	           filter: 
	audio: auto 
		supported: off, on, auto
	scaling mode: None 
		supported: None, Full, Center, Full aspect
	dither: off 
		supported: off, on
	underscan vborder: 0 
		range: (0, 128)
	underscan hborder: 0 
		range: (0, 128)
	underscan: off 
		supported: off, on, auto
	coherent: 1 
		range: (0, 1)
VGA-0 disconnected (normal left inverted right x axis y axis)
	Identifier: 0x52
	Timestamp:  48665
	Subpixel:   no subpixels
	Clones:    
	CRTCs:      0 1
	Transform:  1.000000 0.000000 0.000000
	            0.000000 1.000000 0.000000
	            0.000000 0.000000 1.000000
	           filter: 
	scaling mode: None 
		supported: None, Full, Center, Full aspect
	load detection: 1 
		range: (0, 1)
DIN disconnected (normal left inverted right x axis y axis)
	Identifier: 0x53
	Timestamp:  48665
	Subpixel:   no subpixels
	Clones:    
	CRTCs:      0 1
	Transform:  1.000000 0.000000 0.000000
	            0.000000 1.000000 0.000000
	            0.000000 0.000000 1.000000
	           filter: 
	tv standard: ntsc 
		supported: ntsc, pal, pal-m, pal-60, ntsc-j, scart-pal, pal-cn, secam
	load detection: 1 
		range: (0, 1)
DVI-0 connected primary 1200x1600+0+0 (0x56) right (normal left inverted right x axis y axis) 399mm x 299mm
	Identifier: 0x54
	Timestamp:  48665
	Subpixel:   horizontal rgb
	Gamma:      1.0:1.0:1.0
	Brightness: 1.0
	Clones:    
	CRTC:       0
	CRTCs:      0 1
	Transform:  1.000000 0.000000 0.000000
	            0.000000 1.000000 0.000000
	            0.000000 0.000000 1.000000
	           filter: 
	EDID: 
		00ffffffffffff0015c3221701010101
		0213010280281e78e200000000000000
		00404e00000001010101010101010101
		010101010101483f403062b0324040c0
		13008f2b1100001e000000ff00333339
		31363031390a20202020000000fd003b
		3d4a4c11000a202020202020000000fc
		004732320a20202020202020202000c4
	load detection: 1 
		range: (0, 1)
	audio: auto 
		supported: off, on, auto
	scaling mode: None 
		supported: None, Full, Center, Full aspect
	dither: off 
		supported: off, on
	underscan vborder: 0 
		range: (0, 128)
	underscan hborder: 0 
		range: (0, 128)
	underscan: off 
		supported: off, on, auto
	coherent: 1 
		range: (0, 1)
  1600x1200 (0x56)  162.0MHz +HSync +VSync *current +preferred
        h: width  1600 start 1664 end 1856 total 2160 skew    0 clock   75.0KHz
        v: height 1200 start 1201 end 1204 total 1250           clock   60.0Hz
m@m ~ $ locale
LANG=ja_JP.UTF-8
LANGUAGE=
LC_CTYPE="ja_JP.UTF-8"
LC_NUMERIC=ja_JP.UTF-8
LC_TIME=ja_JP.UTF-8
LC_COLLATE="ja_JP.UTF-8"
LC_MONETARY=ja_JP.UTF-8
LC_MESSAGES="ja_JP.UTF-8"
LC_PAPER=ja_JP.UTF-8
LC_NAME=ja_JP.UTF-8
LC_ADDRESS=ja_JP.UTF-8
LC_TELEPHONE=ja_JP.UTF-8
LC_MEASUREMENT=ja_JP.UTF-8
LC_IDENTIFICATION=ja_JP.UTF-8
LC_ALL=
m@m ~ $ 
この場合、終端機の内容を をcodeタグでよかったんですか?適切でしたか? 
他の方法のほうが正しいですか?
In this case, did you use the code tag for the contents of the terminator? Was it appropriate? In case
Is the other method more correct?
4. 黑白顯示器 連接在哪個接口 ?
DVI です。
次から次へと要望を出し恐縮ですが、また唐突でもありますが、次のように考えます。
我は例のマニュアルをpdf のままで見てコピー・アンド・ペーストはできなくてもいい。
自分にとってより重要、より根幹的喫緊の疑問であるマルチディスプレイの構成の仕方について、教授してください。
I am sorry for giving a request from one to the next, but it is abrupt again, but I think as follows.
I do not have to be able to copy and paste the example manual as pdf.
Please teach me how to configure a multi-display which is more important, more fundamental and urgent question for me.

mint17.2上では、「すべてのモニタで同じ画像」のチェックボックスがグレーアウトして選択できません。
ウインドウズ上で同じことをしてみたら、簡単にできる! 
ただし、大きな犠牲があった。
医療用のほうは「縦置き」で「高解像度」
テレビは、「横置き」で「低解像度」
これを複製させると、どちらも低い解像度になり、しかもテレビは、「縦置きデスクトップ表示」になる。
On mint 17.2, check boxes of "same image on all monitors" are greyed out and can not be selected.
If you do the same thing on Windows, you can easily do it! In case
However, there was a big sacrifice.
Medical use is "vertical" and "high resolution"
Television is "horizontal" and "low resolution"
If you duplicate this, both have lower resolutions, and the TV becomes 'Vertical desktop display'.

なにも知らないまっさらな時のイメージでは、「拡張」より「複製」のほうが単純なんだから、簡単に実現できると思ったが、私の環境のように、ハードウェア的に大きく異なる場合は、そうではないみたい。
In the image at the very moment when I do not know anything, since "duplication" is simpler than "expansion", I thought that it could be realized easily, but in the case of hardware environment which is very different like my environment , It looks like it is not.

ふだんは医療用白黒ディスプレイをメインにして、文章中心作業とウェブ閲覧をしたい。
2台同時に点灯したくない。動画とゲームをするときだけ、テレビに切り替えたい。その際には、白黒ディスプレイは電源OFFにしたい。
Usually I would like to do text centered work and web browsing with medical black and white display as the main.
I do not want to light up the two at the same time. I want to switch to TV only when playing video and games. In that case, I want to turn off the power of the monochrome display.
今は「拡張」しか選択できないので、
「firefoxのウインドウをドラッグしてテレビ側へ移動」したり「ディスプレイの設定」から、2台のディスプレイの「有効無効の切り替え」操作を毎回しています。煩雑で残念です。
現在我只能選擇“擴展名”
“拖動firefox窗口移動到電視機側”或“顯示設置”,以便每次對兩個顯示器中的每一個執行“有效和無效”切換操作。 這是複雜和令人遺憾的。

冗長な説明でごめんなさい。意味が伝わったですか?いつも、ありがとうございます。
Sorry for the redundant explanation. Did it make sense? I am always grateful for your help.
附件
Screenshot-モニタの設定.png
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#9

帖子 寺島聰子 » 2018-04-25 21:59

追加画像
附件
Screenshot-モニタの設定.png
Screenshot-モニタの設定-1.png
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#10

帖子 寺島聰子 » 2018-04-26 10:10

http://daily.belltail.jp/?p=1515
MATE桌面環境多顯示器設置 有如何使用dconf編輯器進行設置,

在“面板的顯示位置”

為了跟踪[apps]→[panel]→[toplevels]→[panel0]
,下層沒有[panel]或更低層。
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#11

帖子 寺島聰子 » 2018-04-26 10:13

画像
附件
Screenshot.png
Screenshot.png (6.92 KiB) 查看 8831 次
头像
susbarbatus
帖子: 2966
注册时间: 2010-04-10 16:14
系统: Arch Linux

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#12

帖子 susbarbatus » 2018-04-26 10:20

どのPDFリーダーを使われてるんでしょう?もしかして、モニターではなく、ソフトのせいかも。
上次由 susbarbatus 在 2018-05-02 9:07,总共编辑 1 次。
沉迷将棋中……
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#13

帖子 寺島聰子 » 2018-04-26 10:32

ありがとうございます。非常感谢。

mate デフォルトのEvince です。
寺島聰子
帖子: 688
注册时间: 2016-06-03 14:39
系统: debian11 mate

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#14

帖子 寺島聰子 » 2018-04-26 10:42

(synaptic:4177): GLib-CRITICAL **: g_child_watch_add_full: assertion 'pid > 0' failed
(Reading database ... 321308 files and directories currently installed.)
Preparing to unpack .../atril_1.10.2-1+rafaela_amd64.deb ...
Unpacking atril (1.10.2-1+rafaela) over (1.10.2-1+rafaela) ...
Processing triggers for man-db (2.6.7.1-1ubuntu1) ...
Processing triggers for desktop-file-utils (0.22-1ubuntu1.1) ...
Processing triggers for mime-support (3.54ubuntu1.1) ...
Processing triggers for libglib2.0-0:i386 (2.40.2-0ubuntu1) ...
Processing triggers for libglib2.0-0:amd64 (2.40.2-0ubuntu1) ...
Setting up atril (1.10.2-1+rafaela) ...
Processing triggers for libc-bin (2.19-0ubuntu6.14) ...

前にatrilをインストールしたのですが、なぜか起動しなくて、今回再インストールしてみました。
...
やはり起動しません。スタートメニューに存在しているのに。このLinuxmintは長く使っており
もうOSがダメになっているのでしょうか?
我之前安裝了atril,但由於某種原因,我沒有啟動它,這次我重新安裝了它。
...
它再次不會開始。 即使它存在於開始菜單中。 這款Linuxmint已經使用了很長時間
操作系統現在無用嗎?
头像
susbarbatus
帖子: 2966
注册时间: 2010-04-10 16:14
系统: Arch Linux

Re: 我想檢索PDF文本並複制並粘貼它,但它出現亂碼。

#15

帖子 susbarbatus » 2018-04-26 11:00

Evinceは、エンコーディングをうまく対処してるソフトと思うですけど、とにかく他のソフトを試して見ましょう。
FirefoxでこのPDFをオープンしてコピーしても同じ内容になりますか?
沉迷将棋中……
回复