文本内容编码转换
- RegentW
- 帖子: 1486
- 注册时间: 2007-02-27 21:47
- 来自: NN
- bones7456
- 帖子: 8495
- 注册时间: 2006-04-12 20:05
- 来自: 杭州
- 联系:
- BigSnake.NET
- 帖子: 12522
- 注册时间: 2006-07-02 11:16
- 来自: 廣州
- 联系:
- RegentW
- 帖子: 1486
- 注册时间: 2007-02-27 21:47
- 来自: NN
- RegentW
- 帖子: 1486
- 注册时间: 2007-02-27 21:47
- 来自: NN
-
- 帖子: 58
- 注册时间: 2008-10-17 14:23
Re: 文本内容编码转换
我也有类似问题啊~
enconv -L zh_CN -x UTF-8 经济谋.pdf
结果是:Cannot convert `经济谋.pdf' from unknown encoding
但是又用命令:convmv -f GBK -t UTF-8 --notest 经济谋.pdf
结果却是:Your Perl version has fleas #37757 #49830
Skipping, already UTF-8: ./经济谋.pdf
Ready!
再用命令:enca 经济谋.pdf
结果是:Unrecognized encoding
还有错误信息(参数忘了),显示的是:Failure reason: No clear winner.
自己都快崩溃了~这到底是怎么回事啊?折腾了好几天,仍然没用,但是乱码文件的内容打开后显示正常,网上说可能是挂载分区的问题,不过自己电脑里只有ubuntu一个系统,所有分区的格式都是ext3的,自己着实纳闷~ 期望各位大虾指点迷津啊~
enconv -L zh_CN -x UTF-8 经济谋.pdf
结果是:Cannot convert `经济谋.pdf' from unknown encoding
但是又用命令:convmv -f GBK -t UTF-8 --notest 经济谋.pdf
结果却是:Your Perl version has fleas #37757 #49830
Skipping, already UTF-8: ./经济谋.pdf
Ready!
再用命令:enca 经济谋.pdf
结果是:Unrecognized encoding
还有错误信息(参数忘了),显示的是:Failure reason: No clear winner.
自己都快崩溃了~这到底是怎么回事啊?折腾了好几天,仍然没用,但是乱码文件的内容打开后显示正常,网上说可能是挂载分区的问题,不过自己电脑里只有ubuntu一个系统,所有分区的格式都是ext3的,自己着实纳闷~ 期望各位大虾指点迷津啊~
I will be a hacker!
-
- 帖子: 58
- 注册时间: 2008-10-17 14:23
Re: 文本内容编码转换
难道是我的locale问题?我的locale是
LANG=en_US.UTF-8
LC_CTYPE=zh_CN.UTF-8
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
LANG=en_US.UTF-8
LC_CTYPE=zh_CN.UTF-8
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
I will be a hacker!
- v_han
- 帖子: 7
- 注册时间: 2009-09-20 14:42
- xzap
- 帖子: 256
- 注册时间: 2006-08-24 21:25
Re: 文本内容编码转换
代码: 全选
iconv -c -f GB18030 -t UTF-8 RMRB1.TXT >RMRB1_utf8.TXT