分页: 1 / 1
如何判断一个文件的语言编码?
发表于 : 2007-06-26 11:14
由 fego
想写一个脚本,判断该文件用的语言编码为何?
觉得无从下手,有高手可以指点下?
主要是为了通过判断编码,从而进行编码转换。比如简体-繁体或者繁体-简体
发表于 : 2007-06-26 11:23
由 eexpress
enca
发表于 : 2007-06-26 11:31
由 iblicf
geidt 选另存的时候就能看编码,还能改
发表于 : 2007-06-26 12:31
由 fego
enca,认不出来
gedit也不好用,再说,这样看也不是办法啊。
包括用vi 的:set fileencoding也不准确啊。
这些都是和locale有关系的。

Re: 如何判断一个文件的语言编码?
发表于 : 2007-06-26 12:56
由 BigSnake.NET
fego 写了:想写一个脚本,判断该文件用的语言编码为何?
觉得无从下手,有高手可以指点下?
主要是为了通过判断编码,从而进行编码转换。比如简体-繁体或者繁体-简体
简体繁体不能称为"不同编码"
发表于 : 2007-06-26 12:57
由 eexpress
$● enca sci.c
Simplified Chinese National Standard; GB2312
CRLF line terminators
发表于 : 2007-06-28 18:36
由 cnxcy
我的不行:
代码: 全选
$ enca ./Desktop/000-神农本草经.txt
Unrecognized encoding
实际文件应该是GBK码的.
发表于 : 2007-06-28 19:20
由 BigSnake.NET
cnxcy 写了:我的不行:
代码: 全选
$ enca ./Desktop/000-神农本草经.txt
Unrecognized encoding
实际文件应该是GBK码的.
可能有些编码是错误的..看不出来而已
发表于 : 2007-06-28 20:15
由 eexpress
多半那文件是混杂了编码,或者你的分区挂载参数有问题。