分页: 1 / 1

如何判断一个文件的语言编码?

发表于 : 2007-06-26 11:14
fego
想写一个脚本,判断该文件用的语言编码为何?
觉得无从下手,有高手可以指点下?
主要是为了通过判断编码,从而进行编码转换。比如简体-繁体或者繁体-简体

发表于 : 2007-06-26 11:23
eexpress
enca

发表于 : 2007-06-26 11:31
iblicf
geidt 选另存的时候就能看编码,还能改

发表于 : 2007-06-26 12:31
fego
enca,认不出来
gedit也不好用,再说,这样看也不是办法啊。
包括用vi 的:set fileencoding也不准确啊。
这些都是和locale有关系的。 :shock: :shock: :shock:

Re: 如何判断一个文件的语言编码?

发表于 : 2007-06-26 12:56
BigSnake.NET
fego 写了:想写一个脚本,判断该文件用的语言编码为何?
觉得无从下手,有高手可以指点下?
主要是为了通过判断编码,从而进行编码转换。比如简体-繁体或者繁体-简体
简体繁体不能称为"不同编码"

发表于 : 2007-06-26 12:57
eexpress
$● enca sci.c
Simplified Chinese National Standard; GB2312
CRLF line terminators

发表于 : 2007-06-28 18:36
cnxcy
我的不行:

代码: 全选

$ enca ./Desktop/000-神农本草经.txt
Unrecognized encoding
实际文件应该是GBK码的.

发表于 : 2007-06-28 19:20
BigSnake.NET
cnxcy 写了:我的不行:

代码: 全选

$ enca ./Desktop/000-神农本草经.txt
Unrecognized encoding
实际文件应该是GBK码的.
可能有些编码是错误的..看不出来而已

发表于 : 2007-06-28 20:15
eexpress
多半那文件是混杂了编码,或者你的分区挂载参数有问题。