[问题]为什么linux下的中文显示哦总有问题?
-
- 帖子: 204
- 注册时间: 2008-01-07 16:39
- luojie-dune
- 帖子: 22033
- 注册时间: 2007-07-30 18:28
- 系统: Linux
- 来自: 空气中
- ghostry
- 帖子: 1532
- 注册时间: 2008-07-23 20:08
- 来自: http://www.ghostry.cn
- 联系:
- ghostry
- 帖子: 1532
- 注册时间: 2008-07-23 20:08
- 来自: http://www.ghostry.cn
- 联系:
装了kde的中文包后解决了fcitx的方块,但是wesnoth还是那样。没有改观。
http://www.ghostry.cn狂网技术工作室,组网建站,平面设计,java项目,空间域名.
好心人点这里进去注册并且用一次,给我增加点流量http://tinyurl.com/272ncjl
电脑配置:
公司:880G/II250/1TB/2G1333/
家:785G+/II245+/1TB/2G677/
好心人点这里进去注册并且用一次,给我增加点流量http://tinyurl.com/272ncjl
电脑配置:
公司:880G/II250/1TB/2G1333/
家:785G+/II245+/1TB/2G677/
- foolegg
- 帖子: 249
- 注册时间: 2007-12-01 14:56
在windows下不容易出现乱码,因为windows是默认gb,gb一统天下
连带导致目前在中国,一般用户所能接触到的计算机文件,基本都是gb编码的
而gb是ascii兼容的,所以只要机器上有中文字体,你用ascii内码的英文windows看gb文件,运行gb程序,一样没问题
所以你会觉得,windows没乱码
而ubuntu默认是utf-8的,本来linux大多数软件,都有自动侦测编码的设计,偏偏现在网络上传播的文件(包括网页),很多bom信息都不对,导致自动编码侦测形同虚设,所以如果不进行设置的话,无论是以前在windows下保存的文件,或者是网上down下来的文件,基本都要乱,原因就是这样,仅此而已。
你用windows自带的notebook打开非gb编码,bom信息又有问题的文件看看,一样会乱。
另外,这没有什么谁高谁低的问题,gb是国家标准,unicode的简体中文部分,一样参照gb编制。
而utf-8是unicode的一种实现形式,兼容ascii,编码头部附加长度信息,适合网络传输。
几种编码各有优劣
gb既不定长,又没有utf-8的长度信息,对于保存文件的安全性来说,是不如utf-8的
utf-8编码的文档,损坏一个字节,只会错一两个字,gb编码的文档,损坏一个字节,后面的有可能就都完蛋了。
但是从体积上看,中文的utf-8文件会比gb大不少,而写程序的时候,在内存里装utf-8编码的中文明显不合算。
用ucs保存文件没有utf-8的安全性优势,体积又比gb大,如果英文字符多,甚至可能会比utf-8还大,总的来说,一般不会用ucs保存文件,但ucs是定长编码,计算机处理起来容易,像java内部就使用了ucs处理字符
所以,编码的选择要看情况
以我个人来说,现在硬盘不值钱,我保存文件的时候,肯定会选择utf-8,gb和ucs文件的损坏虽然可以补救,但何苦费这份心思,而且损坏较多的时候,不一定补救得回来
而编程玩的时候,我一般会在内存里装gb(资源占用小),或者ucs(处理方便)
总的来说,不要刻意贬低或者抬高某种编码,不同的编码既然存在,便自有其理
连带导致目前在中国,一般用户所能接触到的计算机文件,基本都是gb编码的
而gb是ascii兼容的,所以只要机器上有中文字体,你用ascii内码的英文windows看gb文件,运行gb程序,一样没问题
所以你会觉得,windows没乱码
而ubuntu默认是utf-8的,本来linux大多数软件,都有自动侦测编码的设计,偏偏现在网络上传播的文件(包括网页),很多bom信息都不对,导致自动编码侦测形同虚设,所以如果不进行设置的话,无论是以前在windows下保存的文件,或者是网上down下来的文件,基本都要乱,原因就是这样,仅此而已。
你用windows自带的notebook打开非gb编码,bom信息又有问题的文件看看,一样会乱。
另外,这没有什么谁高谁低的问题,gb是国家标准,unicode的简体中文部分,一样参照gb编制。
而utf-8是unicode的一种实现形式,兼容ascii,编码头部附加长度信息,适合网络传输。
几种编码各有优劣
代码: 全选
gb系列 不定长(中文2字节,英文1字节),兼容ascii,体积小,保存安全性差
ucs(可以理解为直接保存unicode) 定长(固定2字节),不兼容ascii,体积中等,保存安全性差
utf-8 不定长(中文3字节,英文1字节,其他文字不定),兼容ascii,保存英文体积小,其他文字体积大,安全性高
utf-8编码的文档,损坏一个字节,只会错一两个字,gb编码的文档,损坏一个字节,后面的有可能就都完蛋了。
但是从体积上看,中文的utf-8文件会比gb大不少,而写程序的时候,在内存里装utf-8编码的中文明显不合算。
用ucs保存文件没有utf-8的安全性优势,体积又比gb大,如果英文字符多,甚至可能会比utf-8还大,总的来说,一般不会用ucs保存文件,但ucs是定长编码,计算机处理起来容易,像java内部就使用了ucs处理字符
所以,编码的选择要看情况
以我个人来说,现在硬盘不值钱,我保存文件的时候,肯定会选择utf-8,gb和ucs文件的损坏虽然可以补救,但何苦费这份心思,而且损坏较多的时候,不一定补救得回来
而编程玩的时候,我一般会在内存里装gb(资源占用小),或者ucs(处理方便)
总的来说,不要刻意贬低或者抬高某种编码,不同的编码既然存在,便自有其理
- ghostry
- 帖子: 1532
- 注册时间: 2008-07-23 20:08
- 来自: http://www.ghostry.cn
- 联系:
我也想问问。ffsxsy 写了:怎么更改locate
最好编码都统一了或者自动识别了。不要让用户为编码头疼才是上策。
http://www.ghostry.cn狂网技术工作室,组网建站,平面设计,java项目,空间域名.
好心人点这里进去注册并且用一次,给我增加点流量http://tinyurl.com/272ncjl
电脑配置:
公司:880G/II250/1TB/2G1333/
家:785G+/II245+/1TB/2G677/
好心人点这里进去注册并且用一次,给我增加点流量http://tinyurl.com/272ncjl
电脑配置:
公司:880G/II250/1TB/2G1333/
家:785G+/II245+/1TB/2G677/
-
- 帖子: 1
- 注册时间: 2006-12-20 13:49
-
- 帖子: 7
- 注册时间: 2008-09-12 9:54
-
- 帖子: 190
- 注册时间: 2007-02-27 0:43
- ffsxsy
- 帖子: 779
- 注册时间: 2007-11-04 16:32
- kopision
- 帖子: 578
- 注册时间: 2007-05-06 18:11
微软的locale设置是很诡异的,碰到日文或正体中文的时候乱码问题更加严重。而且unicode是绝对的趋势,外国都很流行了,现在还固执地死守GB的话,以后再过渡到UTF-8可能更痛苦吧ffsxsy 写了:qianbian 有人提到编码的区别,只有仿照微软的做法,给予gb编码。国情已经如此,只有委屈一下utf8了。shining365 写了:Windows为每种语言发布一个版本;而Linux为各种支持的语言发布一个共同的版本。支持到这个程度已经相当不错了。
所以需要国内厂商或组织来推出中文专用的系统,这个难道等国外厂商来作吗?
可连redflag都有乱码!!!!!!!!!!!!!!!!!!!
……
- hethe
- 帖子: 3666
- 注册时间: 2005-08-01 9:14
- ffsxsy
- 帖子: 779
- 注册时间: 2007-11-04 16:32
- luojie-dune
- 帖子: 22033
- 注册时间: 2007-07-30 18:28
- 系统: Linux
- 来自: 空气中
No way, it only happen if Chinese make their own Linux/BSD/Solaris-based OS, neither Redflag use GBK as default.ffsxsy 写了:绝大多数人不知道什么编码的,只有你换了有什么用?hethe 写了:正解,現在趁自己手头文件还在迅速生成,赶紧地换到unicode吧。kopision 写了:
微软的locale设置是很诡异的,碰到日文或正体中文的时候乱码问题更加严重。而且unicode是绝对的趋势,外国都很流行了,现在还固执地死守GB的话,以后再过渡到UTF-8可能更痛苦吧
绝大多数人不会去学怎么转换编码的,还是照顾一下实际吧!