Ubuntu中文论坛

发表于： **2014-04-30 1:04**

为什么unicode不像gb码那样,英文单字节,非英文多字节呢?
如果这样定义的话,unicode在英文和非英文混写时,都能有效利用空间,不会出现要么英文多占,要么非英文多占.

Thu May 1 15:36:14 CST 2014补充:
我的意思为什么unicode没有一个实现版本把所有国家的语言都定义成一个巨大的ansi扩展编码?
utf8:非英文编码长度不固定,处理难度大.
utf16,32:英文表示效率低.
ansi扩展:就像GB一样,只不过中国出的只支持自己,如果换成联合国,就支持所有国家了.

发表于： **2014-04-30 9:18**

那是utf8吧，在zh_CN.UTF-8里面，本来英文就是只占一个字节的吧，不同的只是编码方式而已，不然，C里就不会有char跟wchar_t的区别了吧。

发表于： **2014-04-30 10:52**

没分清unicode和utf8 utf16吧。不同的概念。

发表于： **2014-04-30 10:57**

在leafpad里试了下，保存为utf8，一个字母占一个字节

发表于： **2014-05-01 15:33**

TeliuTe 写了：在leafpad里试了下，保存为utf8，一个字母占一个字节

utf8,英文占一个,汉字占两个或多个.
utf16,英文占站两个,一个汉字占两个.
仔细想想,其实空间也不是问题,ansi扩展表示非英文也会字节增加.
真正的问题是长度的不确定性,处理起来会有难度.
如果有一个巨大的ansi扩展码,把多个国家的字符当成一个国家的字符来处理,就用不着变长了.

发表于： **2014-06-12 20:05**

楼主知不知道linux为什么默认UTF-8编码而不是unicode编码？

发表于： **2014-12-05 1:58**

unicode只有字符映射关系，没规定具体编码
例如A的unicode编码是65，这个65怎么编码unicode是不管的，utf-8用一个字节，UCS-2用两个字节

发表于： **2014-12-05 7:18**

如果有一个巨大的ansi扩展码,把多个国家的字符当成一个国家的字符来处理,就用不着变长了.

Ubuntu中文论坛

为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?

Re: 为什么unicode不像gb码那样,英文单字节,非英文多字节呢?