关于linux的 "sort" 和 "uniq"
发表于 : 2009-12-15 18:39
发现不知道是不是bug的问题, 有一个测试文件(test.txt),内容如下:
● ○
● ○
○
● ○
● ○
● ○
● ○
● ○
● ○
● ○
○ ●
● ○
就12行,utf8编码中间是空格,回车符前没有任何空格.
用 sort < test.txt, 出来的结果同原文件, 更神奇的是,
如果用 uniq -c < test.txt , 输出是:
12 ● ○
也就是说, sort和uniq,把“● ○” “○ ●” “○
”这三种unicode字符组合当成一样的?
试了sort的R n 这些参数都无效...
为什么阿...
● ○
● ○
○
● ○
● ○
● ○
● ○
● ○
● ○
● ○
○ ●
● ○
就12行,utf8编码中间是空格,回车符前没有任何空格.
用 sort < test.txt, 出来的结果同原文件, 更神奇的是,
如果用 uniq -c < test.txt , 输出是:
12 ● ○
也就是说, sort和uniq,把“● ○” “○ ●” “○
试了sort的R n 这些参数都无效...
为什么阿...