字符串格式转换

tang.zhe · #16

代码：全选

tz@utz:~$  echo "\u5317\u4eacabc" | perl -MEncode -pe  's/\\u([0-9a-fA-F]{4})/encode("utf8", pack("U", hex($1)))/eg'
北京abc
tz@utz:~$

哪里有北京二字，怎么就替换了呢？一头雾水。
关闭后对系统没影响吧？

d313206775 · #17

tang.zhe,
在终端输入 echo "\u5317\u4eacabc" | perl -MEncode -pe 's/\\u([0-9a-fA-F]{4})/encode("utf8", pack("U", hex($1)))/eg'

d313206775 · #18

我的问题还没有解决，哪位大神救救我

oneleaf · #19

python2默认是ascii编码输出文件的，所以对于Unicode会按照 \uXXXXX 的格式写入。

如果希望直接输出为中文，需要如下写入文件：

代码：全选

import codecs
f = codecs.open('xxx.log','a','utf-8')

d313206775 · #20

此楼结贴，感谢大家的帮助。
现进行总结：
是我自己想当然地看错了我获取到的字符串。
我真实获取到的字符串类似于：

代码：全选

a = 'Hour China \\u795e\\u5947\\u7684\\u4e2d\\u56fd'

这样，需进行以下操作：

代码：全选

temp = a.replace('\u','u')
            mystr = temp.decode('unicode-escape')

如果是以下类型的字符串：

代码：全选

 a =‘Hour China \u795e\u5947\u7684\u4e2d\u56fd’

则只需要做

代码：全选

decode('unicode-escape')

转换即可。