2015年1月8日星期四

python编码输出的一个问题

今天纠结于一个问题

就是内容为这样的TXT文件:
\xc3\xc0\xb9\xfa\xb6\xd3\

直接读出然后print出来,仍然是这样无法阅读的字符,如下:
op = open('1.txt','rb')
print op.read()

怎样转换为可读字符呢?于是
op = open('1.txt','rb')
print op.read().decode('utf-8').encode('gbk')
print op.read().decode('gbk')
print op.read().encode('gbk')

各种报错啊,
最后终于弄好了,如下方式输出,即是正常的字符了
print op.read().decode('string_escape').decode('gbk')

没有评论: