思想极限: python编码输出的一个问题

2015年1月8日星期四

python编码输出的一个问题

今天纠结于一个问题

就是内容为这样的TXT文件：

\xc3\xc0\xb9\xfa\xb6\xd3\

直接读出然后print出来，仍然是这样无法阅读的字符，如下：

op = open('1.txt','rb')

print op.read()

怎样转换为可读字符呢？于是

op = open('1.txt','rb')

print op.read().decode('utf-8').encode('gbk')

或

print op.read().decode('gbk')

或

print op.read().encode('gbk')

各种报错啊，

最后终于弄好了，如下方式输出，即是正常的字符了

print op.read().decode('string_escape').decode('gbk')

没有评论:

订阅：博文评论 (Atom)