[win10][python2.7.6]为何读取的文件显示的都是"\x00e\x00n"之类的?
来源:2-3 如何统计序列中元素的出现频度
南国漂泊
2016-09-29
txt = open('c:/wxg/eula.3082.txt').read()
txt
\x00l\x00e\x00s\x00 \x00l\x00o\x00i\x00s\x00 \x00d\x00e\x00 \.......写回答
2回答
-
我也遇到这个问题了。刚学完就想马上试试,从维基百科找了段粘贴到txt里,就是这个问题。按你说的用notepad改一下编码果然好用。还要注意split里的W+必须大写
122017-03-19 -
南国漂泊
提问者
2016-09-29
抱歉,我选择的文件编码有问题。
我用 notepad++ 打开,发现文件"eula.3082.txt"的格式 : 以 UCS-2 Little Endian 格式编码。(随机选了一个文件,结果中枪)
重新构造一个“以ANSI格式编码”的文件,发现是正常的输出。
文件编码确实很让人头疼了,回忆之前学习python,也是在编码上栽跟头。看课程目录第四章有字符串处理技巧,希望能够帮到我(还没学习到那里)
00
相似问题