[win10][python2.7.6]为何读取的文件显示的都是"\x00e\x00n"之类的?

来源:2-3 如何统计序列中元素的出现频度

南国漂泊

2016-09-29

txt = open('c:/wxg/eula.3082.txt').read()
txt
\x00l\x00e\x00s\x00 \x00l\x00o\x00i\x00s\x00 \x00d\x00e\x00 \.......


写回答

2回答

慕粉2125289011

2017-03-18

我也遇到这个问题了。刚学完就想马上试试,从维基百科找了段粘贴到txt里,就是这个问题。按你说的用notepad改一下编码果然好用。还要注意split里的W+必须大写

1
2
南国漂泊
好长时间没登录了。都有点忘记之前在这里提问了。
2017-03-19
共2条回复

南国漂泊

提问者

2016-09-29

  1. 抱歉,我选择的文件编码有问题。

  2. 我用 notepad++ 打开,发现文件"eula.3082.txt"的格式 : 以 UCS-2 Little Endian 格式编码。(随机选了一个文件,结果中枪)

  3. 重新构造一个“以ANSI格式编码”的文件,发现是正常的输出。

  4. 文件编码确实很让人头疼了,回忆之前学习python,也是在编码上栽跟头。看课程目录第四章有字符串处理技巧,希望能够帮到我(还没学习到那里)

0
0

Python高效编程技巧实战

精选50个Python案例,源自实战,全面提升Python编程能力

2582 学习 · 360 问题

查看课程