关于utf-8解码问题?

来源:13-2 分析抓取目的确定抓取页面

慕仙6146424

2017-11-20

http://img.mukewang.com/szimg/5a128cf00001dce408440660.jpg

为什么有些url能运行和解码,有些url则报以上错误,尝试用那个chardet找出原始文档的编码,找不到,显示原始编码None,对编码解码的问题也是一知半解啊,不知道老师可否指点一下,只求知道原因,当然,如果能提供一些解决思路那就更好了啦,哈哈。(其实我弄了大半天都没解决,百度了一些解决方案,试过几个,都不行,主要是它有些URL页面是没问题的,可以顺利转换str和解码的,有些却不行,报以上错误,这点我很好奇,我个人的猜测:难道这就是传说中的反爬虫?他们这URL页面的编码的时候做了编码加密之类的动作?)

写回答

1回答

慕粉3752101

2017-11-20

可以试试看GBK8

1
2
芥子啊
回复
慕仙6146424
网页源码里会告诉你编码类型,不是反爬机制,比如这个页面的源码
2019-06-29
共2条回复

Python3.8系统入门+进阶 (程序员必备第二语言)

语法精讲/配套练习+思考题/原生爬虫实战

14598 学习 · 4469 问题

查看课程