utf-8解码问题
来源:13-8 正则分析获取名字和人数
道道半百_ouBJXZ
2026-04-14
老师我根据你后续更新爬取斗鱼的代码格式,一样的,但为什么爬取到的会出现格式读取问题?
htmls = str(htmls,encoding=‘utf-8’)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte
网页源代码也是UTF格式啊,我看别人说改成GKB模式有人尝试成功了,但我的还是报错,搞不懂了想了好久,我看有说需要使用GZIP代码解压,是这样吗?解压就好了吗?
写回答
1回答
-
这个应该是编码问题。我给你一个建议。下载阿里的Qoder: https://qoder.com/users/sign-up?referral_code=tsyoFXc7k48YX3IyntwoZZY93lo7Rgx2
Qoder的轻量模型是免费的。
然后注册安装,把代码放在目录下,然后用Qoder打开,然后再对话里问他,测试下这个项目看看有什么问题。
132026-04-19
相似问题