utf-8解码问题

来源:13-8 正则分析获取名字和人数

道道半百_ouBJXZ

2026-04-14

老师我根据你后续更新爬取斗鱼的代码格式,一样的,但为什么爬取到的会出现格式读取问题?
htmls = str(htmls,encoding=‘utf-8’)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 1: invalid start byte
图片描述
网页源代码也是UTF格式啊,我看别人说改成GKB模式有人尝试成功了,但我的还是报错,搞不懂了想了好久,我看有说需要使用GZIP代码解压,是这样吗?解压就好了吗?

写回答

1回答

7七月

2026-04-16

这个应该是编码问题。我给你一个建议。下载阿里的Qoder: https://qoder.com/users/sign-up?referral_code=tsyoFXc7k48YX3IyntwoZZY93lo7Rgx2     

Qoder的轻量模型是免费的。

然后注册安装,把代码放在目录下,然后用Qoder打开,然后再对话里问他,测试下这个项目看看有什么问题。


1
3
7七月
回复
道道半百_ouBJXZ
哈哈,好。加油
2026-04-19
共3条回复

Python3.8系统入门+进阶 (程序员必备第二语言)

语法精讲/配套练习+思考题/原生爬虫实战

14893 学习 · 4505 问题

查看课程