对于汉字的反爬如何解决呢?

来源:7-5 字体文件转换并实现网页内容还原

好雨知时节__

2021-09-22

请问老师,对于汉字的反爬,又该如何应对呢?如下图:
图片描述
每次返回的字体内容不固定

写回答

1回答

小布_老师

2021-09-22

汉字字体的加密渲染,因为内容不固定,所以每次解析的时候,都需要网页上对应的字体文件,而不是固定的。

在解析爬虫的代码中,加上解析汉字的字体文件代码,从字体文件中,提取中对应的映射关系。

关系不固定,每次都需要解密一次字体文件。

0
8
好雨知时节__
回复
小布_老师
这个测试链接的环境莫名原因关闭了,可能是访问的人数太多被发现了。我删除链接了。。
2021-10-05
共8条回复

Python高级爬虫实战-系统掌握破解反爬技能 挑战高薪

加密破解、逆向重构、分布式框架及海量存储方案

494 学习 · 105 问题

查看课程