中国裁判文书网的爬取策略?

来源:2-2 mysql和navicat的安装和使用

慕仔7534083

2022-09-30

老师,国庆节快乐!!
请问类似中国裁判文书网https://wenshu.court.gov.cn/ 这种需要实名认证登录的网站,数据可以爬取了,抓取的策略复杂吗?学员可以请老师帮助定制爬虫吗?

写回答

1回答

bobby

2022-10-08

中国文书网本身爬取策略不难,难的是反爬,如果要实名认证才能抓取的话 你还需要实名认证的账号才行, 这些很难绕过

0
0

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5831 学习 · 6293 问题

查看课程