爬取csdn博客板块推荐信息,怎么去重?

来源:4-2 scrapy安装和配置

keeping18

2023-02-08

问题描述:

每次进入推荐页面的url是相同的,但是显示的内容是不一样的(没有规律),这样的话怎么对爬取的内容去重呢?

相关截图:

写回答

1回答

bobby

2023-02-09

这是推荐系统的url是一样的,但是内容是不一样的, 这样你只需要不停的抓取同一个url就能抓取到内容,去重scrapy会去做的

0
1
keeping18
好的,谢谢老师~
2023-02-09
共1条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程