动态网页加载

来源:9-5 其余动态网页获取技术介绍-chrome无界面运行、scrapy-splash、selenium-grid, splinter

慕数据8106153

2019-04-24

老师  我想用 selenium加载动态网页 滚轮下滑到底就会出现新内容  这样的网站 是通过selenium模拟下滑  然后出现新内容之后解析吗  但是我要怎么判断哪些内容之前爬没爬过呢 因为每次出现的内容都是在之前基础上添加的

写回答

1回答

bobby

2019-04-26

这种属于动态加载的方式,你可以直接分析出url,然后用scrapy的request发送这个url就行了, 你后面的这个新内容的问题可以直接通过数据库去重,有数据就更新的方式就行了

0
0

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程