问题的url没有完全获取?

来源:6-17 知乎spider爬虫逻辑的实现以及answer的提取 - 1

JaydenJune

2020-10-27

老师,你课上讲的获取问题的url,只是获取了一开始登录成功所获取的问题url,但是首页有滚动条,动态加载更多的问题,动态加载的这些问题的url没有获取,你没有针对动态加载的数据进行逻辑分析。再就是你这课程能不能从新录制,听的真是费劲。我们本来基础就差,你再来个课程衔接不流畅,怎么学?如果全靠学生自己来完成,那我们买课有什么意义?


http://img.mukewang.com/szimg/5f980cf40844fe1000000000.jpg

写回答

1回答

bobby

2020-10-28

你是说所有课程全部重新录制? 你说到的课程衔接不好 是哪个小节衔接不好?

0
5
bobby
回复
JaydenJune
你的问题我在另个一问题中已经回复了 这个内容在html源码中 不过内容是放在js的代码中,你通过正则表达式将js中的文本内容提取出来 然后通过正则表达式提取出来就行了 http://coding.imooc.com/learn/questiondetail/210139.html 这个问题里面
2020-11-02
共5条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程