老师 我觉得parse_topic()这段代码有点问题

来源:14-13 获取和解析详情页 - 2

慕斯8319460

2020-06-21

当parse_topic(next_page)的时候会略去第一个div的内容,但从第二页开始,第一个div也属于answer

写回答

2回答

慕斯8319460

提问者

2020-06-23

第一页可以这样子,但是从第二页开始,all_divs[0]不是topic的内容  而是answer

0
2
慕少0521335
确实有问题,因为从第二页开始就没有close_topic这个div,也就是说parse_topic这个方法的前半段只能被调用一次,除开第一页就没有必要获取topic的content,jtl等,只要获取answer的信息就行。 而且不加try except会报错。 不知道后面的视频有没有解决这个问题
2020-06-26
共2条回复

bobby

2020-06-22

当前这一页已经通过 for answer_item in all_divs[1:]: 这里获取到了

0
1
慕少0521335
确实有问题,因为从第二页开始就没有close_topic这个div,也就是说parse_topic这个方法的前半段只能被调用一次,除开第一页就没有必要获取topic的content,jtl等,只要获取answer的信息就行
2020-06-26
共1条回复

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2378 学习 · 1158 问题

查看课程