CSDN论坛信息官网更新

来源:14-12 获取和解析详情页 - 1

慕用2063631

2020-04-14

老师,论坛侧,子模块里面帖子,它设置了置顶的那几篇导致主题那有二个href,如图,前面几个td里面有二个a标签,后面的只有一个,代码应该如何写可以 在二个里面获取最后一个,在一个里面获取那一个。 他们的class 所需的二个有相同点
http://img.mukewang.com/szimg/5e9542ea08b5a5cf18231101.jpg

写回答

2回答

慕用2063631

提问者

2020-04-14

111
0
0

慕用2063631

提问者

2020-04-14

解决了,复习了下之前xpath的语法,在td里面选取最后一个a标签    //td[3]/a[last()]/@href    这样其余一些代码也需要改动了,希望老师在课程里面可以优化一下

0
1
bobby
好的,
2020-04-16
共1条回复

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2377 学习 · 1158 问题

查看课程