xpath提取数据问题

来源:8-6 使用多线程重构csdn爬虫 - 2

郭少宇

2020-02-06

老师,想要提取“csdnc-bloglevel-4"这个属性,应该怎样编写命令呢?
我用的两种命令如下都没有成功:

#1
blog_grade_str = sel_blog.xpath("//div[@class='me_chanel_det_item level']/svg/use/svg/@id").extract()[0]
#2
blog_grade_str = sel_blog.xpath("//div[@class='me_chanel_det_item level']/svg/use/@xlink:herf").extract()[0]

图片描述

写回答

2回答

郭少宇

提问者

2020-02-07

不同的等级“csdnc-bloglevel-”后面的数字不同,要提“-”后面的数字,我用的这两种方法都抛出异常,没太明白老师的做法,能再详细点吗?

0
3
bobby
回复
郭少宇
好的,
2020-02-08
共3条回复

bobby

2020-02-07

可以定位这个元素 //img1.sycdn.imooc.com/szimg/5e3cf4890997700f07840186.jpg的父元素啊

0
0

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2377 学习 · 1158 问题

查看课程