多属性标签正则表达式

来源:13-7 正则分析HTML

Walker游游

2018-08-16

老师,我爬的是熊猫电竞网站,它的class属性后边还有一个值为空的属性data-v-f6c1e968,<p class="info-anchor" data-v-f6c1e968=""></p>,我写的正则表达是<p class="info-anchor" data-v-f6c1e968="">[\s\S]*?</p>,读不到数据。list是空,当我用<p class="info-anchor"[\s\S]*?</p>这个表达是读到list之后发现,list元素是<p class="info-anchor" data-v-f6c1e968>数据</p>,然后我把数据两个字换成[\s\S]*?,就把数据完整的读到了。我想请教老师,这种值为空属性是要省略后边的等号和双引号吗,如果list元素的每个data-v-f6c1e968属性值都不相同,又该怎么处理?

http://img.mukewang.com/szimg/5b752f5c0001aed204970079.jpg

http://img.mukewang.com/szimg/5b752f5c0001534207970130.jpg

http://img.mukewang.com/szimg/5b752f5c00016a6207060230.jpg




写回答

1回答

7七月

2018-08-17

如果不同不是有通用匹配符吗?一直寻找到后面相等的字符截止

0
2
Walker游游
老师,我是想请教为什么正则表达式里要写 data-v-f6c1e968, 而不是data-v-f6c1e968="",这个式默认规则吗?
2018-08-17
共2条回复

Python3.8系统入门+进阶 (程序员必备第二语言)

语法精讲/配套练习+思考题/原生爬虫实战

14446 学习 · 4438 问题

查看课程