CSDN论坛获取

来源:14-14 获取个人信息详情-1

敏哥啊敏哥

2019-10-14

老师7-13这节中,应该在CSDN爬取用户的详情。可点进后发现和视频中的不一样,貌似已经改过版了见图:图片描述

里面获取的class名称都不一样。自己尝试修改,实在看不懂
图片描述

写回答

2回答

有料

2020-01-29

all_lis_strs = sel.xpath("//ul[@class='me_chanel_list clearfix']/li//span/text()").extract()
new_list = []
flag = 0
for item in all_lis_strs:
   number_match = re.search("(\d+)", item)
   if flag == 1:
       if number_match:
           new_list.append(int(number_match.group(1)))
           flag = 0
       else:
           new_list.append(0)
           new_list.append(item)
   else:
       new_list.append(item)
       flag = 1
print(new_list)



自己重写了个list方法,供大家参考

0
1
有料
优化了新的代码 可以适用所有列表类型了 for item in all_lis_strs: number_match = re.search("(\d+)", item) if number_match: new_list.pop() new_list.append(int(number_match.group(1))) else: new_list.append(0)
2020-01-30
共1条回复

bobby

2019-10-17

改版没有关系,自己根据新改版的的写提取规则就行了

0
0

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2377 学习 · 1158 问题

查看课程