item_loader.add_css,css选择器一样,但是索引不一样,在item_loader需要怎么处理

来源:4-10 编写spider完成抓取过程 - 2

合法俊哥

2020-12-09

通过item_loader.add_css选择器定位到元素,两个字段只能通过列表的分片区分
比如,直接用css选择器是能得到area、language字段:
area = response.css(’.vodinfobox li span::text’)[6].extract()
language = response.css(’.vodinfobox li span::text’)[7].extract()

但是用item_loader,css选择器的地方都一样,后面的6 跟 7 需要怎么处理呢?
item_loader.add_css(‘area’, ‘.vodinfobox li span::text’)
item_loader.add_css(‘language’, ‘.vodinfobox li span::text’)

写回答

1回答

bobby

2020-12-11

使用xpath可以定位到具体的第几个元素的

0
3
合法俊哥
非常感谢!
2020-12-14
共3条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程