请教列表抽取问题

来源:17-1 课程总结

没什么大不了的

2017-06-06

抽取列表信息时,首先提取列表集合node_list,然后在循环里面初始化loader=(item=**,selector=node),其中node为node_list的循环变量,然后add_xpath时,添加的xpath确定是当前node里面的一个元素,add_xpath后就变成了列表所有元素的元素集合了,代码和webmagic一模一样,不知道是什么原因,也跟踪源码了还是不懂,请求老师抽空解释!!!

写回答

1回答

没什么大不了的

提问者

2017-06-06

好吧,webmagic实现的xpath和scrapy实现的xpath有点差别,//前面加.就行了,代表当前,无语,都已经进入当前了就应该不用加的!!

0
2
没什么大不了的
回复
bobby
解决了,谢谢回复
2017-06-08
共2条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5796 学习 · 6290 问题

查看课程