请教列表抽取问题
来源:17-1 课程总结
没什么大不了的
2017-06-06
抽取列表信息时,首先提取列表集合node_list,然后在循环里面初始化loader=(item=**,selector=node),其中node为node_list的循环变量,然后add_xpath时,添加的xpath确定是当前node里面的一个元素,add_xpath后就变成了列表所有元素的元素集合了,代码和webmagic一模一样,不知道是什么原因,也跟踪源码了还是不懂,请求老师抽空解释!!!
写回答
1回答
-
没什么大不了的
提问者
2017-06-06
好吧,webmagic实现的xpath和scrapy实现的xpath有点差别,//前面加.就行了,代表当前,无语,都已经进入当前了就应该不用加的!!
022017-06-08
相似问题
对于知乎爬虫逻辑的问题
回答 1
关于起始url及参数问题
回答 2