老师您好,我遍历SelectorList的时候如果使用xpath总会提取到当前页的第一条新闻,即使对SelectorList切片之后。这是怎么回事呢?
来源:4-12 提取详情页信息
UptownFk
2020-03-17
写回答
4回答
-
慕勒5311868
2022-01-25
原因是,加点代表取当前元素为根节点向下查找元素,而不加点是以整个页面为根元素向下查找的。因为你没有加点,所以总是从根节点找第一个,而不是你所需要的从编写好的selectorlist里找第一个
00 -
慕勒5311868
2022-01-25
老哥,找到解决方法了,应该这样
image_url=post_node.xpath('.//div[@class="entry_summary"]/a/img/@src').extract_first("") post_url=post_node.xpath('.//h2[@class="news_entry"]/a/@href').extract_first("")
012022-01-25 -
慕勒5311868
2022-01-25
老哥,怎么解决的?代码看看
00 -
bobby
2020-03-18
你可以尝试一下css选择器看看是否仍然有这个问题
072022-01-26
相似问题