在遍历元素时xpath和css选择器为什么结果不一样

首页课程实战体系课手记专栏慕课教程

在遍历元素时xpath和css选择器为什么结果不一样

来源：4-9 编写spider完成抓取过程 - 1

慕雪9382207

2020-05-27

代码如下:

post_nodes = response.xpath('//div[@id="news_list"]/div[@class="news_block"]')
# post_nodes = response.css('#news_list .news_block')

for post_node in post_nodes:
   # print(post_node)
   image_url = post_node.xpath('//div[@class="entry_summary"]/a/img/@src').extract()
   image_url = post_node.css('.entry_summary a img::attr(src)').extract()

用path结果如下:
图片描述
用css结果如下:

问题:
从结果分析是css正确的应该是每次遍历只能获取一个值
但是为什么用xpath却获取了所有的值,这明显是不对的

写回答

1回答

bobby

bobby

2020-05-28

xpath尝试一下将双斜线改为单斜线或者去掉双斜线试试

0

4

bobby

回复

陳根生

好的，看到了之前版本没有这个问题最近的版本有这个问题了需要加点

2020-07-22

共4条回复

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

5831 学习 · 6293 问题

相似问题

老师您好，我遍历SelectorList的时候如果使用xpath总会提取到当前页的第一条新闻，即使对SelectorList切片之后。这是怎么回事呢？

回答 4

item_loader.add_css，css选择器一样，但是索引不一样，在item_loader需要怎么处理

回答 1

item_selecter的数据都是第一条的，怎么都跑不出下一条数据？

回答 1

点击密码登录显示找不到节点

回答 4

xpath跟CSS选择器那种好

回答 1

打开慕课网App查看更多内容