遍历Selecterlist里使用xpath的问题
来源:4-14 items的定义和使用 - 1
lazymyth
2021-01-04
import scrapy
from urllib import parse
class CnblogsSpider(scrapy.Spider):
name = 'cnblogs'
allowed_domains = ['news.cnblogs.com']
start_urls = ['http://news.cnblogs.com/']
def parse(self, response):
post_nodes = response.xpath("//div[@class='news_block']")
for post_node in post_nodes:
image_url = post_node.xpath("//img[@class='topic_img']/@src").extract()
'''
这里用这个xpath语法会把这个列表的封面图都获取到,是为啥呢,不是应该只对遍历到的当前selecter生效吗?
烦请老师解答下^v^
'''
pass
写回答
1回答
-
这是xapath的语法,这种语法有点变化 你应该将image_url = post_node.xpath("//img[@class='topic_img']/@src").extract() 改成 image_url = post_node.xpath(".//img[@class='topic_img']/@src").extract() 最前面需要加一个点号
132022-01-25
相似问题