获取到 ul_list 的长度是30，但是循环 ul_list 打印出来的是空数组？

来源：2-9 爬取京东网的数据

野生前端菜鸟

2018-07-07

from lxml import html
import requests

def spider_jd(sn):
    url = 'https://search.jd.com/Search?keyword={0}'.format(sn)
    res = requests.get(url)

    res.encoding = 'utf-8'

    html_data = res.text

    selector = html.fromstring(html_data)



    # 找到书单的列表
    ul_list = selector.xpath('//div[@id="J_goodsList"]/ul/li')
    print(len(ul_list))

    for li in ul_list:
        # title
        title = selector.xpath('div/div[@class="p-name"]/a/@title')
        print(title)




if __name__ == '__main__':
    sn = 9787115428028
    spider_jd(sn)

结果是打印出来的 title 全是空数组

30
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]
[]

写回答

1回答

NavCat

2018-07-07

已采纳

注意你的第22行

 title = selector.xpath('div/div[@class="p-name"]/a/@title')

是从整个文档开始查找，记住，我们要“先抓大，再抓小”，找到了每一项，就要从每一项里面再去匹配。所以应该是从循环得到的li元素进行查找。代码如下：

title = li.xpath('div/div[@class="p-name"]/a/@title')

手把手教你把Python应用到实际开发不再空谈语法

学会项目开发思路，掌握Python高阶用法。

1341 学习 · 244 问题

查看课程

相似问题

老师好，这段代码爬的只是单个网页的全部数据吗？我看一个网页上有60条数据，但是只爬到了30条数据，这是为什么呢？

回答 2

ul_list返回空值

回答 3

老师，我爬取京东数据显示不出来，请帮我看看。谢谢

回答 1

调试模式里面的title可以获取到所有的值，但是程序执行的时候只获取下标为0的值，并且遍历了30遍

回答 3

京东的爬取不出来

回答 1

打开慕课网App查看更多内容