老师,现在的淘宝他的查看源代码和f12看到的代码不一样。而且之前用的方法也没用了,怎么办??

来源:3-3 python 操作excel(1)

慕容8195172

2018-11-02


http://img.mukewang.com/szimg/5bdbee060001e92a10000750.jpg

http://img.mukewang.com/szimg/5bdbee1d000190bb10000750.jpg
这个列表在f12里查不到哇

写回答

2回答

NavCat

2018-11-02

这块就是呀,你仔细看看,可以通过xpath或者是python的正则表达式,解析出来,然后转换成python对象。

//img.mukewang.com/szimg/5bdbf594000126ca13110572.jpg



0
3
慕容8195172
回复
Samuel10
还是用bejson那个看的。个人是这么看的哈。你最好问问老师找最好的办法
2018-11-05
共3条回复

NavCat

2018-11-05

双11淘宝进行了较大的更新,使用正则实现淘宝数据抓取代码参考:

1.浏览器登录淘宝

2.按下图找到cookie

//img.mukewang.com/szimg/5be44ed90001cf4315910885.jpg

3.配置请求头信息

import requests
import re
import json
 
def spider_tb(sn ,book_list=[]):
    url = 'https://s.taobao.com/search?q={0}'.format(sn)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
        'cookie': '你的cookie'
    }
    # 获取html内容
    text = requests.get(url, headers=headers).text
 
    # 使用正则表达式找到json对象
    p = re.compile(r'g_page_config = (\{.+\});\s*', re.M)
    rest = p.search(text)
    if rest:
        print(rest.group(1))
        data = json.loads(rest.group(1))
        bk_list = data['mods']['itemlist']['data']['auctions']
 
        print (len (bk_list))
        for bk in bk_list:
            #标题
            title = bk["raw_title"]
            print(title)
            #价格
            price = bk["view_price"]
            print(price)
            #购买链接
            link = bk["detail_url"]
            print(link)
            #商家
            store = bk["nick"]
            print(store)
            book_list.append({ 'title' : title, 'price' : price, 'link' : link, 'store' : store })
            print ('{title}:{price}:{link}:{store}'.format( title = title, price = price, link = link, store = store )) 
 
 
 
if __name__ == '__main__':
    spider_tb('9787115428028')

4.查看结果

//img.mukewang.com/szimg/5be44f020001bc8818880924.jpg

3
3
qq_慕先生353548
老师,现在淘宝又改进了,这个代码也用不了,如今应该怎么爬呢
2019-08-05
共3条回复

手把手教你把Python应用到实际开发 不再空谈语法

学会项目开发思路,掌握Python高阶用法。

1341 学习 · 244 问题

查看课程