用scrapy shell调试采集cnblog的详情页,报错

来源:4-12 提取详情页信息

王凯6397575

2022-05-06

http://img.mukewang.com/szimg/6274dd850897933e22720808.jpg

写回答

1回答

bobby

2022-05-09

上面出现了403 没有抓取到数据,需要登录, 可以先使用pycharm调试

0
2
bobby
回复
王凯6397575
是的,而且这里的url中明显带有登录login说明就是需要你登录
2022-05-11
共2条回复

Scrapy打造搜索引擎 畅销4年的Python分布式爬虫课

带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎

5795 学习 · 6290 问题

查看课程