scrapy shell 设置user-agent后 仍然提示302
来源:4-12 提取详情页信息
qq_慕神6513837
2022-01-26
scrapy shell -s USER_AGENT=‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36’ https://news.cnblogs.com/n/711760/
仍然302
Redirecting (302) to <GET https://account.cnblogs.com:443/signin?ReturnUrl=https%3A%2F%2Fnews.cnblogs.com%2Fn%2F711760%2F> from <GET https://news.cnblogs.com/n/711760/>
写回答
1回答
-
bobby
2022-01-27
目前cnblogs变了规律了,所以详情页都需要登录才能访问了,所以如果你为了调试方便,需要自己登录一下cnblogs然后从浏览器中拿到cookie,然后将cookie放在scrapy shell中去拿到数据,还有另一个选择就是使用pythonJupyter Notebook, 也可以写python代码进行装代码逐个调试
,
022022-02-06
相似问题