使用 scrapy 框架,没有执行 def parse(self, response):里面的方法

来源:13-1 课程总结

两努

2020-02-21

图片描述
如图,我使用scrapy 框架,
目标网站是 www.iciba.com/python
def parse(self, response):前后我都有打印,并且会成功打印出来,
但是没有执行 def parse(self, response):里面的方法
是因为爬虫失败,所以才没有进入def parse(self, response):里面的方法吗?
老师能不能试一下这个网址,看看是网站的问题,还是我写代码有问题。

问题二:
在设置反爬请求头的时候,
我在 middlewares.py 文件添加函数
class RandomUserAgentMiddleware(object):
def process_request(self, request, spider):
request.headers.setdefault(“User-Agent”, UserAgent().random)

并且在 settings.py 文件中添加
DOWNLOADER_MIDDLEWARES = {
‘scrapy_test.middlewares.RandomUserAgentMiddleware’: 543,
}
会报错
图片描述

写回答

1回答

bobby

2020-02-22

  1. 你看看状态码 不是200, 是301 302 是不是让你要登录才能访问?

  2. 你配置的组件名字错了吧 这里提示找不到这个类

0
0

Python爬虫工程师实战 大数据时代必备

慕课网严选精品教程,高质量内容+服务!

2378 学习 · 1158 问题

查看课程