Filtered offsite request to
来源:1-1 python分布式爬虫打造搜索引擎简介
mdarker
2021-05-15
DEBUG: Filtered offsite request to ‘account.cnblogs.com’: <GET https://account.cnblogs.com:443/NewsAjax/GetAjaxNewsInfo?contentId=443>
老师
爬取博客园解析域名出错了 account.cnbolgs.com是登录页面吧 不知道为什么
name = "jobbole"
allowed_domains = ['news.cnblogs.com']
start_urls = ['https://news.cnblogs.com/']
源码写的跟您一样的
写回答
3回答
-
mdarker
提问者
2021-05-18
老师 您看一下
012021-05-19 -
bobby
2021-05-17
你把完整的错误栈代码截图我看看
012021-05-18 -
mdarker
提问者
2021-05-16
老师 求回复
00
相似问题