拉勾网只能爬取到 url url_object_id crawl_time 三个字段的值
来源:7-7 职位数据入库-1
水镜云墨
2020-09-10
如图,爬取时得到了 200 的状态码,
但是 debug 时显示 title salary 都是空 list
最终 itemloader 里只有 url url_object_id crawl_time 三个值。我的css是直接复制了git代码的。请问老师这个该怎么解决呢?
写回答
1回答
-
拉勾网反爬了 你先看看本章最后一个小节 解决被反爬的问题
212020-09-12
相似问题