请问老师,用itemloader add_css的时候,这段css偶尔取不到值怎么处理?
来源:6-15 item loder方式提取question - 2
天真男
2017-07-10
不是每个网页都存在,比如有些网页没有tags,我还用tags的class去统一取得时候,就会出现一个空列表[],之后再itemloader.load_item()的时候就会报错。class 'KeyError'。怎么办?我试图在input_processor中,给一个自定义的方法,如果value为空,就给它一个"",还是会报错。这种情况在爬取网页中很频繁,因为有些网页就是缺少一些字段,而大部分网页又存在,能否通过一个middleware还是其他什么扩展的方法统一处理呢??请老师给一些代码参考。谢谢
写回答
2回答
-
你是因为在什么地方取值 直接取比如 item["value"]了吧 你可以在这个地方取值之前先加一个判断 if “value”in item
00 -
冽凌风
2017-07-23
同学你解决了吗?我也遇到相同问题了,老师的回答不是很懂。能贴个参考代码吗?
012017-07-23
相似问题
老师,请问代理池怎么优化
回答 2
只爬取,不处理
回答 3