关于去重
来源:9-7 scrapy url去重原理
慕标1049315
2021-04-01
老师,url作为字符串添加到集合不就可以实现去重了吗?先转换成哈希值是内存性能上更优吗?
写回答
1回答
-
课程中这点说的挺明确的啊,url可长可短,我见过有些url长度能达到500+的, 这样对内存占用较多,变成hash值可以让长度控制一定范围以内还不会重复
012021-04-07
相似问题
关于去重
来源:9-7 scrapy url去重原理
慕标1049315
2021-04-01
老师,url作为字符串添加到集合不就可以实现去重了吗?先转换成哈希值是内存性能上更优吗?
1回答
课程中这点说的挺明确的啊,url可长可短,我见过有些url长度能达到500+的, 这样对内存占用较多,变成hash值可以让长度控制一定范围以内还不会重复
相似问题