puppeteer抓取豆瓣网页信息的时候
来源:6-3 child_process fork 子进程来运行爬虫脚本

DyzziMon
2018-02-12
puppeteer抓取豆瓣网页信息的时候,用await page.click('.more'),模拟了点击更多这个按钮,这时候如何判断分页加载完毕?以及如何判断所有的接口都返回完毕?
写回答
3回答
-
waitForSelector 如果不够用,比如有的 selector 没有特殊的特征,可以等待 3 秒钟或者 5 秒钟,这是一个经验值,可以设大设小的,也可以脚本中第一次爬,存一个变量记录页面上目标元素的数量,每次点击且等待后,看元素数量是否增加,如果没有,继续等待,如果增加了,直接去获取拿来用就好了
012018-02-13 -
DyzziMon
提问者
2018-02-13
另外发现慕课网评论添加表情会报错,难道数据库不支持emoji?
00 -
lcxry
2018-02-12
waitForSelector
00
相似问题