page_source 打印出来仍然是网页源码
来源:9-1 selenium动态网页请求与模拟登录知乎
Macrowz
2018-03-06
老师,我按照8-1章节的selenium的print(browser.page_source)打印出加载后的html页面,但是为什么print出来的仍然是和网页源码一样的html?
直接用selenium的browser.find_element_by_css_selector()函数,是可以定位到元素。
但是用Selector(text=browser.page_source)以后,无法定位元素,因为下载的不是渲染以后的html,下载的仍然是网页源码。
写回答
3回答
-
# !/usr/bin/env python # encoding: utf-8 from selenium import webdriver chrome_opt = webdriver.ChromeOptions() prefs = {"profile.managed_default_content_settings.images":2} chrome_opt.add_experimental_option("prefs", prefs) browser = webdriver.Chrome(executable_path="E:/tmp/chromedriver.exe", chrome_options=chrome_opt) browser.get("https://www.renrendai.com/loan/1") import time time.sleep(10) html = browser.find_element_by_tag_name('html').get_attribute('innerHTML') print(html)我这里本地运行了这个url是没有问题的啊
012018-03-12 -
bobby
2018-03-08
你先在请求以后 sleep 几秒再获取源码试试呢
012018-03-08 -
qq_小青年_18
2018-03-07
我这边使用之后打印出来的是网络请求之后完整数据
012018-03-07
相似问题