浏览器抓取网页(来说一下如何获取浏览器相关的信息,获取元素的标题)

优采云 发布时间: 2022-02-11 02:19

  浏览器抓取网页(来说一下如何获取浏览器相关的信息,获取元素的标题)

  上一节讲了如何使用获取到的元素来获取元素信息。这次来说说如何获取浏览器相关信息,主要是页面的路径:URL和页面标题

  一、如何获取页面相关信息

  current_url : 当前页面的 URL 路径

  title:当前页面的标题名称

  名称:当前浏览器名称

  page_source:当前html页面的源代码

  前两个比较常用,可能会用到,比如url是用来判断页面跳转后的;页面标题也是检测的一个测试点。

  接下来,我们将使用*敏*感*词*页面来演示这些常用方法

  二、演示示例

  from selenium import webdriver

driver = webdriver.Chrome()

driver.get("https://tieba.baidu.com/")

# 获取当前页面的URL

url_page = driver.current_url

# 获取当前页面的title

title_page = driver.title

# 获取当前浏览器的名称

name_browser = driver.name

# 获取当前页面的html源码

source_html = driver.page_source

print(url_page)

print(title_page)

print(name_browser)

print(source_html)

  三、结果

  /

  *敏*感*词*——全球最大的华人社区

  铬合金

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线