浏览器抓取网页(来说一下如何获取浏览器相关的信息,获取元素的标题)
优采云 发布时间: 2022-02-11 02:19浏览器抓取网页(来说一下如何获取浏览器相关的信息,获取元素的标题)
上一节讲了如何使用获取到的元素来获取元素信息。这次来说说如何获取浏览器相关信息,主要是页面的路径:URL和页面标题
一、如何获取页面相关信息
current_url : 当前页面的 URL 路径
title:当前页面的标题名称
名称:当前浏览器名称
page_source:当前html页面的源代码
前两个比较常用,可能会用到,比如url是用来判断页面跳转后的;页面标题也是检测的一个测试点。
接下来,我们将使用*敏*感*词*页面来演示这些常用方法
二、演示示例
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://tieba.baidu.com/")
# 获取当前页面的URL
url_page = driver.current_url
# 获取当前页面的title
title_page = driver.title
# 获取当前浏览器的名称
name_browser = driver.name
# 获取当前页面的html源码
source_html = driver.page_source
print(url_page)
print(title_page)
print(name_browser)
print(source_html)
三、结果
/
*敏*感*词*——全球最大的华人社区
铬合金