浏览器抓取网页(来说一下如何获取浏览器相关的信息，获取元素的标题)

优采云发布时间: 2022-02-11 02:19

　　上一节讲了如何使用获取到的元素来获取元素信息。这次来说说如何获取浏览器相关信息，主要是页面的路径：URL和页面标题

　　一、如何获取页面相关信息

　　current_url : 当前页面的 URL 路径

　　title：当前页面的标题名称

　　名称：当前浏览器名称

　　page_source：当前html页面的源代码

　　前两个比较常用，可能会用到，比如url是用来判断页面跳转后的；页面标题也是检测的一个测试点。

　　接下来，我们将使用*敏*感*词*页面来演示这些常用方法

　　二、演示示例

　　from selenium import webdriver

driver = webdriver.Chrome()

driver.get("https://tieba.baidu.com/")

# 获取当前页面的URL

url_page = driver.current_url

# 获取当前页面的title

title_page = driver.title

# 获取当前浏览器的名称

name_browser = driver.name

# 获取当前页面的html源码

source_html = driver.page_source

print(url_page)

print(title_page)

print(name_browser)

print(source_html)

　　三、结果

　　/

　　*敏*感*词*——全球最大的华人社区

　　铬合金

0

2022-02-11

浏览器抓取网页

0 个评论

要回复文章请先登录或注册