浏览器抓取网页(titleprint(2)#获取当前页面的title属性值错误)
优采云 发布时间: 2021-12-07 05:41浏览器抓取网页(titleprint(2)#获取当前页面的title属性值错误)
本博客中学习的API如下:
当前URL获取当前页面的URL
page_uuSource获取当前页面的源代码
标题获取当前页面的标题
按顺序练习上述方法。效果如GIF所示:
从selenium导入webdriver
从时间上导入睡眠
睡眠(2)
driver=webdriver.Chrome()
驱动程序。获取(“”)
#移动浏览器查看显示
驱动程序。设置窗口大小(宽度=500,高度=500,windowHandle=“当前”)
驱动程序。设置窗口位置(x=1000,y=100,windowHandle='current')
睡眠(2)
#获取当前页面的标题并断言
title=driver.title
打印(“当前页面的标题为:”,标题“\n”)
断言title==u“百度,你会知道”,“页面标题属性值错误!”
睡眠(2)
#获取当前页面的源代码并断言
pageSource=driver.page\u源
尝试:
在pagesource中断言U“百度一次,你不知道”,在页面源代码中找不到“百度一次,你知道”关键字
除:
打印(“此处的源代码故意声明错误”,“\n”)
睡眠(2)
#获取当前页面的URL并断言
currentPageUrl=驱动程序。当前\u url
打印(“当前页面的URL为:”,currentpageurl)
断言currentpageurl==“”,当前网址是意外的
睡眠(2)
driver.quit()
以上是本文的全部内容,希望对您的学习有所帮助,也希望您能予以支持