浏览器抓取网页(titleprint(2)#获取当前页面的title属性值错误)

优采云 发布时间: 2021-12-07 05:41

  浏览器抓取网页(titleprint(2)#获取当前页面的title属性值错误)

  本博客中学习的API如下:

  当前URL获取当前页面的URL

  page_uuSource获取当前页面的源代码

  标题获取当前页面的标题

  按顺序练习上述方法。效果如GIF所示:

  从selenium导入webdriver

  从时间上导入睡眠

  睡眠(2)

  driver=webdriver.Chrome()

  驱动程序。获取(“”)

  #移动浏览器查看显示

  驱动程序。设置窗口大小(宽度=500,高度=500,windowHandle=“当前”)

  驱动程序。设置窗口位置(x=1000,y=100,windowHandle='current')

  睡眠(2)

  #获取当前页面的标题并断言

  title=driver.title

  打印(“当前页面的标题为:”,标题“\n”)

  断言title==u“百度,你会知道”,“页面标题属性值错误!”

  睡眠(2)

  #获取当前页面的源代码并断言

  pageSource=driver.page\u源

  尝试:

  在pagesource中断言U“百度一次,你不知道”,在页面源代码中找不到“百度一次,你知道”关键字

  除:

  打印(“此处的源代码故意声明错误”,“\n”)

  睡眠(2)

  #获取当前页面的URL并断言

  currentPageUrl=驱动程序。当前\u url

  打印(“当前页面的URL为:”,currentpageurl)

  断言currentpageurl==“”,当前网址是意外的

  睡眠(2)

  driver.quit()

  以上是本文的全部内容,希望对您的学习有所帮助,也希望您能予以支持

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线