XPath是什么?XPath雨个人认为各有秋千怎么获取
优采云 发布时间: 2021-05-17 21:21XPath是什么?XPath雨个人认为各有秋千怎么获取
什么是XPath? XPath是xml路径语言。如果您不了解,也可以访问百度百科以普及科学。 SEO上的应用程序是数据采集等等,xpath有点像正则表达式,您可以使用自己的语言来提取所需的内容。至于两者之间的比较,专yu个人认为每个都有摇摆。这不是胡说吗?哈哈,让我们转到下面的主题以了解如何使用XPath。首先,让我们介绍如何获取XPath。
打开Google Chrome,右键单击审阅元素以进入下面的界面,右键单击html,然后会有一个XPath副本,如下图所示:
当然,手册也可以,这里将在图片中简要提到xpath的学习笔记,然后下面的图片就在上面,并结合示例,使用XPath快速获得文章的标题:
#encoding=utf-8
import requests
from lxml import etree
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
url='https://bigwayseo.com/'
a=requests.get(url).content
html=etree.HTML(a) #转换成xpath识别的对象
b=html.xpath('//*/header/h3/a/text()') #这个路径可以打开浏览器审查元素,然后对着html右键有一个copy xpath
#//*[@id="post-502"]/header/h3/a
for i in b:
print i
#xpath学习笔记
# //定位根节点
# /往下层找
# /text()提取文本内容
# /@xxxxx企图属性内容
# xpath特殊用法
# 1以相同的字符开头starts-with(@属性名称,属性字符相同部分)
# 2标签套标签string(.)