网页直播视频抓取工具下载(分析抓取二级页(2)代码编写方法代码技术解析)
优采云 发布时间: 2022-03-12 22:15网页直播视频抓取工具下载(分析抓取二级页(2)代码编写方法代码技术解析)
分析和抓取二级页面
这个二级页面,打开视图元素。
规则
如图,找到li里面的v-full和它下面的a标签。
附上代码
[微博视频] 第一局 LGD锤石迅猛开团EDG泰坦没能走掉被秒,雷克塞又一次被集火杀掉,LGD0换2拿下峡谷
编写getVideoList方法
附上代码
BeautifulSoup 技术分析
关于 BeautifulSoup4
BeautifulSoup4 和 lxml 一样,Beautiful Soup 也是一个 HTML/XML 解析器,其主要功能是如何解析和提取 HTML/XML 数据。
BeautifulSoup 支持 Python 标准库中的 HTML 解析器,也支持一些第三方解析器。如果我们不安装它,Python 将使用 Python 的默认解析器。 lxml 解析器更强大、更快。推荐使用 lxml 解析器。
Beautiful Soup 自动将输入文档转换为 Unicode 编码,将输出文档转换为 utf-8 编码。不需要考虑编码方式,除非文档没有指定编码方式,否则Beautiful Soup无法自动识别编码方式。然后,您只需要指定原创编码即可。