网易云音乐热门作品名字和链接抓取(html5lib篇)
优采云 发布时间: 2022-06-01 13:20网易云音乐热门作品名字和链接抓取(html5lib篇)
点击上方“Python共享之家”,进行关注
回复“资源”即可获赠Python学习资料
今
日
鸡
汤
落叶人何在,寒云路几层。
大家好,我是皮皮。
一、前言
前几天在Python白银交流群有个叫【O|】的粉丝问了一道关于网易云音乐热门作品名字和链接抓取的问题,获取源码之后,发现使用xpath匹配拿不到东西,从响应来看,确实是可以看得到源码的。
之前的文章,已经使用了正则表达式和xpath、bs4和pyquery四个方法进行了相关实现,,,,,这篇文章我们使用html5lib来实现。
二、实现过程
这里【甯同学】给了一个使用html5lib方法来实现的代码,简单来说就是用html5lib修复html就可以了,代码如下。 <p># coding:utf-8<br /><br /># @Time : 2022/5/10 10:46<br /># @Author: 皮皮<br /># @公众号: Python共享之家<br /># @website : http://pdcfighting.com/<br /># @File : 网易云音乐热门作品名字和链接(html5lib).py<br /># @Software: PyCharm<br /><br />#<br /># _ooOoo_<br /># o8888888o<br /># 88" . "88<br /># (| -_- |)<br /># O\ = /O<br /># ____/`---'\____<br /># .' \\| |// `.<br /># / \\||| : |||// \<br /># / _||||| -:- |||||- \<br /># | | \\\ - /// | |<br /># | \_| ''\---/'' | |<br /># \ .-\__ `-` ___/-. /<br /># ___`. .' /--.--\ `. . __<br /># ."" '