网易云音乐热门作品名字和链接抓取(html5lib篇)

优采云 发布时间: 2022-06-01 13:20

  网易云音乐热门作品名字和链接抓取(html5lib篇)

  点击上方“Python共享之家”,进行关注

  回复“资源”即可获赠Python学习资料

  今

  日

  鸡

  汤

  落叶人何在,寒云路几层。

  大家好,我是皮皮。

  一、前言

  前几天在Python白银交流群有个叫【O|】的粉丝问了一道关于网易云音乐热门作品名字和链接抓取的问题,获取源码之后,发现使用xpath匹配拿不到东西,从响应来看,确实是可以看得到源码的。

  

  之前的文章,已经使用了正则表达式和xpath、bs4和pyquery四个方法进行了相关实现,,,,,这篇文章我们使用html5lib来实现。

  二、实现过程

  这里【甯同学】给了一个使用html5lib方法来实现的代码,简单来说就是用html5lib修复html就可以了,代码如下。 <p># coding:utf-8<br /><br /># @Time : 2022/5/10 10:46<br /># @Author: 皮皮<br /># @公众号: Python共享之家<br /># @website : http://pdcfighting.com/<br /># @File : 网易云音乐热门作品名字和链接(html5lib).py<br /># @Software: PyCharm<br /><br />#<br />#                             _ooOoo_<br />#                            o8888888o<br />#                            88" . "88<br />#                            (| -_- |)<br />#                            O\  =  /O<br />#                         ____/`---'\____<br />#                       .'  \\|     |//  `.<br />#                      /  \\|||  :  |||//  \<br />#                     /  _||||| -:- |||||-  \<br />#                     |   | \\\  -  /// |   |<br />#                     | \_|  ''\---/''  |   |<br />#                     \  .-\__  `-`  ___/-. /<br />#                   ___`. .'  /--.--\  `. . __<br />#                ."" '

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线