网页qq抓取什么原理( 拼接的Url找到多个urlURL解析看的应该准确)
优采云 发布时间: 2021-12-24 18:00网页qq抓取什么原理(
拼接的Url找到多个urlURL解析看的应该准确)
爬取网页版QQ音乐
首先进入音乐播放页面,找到音乐的最终url版本
根据这个网址进入播放页面
这个网站怎么找
我们复制它关键词搜索它
我们只需要访问这个网页的数据就可以得到音乐的url
看到网址有点瞎
URL解析应该更准确
我们需要得到这个值才能批量下载
进入歌曲排名页面搜索关键词
{"req":{"module":"CDN.SrfCdnDispatchServer","method":"GetCdnDispatch","param":{"guid":"1282808556","calltype":0,"userip": ""}},"Req_0":{"module":"vkey.GetVkeyServer","method":"CgiGetVkey","param":{"guid":"1282808556","songmid":["0000Z0093Ko5Ps"] ,"Songtype":[0],"uin":"641043558","loginflag":1,"platform":"20"}},"comm":{"uin":641043558,"format":"json ","Ct":24,"cv":0}}
通过访问这个网站
获取拼接的Url
找多个网址对比,发现songmid一直在变,
把这个关键词带到之前的网页搜索
得到一个这个网站,这个网站访问会得到一段json字符串,分析一下,得到singmid
可以获取初始网址
我们直接访问该网站,无需编写代码即可获取数据。很简单。