c 抓取网页数据( 如何使用网页*敏*感*词*获取想要的数据?解决办法)
优采云 发布时间: 2022-03-20 19:21c 抓取网页数据(
如何使用网页*敏*感*词*获取想要的数据?解决办法)
使用网络*敏*感*词*命令获取数据
在网页抓取数据时,如果有些图表数据无法抓取,元素变化频繁,或者网页有广告影响操作,可以考虑使用网页监控来获取想要的数据。
脚步
① 打开要采集数据的网页,在网页上按F12打开开发者模式。
② 按 Ctrl + R 重新加载网页。
③ 等待所需数据加载完毕,激活网络选项卡上的搜索框,输入所需数据,然后按 Enter。
④ 如图
如果找不到目标数据,尝试其他可能的数据搜索,减少关键词的数量,或者依次在请求列表中搜索数据。
⑤ 开始监控数据,获取网页对象-开始监控请求-跳转到新的URL(重新加载)-延迟执行(等待加载完成)-获取网页监控结果(获取第一步获取的URL的监控结果) - 停止*敏*感*词*网页请求。
可能数据很多,建议不要打印,先写入文本文件
⑥打开写入的文件,按Crtl+F查看是否找到想要的数据。
⑦使用命令获取网页请求的结果是一个收录目标url数据的字典。响应中的数据收录在循环项字典的键 ["body"] 中。body 是一个字符串,它被转换成一个 json 对象。可以提取数据。
为了方便观察结构,可以先把body的数据拿出来粘贴,会自动转换成便于观察的格式。
粘贴到格式化工具后,在列表goodsDetailList中找到想要的数据:
所以按照下面的逻辑取对应的数据:
流程执行结果:
问题没有解决?去社区提问 保留所有权利,由 Gitbook 提供支持