c 抓取网页数据( 如何使用网页*敏*感*词*获取想要的数据?解决办法)

优采云 发布时间: 2022-03-20 19:21

  c 抓取网页数据(

如何使用网页*敏*感*词*获取想要的数据?解决办法)

  使用网络*敏*感*词*命令获取​​数据

  在网页抓取数据时,如果有些图表数据无法抓取,元素变化频繁,或者网页有广告影响操作,可以考虑使用网页监控来获取想要的数据。

  脚步

  ① 打开要采集数据的网页,在网页上按F12打开开发者模式。

  ② 按 Ctrl + R 重新加载网页。

  ③ 等待所需数据加载完毕,激活网络选项卡上的搜索框,输入所需数据,然后按 Enter。

  

  ④ 如图

  

  如果找不到目标数据,尝试其他可能的数据搜索,减少关键词的数量,或者依次在请求列表中搜索数据。

  ⑤ 开始监控数据,获取网页对象-开始监控请求-跳转到新的URL(重新加载)-延迟执行(等待加载完成)-获取网页监控结果(获取第一步获取的URL的监控结果) - 停止*敏*感*词*网页请求。

  可能数据很多,建议不要打印,先写入文本文件

  

  

  ⑥打开写入的文件,按Crtl+F查看是否找到想要的数据。

  ⑦使用命令获取网页请求的结果是一个收录目标url数据的字典。响应中的数据收录在循环项字典的键 ["body"] 中。body 是一个字符串,它被转换成一个 json 对象。可以提取数据。

  为了方便观察结构,可以先把body的数据拿出来粘贴,会自动转换成便于观察的格式。

  

  粘贴到格式化工具后,在列表goodsDetailList中找到想要的数据:

  

  

  所以按照下面的逻辑取对应的数据:

  

  流程执行结果:

  

  问题没有解决?去社区提问 保留所有权利,由 Gitbook 提供支持

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线