爬虫抓取网页数据( 大佬的博客,和JS发送请求的路径和路径分析)

优采云发布时间: 2022-03-17 20:17

　　爬虫抓取网页数据(

大佬的博客,和JS发送请求的路径和路径分析)

　　爬虫爬取JS生成的数据

　　有很多页。当我们使用request发送请求时，返回的内容中没有页面显示数据。主要有两种情况。一种是通过Ajax异步发送请求，得到响应，将数据放入页面。对于这种情况，我们可以查看Ajax请求，然后分析Ajax请求路径和响应，得到想要的数据；另一种是JS动态加载的数据，然后放到页面中。在这两种情况下，供用户使用浏览器访问时，不会出现异常，快速获取完整页面。

　　其实我们之前学过一个selenium模块，通过操作浏览器，然后获取浏览器显示的数据，这个方法可以获取数据，不过本节是分析如何找到控制数据生成的JS ,以及JS发送请求的路径，所以我们可以向这个路径发送请求，直接获取数据。

　　在之前的爬取过程中，最让我恼火的是JS动态生成的数据。我找不到哪个 JS 实现了它（因为 JS 太多了）。今天看了大佬的博客，顿时觉得简单多了。，谢谢大佬，提供大佬的博客：

　　1.需求描述和页面分析

　　1、需求说明

　　基本页面路径：