抓取ajax动态网页java(李凯旋创建快速动态网页的技术分析索引页下Ajax)

优采云 发布时间: 2021-10-04 09:13

  抓取ajax动态网页java(李凯旋创建快速动态网页的技术分析索引页下Ajax)

  1043-蟒蛇群:李凯旋

  工具:先解释Ajax

  Ajax 是一种用于创建快速动态网页的技术。通过在后台与服务器交换少量数据,Ajax 可以使网页异步更新。就像打开一个网页,向下拖动鼠标,就添加了网页的一部分。在这个过程中,只加载了多余的部分内容,并没有重新加载整个页面内容。这样的技术是 Ajax 创造的快速动态。网络技术。

  例如:

  

  鼠标下拉时,本次显示的加载方式为Ajax异步加载。

  目标站点分析

  输入网址网址是/search/?keyword="街拍"

  我们的目标是抓取街景图集,返回图集的标题,并将每个图集的每个子图保存到项目根目录:

  索引页

  

  详情页面

  单击图库后,将出现详细信息页面。这是我们想要得到的图片之一

  

  分析index页面下的页面源码(按F12)

  首先动态加载肯定不在Doc目录下,所以应该在XHR(异步)下搜索

  

  根据观察和向下滚动网页,我们会发现有一个?offset 标签,一直在刷新,每次增加20。然后我们找到Preview找到响应的代码,包括data标签下的图片和标题。

  图中的标题是我们需要的图集的标题,url是我们需要的图集的链接。

  

  分析详情页源码(按F12)

  

  这组图片下有8张图片,每张图片的链接都收录gallery的变量字典。

  在下一节中,我们开始获取索引页并解析索引页。

  .

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线