浏览器抓取网页(基于所述预页面截取方法的所述目标)
优采云 发布时间: 2022-04-04 12:06浏览器抓取网页(基于所述预页面截取方法的所述目标)
技术特点:
1.一种浏览器页面拦截方法,其特征在于,应用于服务器时,包括:获取浏览器客户端触发生成的拦截指令,控制浏览器客户端发送相应的拦截指令。对拦截指令的拦截参数;其中,拦截参数为浏览器客户端预先拦截页面的相关信息。根据截取参数访问预截页面,对预截页面进行截取操作,获取预截页面对应的目标截图后,将目标截图返回给浏览器客户端。2.根据权利要求1所述的截取浏览器页面的方法,其特征在于,在获取浏览器客户端触发生成的拦截指令之前,还包括: 浏览器客户端通过调用服务来调用服务。终端上的页面拦截服务api触发拦截指令的生成。3.根据权利要求1所述的浏览器页面拦截方法,其特征在于,所述根据所述拦截指令控制所述浏览器客户端发送相应的拦截参数包括: 根据所述拦截指令控制所述浏览器客户端发送预先设置的页面地址。截取页面和预截取页面中目标DOM节点的标识属性;其中,目标 DOM 节点是预截取页面对应的目标截图 中收录的 dom 节点。4.根据权利要求3所述的浏览器页面拦截方法,其特征在于,所述根据拦截参数访问预先拦截的页面包括: 在服务器上启动无头浏览器,使用无头浏览器访问预先拦截的页面。到预先截获的页面的页面地址。
5.根据权利要求4所述的浏览器页面拦截方法,其特征在于,所述无头浏览器根据预先拦截的页面的页面地址访问预先拦截的页面包括以下步骤:页面设置访问权限,控制浏览器客户端发送预截获页面对应的认证凭证,从而使用无头浏览器根据预截获页面地址的页面和访问凭证访问预截获页面- 捕获的页面。6.根据权利要求3所述的拦截浏览器页面的方法,其特征在于,在对预先拦截的页面进行拦截操作之前,该方法还包括:监控预截页面的所有数据接口判断预截页面的响应是否完成,如果是,判断预截页面中的所有dom节点是否渲染完成,如果是,开始步骤拦截预拦截页面。7.根据权利要求6所述的浏览器页面截取方法,其特征在于,对所述预先截取的页面进行截取操作,得到所述预先截取的页面对应的目标截图包括: 根据所述预先截取的页面截取页面中目标dom节点的标识属性,从所有dom节点中找到目标dom节点;获取目标dom节点的定位属性信息,并根据定位属性信息截取预先截取的页面中收录目标dom节点的区域,得到目标截图。8.根据权利要求1至7任一项所述的浏览器页面截取方法,其特征在于,所述将目标截图返回给浏览器客户端包括: 根据截取参数中的文件格式将目标截图封装成文件流对应的格式,并将文件流返回给浏览器客户端;其中,文件格式为根据拦截指令控制浏览 根据截取参数中的文件格式,将目标截图封装成相应格式的文件流,并将文件流返回给浏览器客户端;其中,文件格式为根据拦截指令控制浏览 根据截取参数中的文件格式,将目标截图封装成相应格式的文件流,并将文件流返回给浏览器客户端;其中,文件格式为根据拦截指令控制浏览
服务器客户端发送的参数。9.根据权利要求8所述的浏览器页面截取方法,其特征在于,根据截取参数中的文件格式将目标截图封装成对应格式的文件流后,还包括: 加水印操作根据预设要求对文件流进行处理,得到具有与预设要求对应的水印信息的文件流。10.一种浏览器页面拦截装置,其特征在于,应用于服务器时,包括: 获取模块,用于获取浏览器客户端触发生成的拦截指令,并根据以下内容控制拦截指令拦截指令。浏览器客户端发送相应的拦截参数;其中,拦截参数是与浏览器客户端的预拦截页面相关的信息。截取模块,用于根据截取参数访问预截取页面。对预截取页面进行截取操作,得到预截取页面对应的目标截屏,然后将目标截屏返回给浏览器客户端。
技术总结
本申请公开了一种浏览器页面拦截及装置,应用于服务器,包括:获取浏览器客户端触发生成的拦截指令,根据拦截指令控制浏览器客户端发送相应的拦截参数。拦截参数是与浏览器客户端的预拦截页面相关的信息;根据截取参数访问预截页面,对预截页面进行截取操作,得到对应的预截页面。目标截屏后,将目标截屏返回给浏览器客户端。获取拦截指令后,本应用服务器获取浏览器客户端对该截取指令的截取参数,根据截取参数统一访问预先截取的页面进行页面截取,同时将截图返回给浏览器客户端. ,从而解决各用户浏览器拦截功能不兼容的问题,拦截响应速度快,实现简单。拦截响应快速且易于实现。拦截响应快速且易于实现。从而解决各用户浏览器拦截功能不兼容的问题,拦截响应速度快,实现简单。拦截响应快速且易于实现。拦截响应快速且易于实现。从而解决各用户浏览器拦截功能不兼容的问题,拦截响应速度快,实现简单。拦截响应快速且易于实现。拦截响应快速且易于实现。
技术研发人员:王子龙
受保护的技术用户:
技术研发日:2021.12.21
技术发布日期:2022/3/25