操作方法:一种Android应用数据手动采集方法及系统技术方案

优采云 发布时间: 2020-08-28 21:32

  一种Android应用数据手动采集方法及系统技术方案

  本发明专利技术公开了一种Android应用数据手动采集方法及系统,方法包括:在安装并启动Android应用后,获取当前Activity树形*敏*感*词*,通过特定属性辨识出可操作控件,利用已封装好的操作动作匹配相应操作控件,深度遍历所有Activity并获取数据,对数据进行清洗并入库,卸载Android应用。本发明专利技术才能基于Appium开源框架,以深度遍历算法为核心,实现对Android应用中特定数据的手动采集。

  An automatic data 采集 method and system for Android Applications

  全部详尽技术资料下载

  【技术实现步骤摘要】

  一种Android应用数据手动采集方法及系统

  本专利技术涉及数据处理

  ,尤其涉及一种Android应用数据手动采集方法及系统。

  技术介绍

  随着联通互联网的迅猛发展,各类应用如雨后春笋般涌现下来,人们对智能手机依赖度远超过PC笔记本。Android系统作为当前用户增速最快的智能手机操作系统,其平台具备多样性、可塑造性等特质,被运用到多个领域范畴,也就成为人们研究的重点。于是移动端APP数据内容采集这方面的需求也越来越多,而APP数据采集却是一个难点。纵观整个行业,目前还没有成熟的APP数据抓取方案和具体实现。通过现有技术的督查,APP数据获取主要考虑两种方向,一种是主动爬取,另一种是被动接受。现有的主动爬取APP数据的方案采取查获数据传输包的方式进行,通过webservice通讯协议,抓取公开数据、无加密的数据。但这些方法存在一定的问题,如果遇到的是用SSL/TLS等加密手段加密过的网路数据的时侯,这就促使采集数据显得异常艰辛。被动接受APP数据的方案首先须要考虑数据储存服务器,然后是数据接收方案,针对不同的用户,需求不一样,那么须要接收什么数据,如何发送数据,以及APP所有者是否乐意提供这种数据,这些都是比较无法解决的问题。因此,如何有效的实现Android应用数据的手动采集,是一项亟需解决的问题。

  技术实现思路

  有鉴于此,本专利技术提供了一种Android应用数据手动采集方法,能够基于Appium开源框架,以深度遍历算法为核心,实现对Android应用中特定数据的手动采集。本专利技术提供了一种Android应用数据手动采集方法,包括:在安装并启动Android应用后,获取当前Activity树形*敏*感*词*;通过特定属性辨识出可操作控件;利用已封装好的操作动作匹配相应操作控件;深度遍历所有Activity并获取数据;对所述数据进行清洗并入库;卸载所述Android应用。一种Android应用数据手动采集系统,包括:获取模块,用于在安装并启动Android应用后,获取当前Activity树形*敏*感*词*;识别模块,用于通过特定属性辨识出可操作控件;匹配模块,用于借助已封装好的操作动作匹配相应操作控件;深度遍历模块,用于深度遍历所有Activity并获取数据;数据处理模块,用于对所述数据进行清洗并入库;卸载模块,用于卸载所述Android应用。综上所述,本专利技术公开了一种Android应用数据手动采集方法,当须要对Android应用数据进行手动采集时,首先在安装并启动Android应用后,获取当前Activity树形*敏*感*词*,然后通过特定属性辨识出可操作控件,利用已封装好的操作动作匹配相应操作控件,深度遍历所有Activity并获取数据,对数据进行清洗并入库,最后卸载Android应用。本专利技术整个过程只须要用户在数据采集前对配置文件做相应更改,后续方式执行中会通过Appium操作控件,结合深度遍历算法采集所需的Android应用对应数据;用户无需关注脚本编撰、抓包剖析等

  技术实现思路

  ,实现了零脚本Android应用数据采集,大大增加了Android应用数据采集技术门槛。附图说明结合附图并参考以下具体施行方法,本专利技术各施行例的上述和其他特点、优点及方面将显得愈发显著。贯穿附图中,相同或相像的附图标记表示相同或相像的元素。应当理解附图是示意性的,原件和元素不一定根据比列勾画。图1为本专利技术公开的一种Android应用数据手动采集方法施行例1的方式流程图;图2为本专利技术公开的一种Android应用数据手动采集方法施行例2的方式流程图;图3为本专利技术公开的一种Android应用数据手动采集系统施行例1的结构*敏*感*词*;图4为本专利技术公开的一种Android应用数据手动采集系统施行例2的结构*敏*感*词*。具体施行方法下边将参照附图更详尽地描述本专利技术的施行例。虽然附图中显示了本专利技术的个别施行例,然而应该理解的是,本专利技术可以通过各类方式来实现,而且不应当被解释为限于这儿论述的施行例,相反提供这种施行例是为了愈发透彻和完整地理解本专利技术。应当理解的是,本专利技术的附图及施行例仅用于示例性作用,并非用于限制本专利技术的保护范围。本文使用的术语“包括”及其变型是开放性包括,即“包括但不限于”。

  术语“基于”是“至少部分地基于”。术语“一个施行例”表示“至少一个施行例”;术语“另一施行例”表示“至少一个另外的施行例”;术语“一些施行例”表示“至少一些施行例”。其他术语的相关定义将在下文描述中给出。需要注意,本专利技术中提到的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行分辨,并非用于限定这种装置、模块或单元所执行的功能的次序或则相互依存关系。需要注意,本专利技术中提到的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应该理解,除非在上下文另有明晰强调,否则应当理解为“一个或多个”。如图1所示,为本专利技术公开的一种Android应用数据手动采集方法施行例1的方式流程图,所述方式可以包括以下步骤:S101、在安装并启动Android应用后,获取当前Activity树形*敏*感*词*;当须要对Android应用数据进行手动采集时,将Android应用上传至指定目录,修改配置文件内容,供遍历测试执行时读取使用,然后启动Android应用。在安装并启动Android应用后,获取当前Activity树形*敏*感*词*;其中,Activity是Android组件之一,是一个应用程序组件,提供一个屏幕,用户可以拿来交互为了完成某项任务。

  S102、通过特定属性辨识出可操作控件;然后,调用Appium所开放的API获取当前页面布局文件,根据配置文件所定义的控件属性要求,解析过滤来辨识出匹配的控件并保存。其中,布局文件是指Android应用页面布局设计的一个xml文档。具体的,在辨识出可操作控件时,可以通过调用Appium中自带的getPageSource()方法,将获取的当前页面布局文件,同时根据配置文件所定义的控件属性要求进行解析筛选,以获得可操作的控件并保存其属性信息。本施行例支持爬取常用的所有控件的信息,包括text、resource-id、class、clickable、content-desc等各类数据,并且可通过指定某个Activity或控件类型或属性的方式将指定信息筛选下来。其中,getPageSource()是Appium内部的一个函数,它将当前页面的元素以XML的格式获取到。S103、利用已封装好的操作动作匹配相应操作控件;然后,根据控件特点判定控件操作方法,智能匹配对应操作。S104、深度遍历所有Activity并获取数据;然后,从Android应用启动Activity开始,自动解析和筛选控件,当控件成功匹配相应操作且执行后,如判定仍在当前Activity,则继续执行下一个控件,如果判定已跳转至新Activ

  【技术保护点】

  1.一种Android应用数据手动采集方法,其特点在于,包括:/n在安装并启动Android应用后,获取当前Activity树形*敏*感*词*;/n通过特定属性辨识出可操作控件;/n借助已封装好的操作动作匹配相应操作控件;/n深度遍历所有Activity并获取数据;/n对所述数据进行清洗并入库;/n卸载所述Android应用。/n

  【技术特点摘要】

  1.一种Android应用数据手动采集方法,其特点在于,包括:

  在安装并启动Android应用后,获取当前Activity树形*敏*感*词*;

  通过特定属性辨识出可操作控件;

  利用已封装好的操作动作匹配相应操作控件;

  深度遍历所有Activity并获取数据;

  对所述数据进行清洗并入库;

  卸载所述Android应用。

  2.根据权力要求1所述的方式,其特点在于,所述通过特定属性辨识出可操作控件前,还包括:

  在配置文件中添加黑名单属性。

  3.根据权力要求1所述的方式,其特点在于,所述借助已封装好的操作动作匹配相应操作控件,包括:

  根据控件特点判定控件操作方法,智能匹配对应操作。

  4.根据权力要求1所述的方式,其特点在于,所述深度遍历所有Activity并获取数据,包括:

  对当前Activity进行判定,如判定仍在原Activity,则继续执行下一个控件,如果判定已跳转至新Activity,则旧Activity遍历操作暂停,新Activity控件执行遍历操作,当新Activity控件遍历操作完毕后立刻返回旧Activity继续遍历操作,其中,在执行遍历操作的过程中保存Activity名和遍历执行步骤。

  5.根据权力要求1所述的方式,其特点在于,所述对所述数据进行清洗并入库,包括:

  根据预先所定义的配置文件内容,对须要搜集数据进行清洗,清洗完毕后入库保存。

  6.一种Android应用数据手动采集系统,其特点在于,包...

  【专利技术属性】

  技术研制人员:程立,赖林,邓浩然,鲁爽,

  申请(专利权)人:中国民航信息网络股份*敏*感*词*,

  类型:发明

  国别省市:北京;11

  全部详尽技术资料下载 我是这个专利的主人

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线