excel自动抓取网页数据(中国具有影响力的RPA垂直交流社区,社区汇聚了RPA领域的各类从业人员)

优采云 发布时间: 2022-01-14 18:04

  excel自动抓取网页数据(中国具有影响力的RPA垂直交流社区,社区汇聚了RPA领域的各类从业人员)

  RPA首页(RPA首页|RPA|RPA新闻|RPA案例|RPA应用|RPA咨询|RPA培训|RPA认证|RPA教程)是国内颇具影响力的RPA垂直传播社区,汇集了各类RPA领域。从业者。其中包括RPA开发工程师、售前工程师、业务分析师、架构师、运维工程师、项目管理、项目负责人、企业高管、HR等角色。社区提供各种丰富的教程、资料、文章、问答、招聘、活动、项目等,供大家交流,共同成长。

  UiPath是RPA的佼佼者,它的教程比较全,但是在使用过程中,由于它的教程基本都是从英文版翻译过来的,所以在国内用起来不是很方便。

  我已经优化了数据抓取教程。

  原创教程:使用数据抓取的示例(404 错误

  Uipath将数据采集功能作为组件嵌入,我们可以直接使用,无需分析代码,可以大大提高数据采集的效率。

  示例目标:从证监会获取指导备案的企业信息(以深圳证监局信息为例/pub/shenzhen/shzfdqyxx/),存入excel进行分析。

  注意:Uipath推荐使用Internet Explorer 11及以上,Mozilla Firefox 50或以上,或者谷歌浏览器最新版本运行web自动化,个人觉得Chrome就可以了

  1、如果您需要创建自动化项目,请将其命名为“Forensic Data”

  

  2、选择打开浏览器,浏览器类型选择Chrome(其他类型也支持),导航到证监会

  

  

  此时运行将打开 Chrome 并导航到相应的页面。

  2、在设计器的功能区选项卡的向导组中,单击数据抓取。将显示提取向导。

  

  注意:此时定位到需要爬取数据的网页

  3、根据向导的要求,在网页上选择备案公司的第一项和最后一项。随后将显示配置列向导步骤,并在网络浏览器中突出显示选定的字段,然后按照向导选择相应的数据,完成后将显示数据预览。

  重复此过程以选择申请日期。选择元素列时,可以选择是否提取URL。例如,在本例中,备案公司可以提取 URL,但可以省略备案日期。

  

  

  

  4、此时会显示是否需要从多个页面中提取数据。如果有多个页面,请选择是,然后在网页中选择下一页按钮。

  

  

  5、完成后,设计器会自动将数据捕获的组件添加到序列中。如下所示:

  

  6、特别提醒,设计者生成数据抓取组件后,系统已经自动生成了“数据表”变量ExtractDataTable,里面收录了我们后面需要用到的数据。

  

  7、现在在“变量”面板中,将自动生成的 ExtractDataTable 变量的范围从“数据抓取”更改为“强制”**。这允许您在其当前范围之外使用此变量(即“数据抓取”)。

  在 Data Fetch 序列下添加 Excel Application Scope 活动。

  

  8、将“Excel Application Scope”组件添加到序列中,并在“工作簿路径”字段中输入需要保存数据的excel文件的名称,如“csrc.xlsx”。这样,项目执行后,系统会在项目文件夹中创建一个该名称的文件,用于存放爬取得到的数据。或者,您可以指定计算机上已存在的文件。

  

  9、我们还将向 Excel 应用程序范围活动的执行序列添加一个写入范围活动,并在“属性”面板中执行以下操作:

  在数据表字段中,添加 ExtractDataTable 变量。

  

  

  原文链接:Uipath 数据采集教程

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线