RPA网页爬虫之提取A股公司列表数据

优采云发布时间: 2022-07-09 20:33

　　RPA网页爬虫之提取A股公司列表数据

　　★

　　需求描述

　　在《》中，我们介绍了通过RPA实现一键提取某网页内的整个HTML Table的数据至变量或者Excel表格中，对于简单的HTML表数据，我们可以通过这种方式实现。

　　但是，很多时候，我们只需要提取部分数据，并且需要提取一些隐藏的数据，比如HTML中的链接，如果我们直接通过"Extract HTML Table"是不可以实现提取链接的。

　　那么有没有什么简单的方式来提取HTML页面中一些类似链接的隐藏信息。

　　需求描述

　　对于RPA提取网页数据，我们可以通过"Extract element value"来提取指定HTML元素的属性，包括但不限于链接。

　　需求实现

　　Launch mode: Launch new InstanceInitial URL: http://q.10jqka.com.cn/#refCountId=www_50a1b74a_693Variables produced: Invested

　　Web browser instance: %Invested%Extract data from: All availableStore data mode: Excel spreadsheetVariables produced: InvestedList

　　视频讲解与示例文件

　　★

0

2022-07-09

从网页抓取数据

0 个评论

要回复文章请先登录或注册