RPA网页爬虫之提取A股公司列表数据
优采云 发布时间: 2022-07-09 20:33RPA网页爬虫之提取A股公司列表数据
★
需求描述
在《》中,我们介绍了通过RPA实现一键提取某网页内的整个HTML Table的数据至变量或者Excel表格中,对于简单的HTML表数据,我们可以通过这种方式实现。
但是,很多时候,我们只需要提取部分数据,并且需要提取一些隐藏的数据,比如HTML中的链接,如果我们直接通过"Extract HTML Table"是不可以实现提取链接的。
那么有没有什么简单的方式来提取HTML页面中一些类似链接的隐藏信息。
需求描述
对于RPA提取网页数据,我们可以通过"Extract element value"来提取指定HTML元素的属性,包括但不限于链接。
需求实现
Launch mode: Launch new InstanceInitial URL: http://q.10jqka.com.cn/#refCountId=www_50a1b74a_693Variables produced: Invested
Web browser instance: %Invested%Extract data from: All availableStore data mode: Excel spreadsheetVariables produced: InvestedList
视频讲解与示例文件
★