优采云采集器是什么?如何使用浏览器可视化方式?
优采云 发布时间: 2021-06-17 00:19优采云采集器是什么?如何使用浏览器可视化方式?
详细介绍
优采云采集器是一个专业的网络信息采集工具。该工具界面简洁,操作简单,功能强大。有了它,我们就可以采集去所有需要信息的网页了。
软件功能:
零门槛
如果你不懂网络爬虫技术,如果你会上网,你会采集网站数据
多引擎,高速稳定
内置高速浏览器引擎,还可以切换到HTTP引擎模式运行,采集data更高效。还内置了JSON引擎,无需分析JSON数据结构,直观选择JSON内容。
适用于各种网站
采集 Internet 99% 网站,包括单页应用Ajax加载和其他动态类型网站。
软件亮点:
软件操作简单,鼠标点击即可轻松选择要采集的内容;
支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化的火狐浏览器,加上独创的内存优化,让浏览器采集也能高速运行,甚至可以很快转换为HTTP方式运行,享受更高的采集速度!抓取JSON数据时,也可以使用浏览器可视化的方式,用鼠标点击要抓取的内容。无需分析JSON数据结构,让非网页专业设计人员轻松抓取所需数据;
不需要分析网页请求和源码,但支持更多的网页采集;
先进的智能算法可以一键生成目标元素XPATH,自动识别网页列表,自动识别分页中的下一页按钮...
支持丰富的数据导出方式,可以通过向导导出为txt文件、html文件、csv文件、excel文件,也可以导出到现有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库等。以简单的方式轻松映射字段,并且可以轻松导出到目标网站数据库。
软件优势:
可视化向导
所有采集元素自动生成采集数据
预定任务
运行时间灵活定义,全自动运行
多引擎支持
支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎
智能识别
可以自动识别网页列表、采集字段和分页等
拦截请求
自定义屏蔽域名,方便过滤异地广告,提高采集速度
多数据导出
可导出为 Txt、Excel、MySQL、SQLServer、SQlite、Access、网站 等
更新日志:
修复简单模式下关键词修改和登录前相关问题
简单的采集window自适应大小
一些其他已知问题的改进