优采云采集器一款简单易用、功能强大的数据采集工具
优采云 发布时间: 2021-03-29 04:11优采云采集器一款简单易用、功能强大的数据采集工具
优采云 采集器一个易于使用的强大数据采集工具。无需学习编程,单击界面,自动生成采集脚本,就可以采集 99%的互联网网站。
功能介绍
向导模式
易于使用,只需单击鼠标即可轻松自动生成
脚本定期运行
它可以按计划运行,而无需人工
原创高速内核
自主开发的浏览器内核速度很快,远远超过了对手
智能识别
智能识别网页中的列表和表单结构(多选框下拉列表等)
广告屏蔽
自定义广告阻止模块,与AdblockPlus语法兼容,可以添加自定义规则
多个数据导出
支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等。
常见问题
问:如何过滤列表中的前N个数据?
1.有时我们需要将列表过滤到采集,例如过滤出第一组数据(在采集表中,过滤出表的列名)
2.在列表模式菜单中单击以设置列表xpath
问:如何捕获cookie以获取cookie并进行手动设置?
1.首先,使用Google Chrome打开采集的网站,然后登录。
2.然后按F12键,将出现开发人员工具,选择“网络”
3.然后按F5刷新下一页并选择一个请求。
4.复制完成后,在优采云 采集器中编辑任务,转到第三步,指定HTTP标头。
如何自动分析抓取数据?
输入采集网址
打开软件,创建一个新任务,然后输入需要采集的网站地址。
智能分析,在整个过程中自动提取数据
进入第二步后,优采云 采集器自动对网页进行智能分析,并从中提取列表数据。
将数据导出到表,数据库,网站等
运行任务,将数据从采集导出到Csv,Excel和各种数据库,并支持api导出。
更新日志
3. 0. 1. 9
2020/11/13
添加正在运行的任务以解决某些网站无法登录的问题
修改系统设置缩放的兼容性
优化任务搜索
修复URL生成中的错误
解决数据预览问题
优化的列表识别和分页识别
修复了网站加载缓慢且无法采集数据发布的问题