免费获取:优采云采集器下载
优采云 发布时间: 2020-09-07 15:56优采云 采集器下载
优采云 采集器正式版是一个非常好的网络信息采集软件,优采云 采集器正式版支持Txt,Excel,MySQL,SQLServer等,可以生成Excel表,api数据库文件依此类推,它很容易使用。
软件功能
一键式数据提取
易于学习,通过可视界面,您可以通过单击鼠标来获取数据
快速高效
内置一组高速浏览器内核以及HTTP引擎模式,以实现快速的采集数据
适用于各种网站
能够访问采集 99%的Internet 网站,包括单页应用程序Ajax加载和其他动态类型网站
功能介绍
向导模式
易于使用,易于通过单击鼠标自动生成
脚本定期运行
它可以按计划定期运行,不需要手动工作
原创高速内核
自主开发的浏览器内核速度很快,远远超过了对手
智能识别
智能识别网页中的列表和表单结构(多选框下拉列表等)
广告屏蔽
自定义广告阻止模块,与AdblockPlus语法兼容,可以添加自定义规则
多个数据导出
优采云 采集器正式版支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等。
使用方法
第一步:输入采集网址
打开软件,创建一个新任务,然后输入需要采集的网站地址。
第2步:智能分析,在整个过程中自动提取数据
进入第二步后,优采云 采集器自动智能分析网页并从中提取列表数据。
第3步:将数据导出到表,数据库,网站等
运行任务,将数据从采集导出到Csv,Excel和各种数据库,并支持api导出。
常见问题
问:如何过滤列表中的前N个数据?
1.有时我们需要将列表过滤到采集,例如过滤掉第一组数据(以采集形式过滤掉表的列名)
2.在列表模式菜单中单击,设置列表xpath
问:如何捕获cookie以获取cookie并进行手动设置?
1.首先,使用Google Chrome打开采集的网站,然后登录。
2.然后按F12键,将出现开发人员工具,选择“网络”
3.然后按F5刷新下一页并选择一个请求。
4.复制完成后,在优采云 采集器中编辑任务,转到第三步,指定HTTP标头。
更新日志
1.添加插件功能
2.添加了导出txt(将一个文件另存为文件)
3.多值连接器支持换行符
4.修改数据处理的文本映射(支持搜索和替换)
5.修复登录时的DNS问题
6.修复了图片下载问题
7.修复json的一些问题