优采云采集器 v2.3.3官方版
优采云 发布时间: 2020-08-25 02:10优采云采集器 v2.3.3官方版
优采云采集器是一款功能强悍的数据采集无限制爬虫软件,它可以直接布署在云端服务器当中使用,可以支持对各种网站数据进行可视化的采集,并且还能与CMS系统进行对接,将所采集的数据进行同步的发布,让网站数据的采集与发布愈发的智能与自动化。
软件特色
数据采集
支持多级、多页面、分页采集和自定义采集规则进行采集,可以做到精准匹配,几乎所有类型的页面都可以采集,并且可以智能地辨识大多数文章类型的页面内容。
内容发布
与各类建站管理系统插口可以完美对接,实现无登陆数据导出,数据发布插件可以支持自定义,也可以直接将数据导出数据库当中,或者存为Excel文件以及生成应用编程插口等。
自动化和云平台
该软件实现了定时和定量的手动采集和分配,无需人工处理,内置云平台,用户可以将自己的下载采集规则分享给你们,或者也可以发布各类求救或则交流信息。
关于软件
优采云采集器及网站数据采集和发布功能与一身,并才能将其布署在云服务器里面,从而使用数据采集的云端化,可以使数据采集更加的便利和快速。
使用方式
1.软件升级
在软件后台首页当中可以对软件的版本进行检查升级,也可以通过下载最新版本的压缩包进行解压覆盖。
2.安装软件
将下载的软件上传到服务器当中,如果跟目录当中有站点,那么建议放在子目录当中,然后打开浏览器,输入服务器的IP或则域名地址加上软件储存的目录名称,即可步入软件的安装界面。
有个接受的按键,点击它,就会步入到环境监测的页面
环境监测必须保证所有的参数都是正确的,不然使用可能还会出错。点击下一步步入到数据安装界面
对数据库创始人配置信息进行填写输入,然后点击下一步
最后完成安装,点击开始使用,您就可以体验优采云采集器强悍的采集功能了。
更新日志
1.修复在cli命令模式下手动搜集无限循环和php路径的问题(在linux中手动辨识php路径须要关掉目录跨站点保护)
2.强化手动采集触发的安全性,优化手动采集性能,降低系统帧率
3.添加一个函数插件,可用于数据处理的使用函数和条件判定。(注意:条件判定中的使用函数倘若发生变化,需要重新编撰)
4.添加调用插口功能,可用于数据处理和发布设置
5.增加新的代理类型socks4和socks5,增加动态代理ip获取功能,可以手动剖析多个api插口,获取有效的ip
6.添加腾讯翻译以优化翻译功能
7.加强页面剖析功能,只需点击即可确切获取元素的xpath和同类型元素的xpath,生产规则更简单
8.这些规则添加了一个简单的模式,带有菜鸟手册和页面剖析功能,让菜鸟更容易上手
9.新的统计图表添加到搜集的数据中,可以查看相应的数据量,如年、月、日、任务和发布形式
10.为采集增加了观察机器人合同的功能(可以关掉),采集设置与图象定位设置分开