自动采集发布系统(无人值守免费自动采集器使用网站本身的数据发布接口或程序代码)
优采云 发布时间: 2021-12-26 05:06自动采集发布系统(无人值守免费自动采集器使用网站本身的数据发布接口或程序代码)
无人值守自由自动采集器(ET)从设计之初就以提高软件自动化程度为突破口,达到无人值守、24小时自动工作的目的。经测试,ET可以自动长时间运行,即使以年为时间单位。无人值守的免费自动采集器独立于网站,不消耗宝贵的服务器WEB处理资源。它可以在服务器上工作,也可以在站长的工作机上工作。
无人值守的免费自动采集器使用网站自带的数据发布接口或程序代码对信息内容进行处理和发布,不直接操作网站数据库,避免了ET可能带来的数据安全问题。ET在采集
信息时使用标准的HTTP端口,不会造成网络安全漏洞。除了通用采集工具的功能外,ET使用户能够支持图片水印、反盗链、分页采集、回复采集、登录采集、自定义项、UTF-8、UBB、模拟发布...灵活满足各种采发需求。
特征
1、设置计划,可以24小时自动工作,无需人工干预
2、与网站分离,可通过独立制作的接口支持任何网站或数据库
3、 灵活强大的采集
规则,不仅可以采集
文章,还可以采集
任何类型的信息
4、体积小,低功耗,稳定性好,非常适合在服务器上运行
5、所有规则均可导入导出,资源灵活复用
6、使用FTP上传文件,稳定安全
7、下载上传支持续传
8、高速伪原创
采集
1、选择反向、顺序或随机的文章集合
2、支持自动列表网址
3、 支持采集
分布在多个页面上的数据的网站
4、 自由设置采集的数据项,可以对每个数据项分别进行过滤排序
5、支持分页内容采集
6、支持任意格式和类型的文件(包括图片、视频)下载
7、可以突破防盗文件
8、支持动态文件URL解析
9、支持需要登录才能访问的网页集合
10、可设置捕获关键词
11、可以设置敏感词防止采集
12、可以设置图片水印
发布
1、 支持发表有回复的文章,可广泛应用于论坛、博客等项目
2、 与采集数据分离的发布参数项可以自由对应采集数据或预设值,大大增强了发布规则的复用性
3、 支持随机选择发布账号
4、支持任何语言的发布项目翻译
5、支持编码转换,支持UBB码
6、 可选择文件上传自动创建年月日目录
7、模拟发布支持无法安装接口的网站发布操作
8、程序可以正常运行
9、防止网络运营商劫持HTTP功能
10、 可以手动采集
发布单项
11、详细的工作流程监控和信息反馈,让您快速了解工作状态
更新日志
无人值守免费自动采集
器 v3.5.7 更新日志
1、 新增:自动分词模块,可用于自动提取关键词/TAG。
2、新的;数据项可选择指定内容方式,支持引用其他数据项、随机字符串等预设内容。
3、 优化:采集
配置根据列表页、采集
页、数据项的隶属关系优化界面。
4、优化:现在可以选择是否对数据项使用翻译,方便翻译内容的组织。
5、 优化:数据项现在可以独立选择是否修改URL。
6、新增:采集
页和数据页的URL合成现在可以引用数据项,适应更复杂的URL合成。
7、优化:程序间隔时间从系统设置窗口移至配方程序窗口,每个程序可以单独设置间隔时间。
v3.1.4 更新日志(2017-6-9)
1、修正:在之前的版本中,数据项不允许为空无效。
v3.1.3更新日志(2017-6-2)
1、新增:数据项现在可以设置后数据排序组,完成包括数据项翻译在内的各种操作后可以进行二次处理。
2、新增:Translate新增“待翻译数据项”一栏,可以指定需要翻译的数据项名称。
3、修复:多列表测试时结果显示不完整的问题。