文章采集助手(无人值守免费自动采集器中文绿色版中文中文下载地址)
优采云 发布时间: 2021-12-30 19:15文章采集助手(无人值守免费自动采集器中文绿色版中文中文下载地址)
无人值守免费自动采集器中文绿色版是一款非常好用的网络优化软件。我们的软件使用网站自带的数据发布接口或程序代码来处理和发布信息,不直接操作网站数据库,避免了ET可能造成的数据安全问题。为了让网站保持活力,每日内容更新是基础。一个小网站保证每天更新,通常需要站长承担每天8小时的更新工作,周末没有节假日;一个中型网站要全天维护内容更新,通常每天需要 3 个班次,每班需要 2-3 名管理员人工。中小型网站自动更新工具,好帮手,自动采集
发布,运行时静音工作,无需人工干预;独立软件免除网站性能消耗;安全稳定,可连续工作多年。ET使用标准的HTTP端口,不会造成网络安全漏洞。ET除了具备通用采集工具的功能外,还支持站台支持图片水印、防盗链、分页采集、回复采集、登录采集、自定义物品、UTF-8、UBB、模拟发布。 .. 昌河管理员从繁琐枯燥的网站更新工作中解脱出来!如果你愿意,你可以在这里下载它!不会造成网络安全漏洞。ET除了具备通用采集工具的功能外,还支持站台支持图片水印、防盗链、分页采集、回复采集、登录采集、自定义物品、UTF-8、UBB、模拟发布。 .. 昌河管理员从繁琐枯燥的网站更新工作中解脱出来!如果你愿意,你可以在这里下载它!不会造成网络安全漏洞。ET除了具备通用采集工具的功能外,还支持站台支持图片水印、防盗链、分页采集、回复采集、登录采集、自定义物品、UTF-8、UBB、模拟发布。 .. 昌河管理员从繁琐枯燥的网站更新工作中解脱出来!如果你愿意,你可以在这里下载它!
软件功能1、设定计划,可24小时自动工作,无需人工干预
2、与网站分离,可通过独立制作的接口支持任何网站或数据库
3、 灵活强大的采集
规则,不仅可以采集
文章,还可以采集
任何类型的信息
4、体积小,低功耗,稳定性好,非常适合在服务器上运行
5、所有规则均可导入导出,资源灵活复用
6、 无人值守的免费自动采集器,使用FTP上传文件,稳定安全
7、下载上传支持续传
8、高速伪原创软件功能1、 可选择逆序、顺序、随机采集
文章
2、支持自动列表网址
3、 无人值守的免费自动采集器,还可以支持数据分布在多个页面的网站采集
4、 自由设置采集的数据项,可以对每个数据项分别进行过滤排序
5、支持分页内容采集
6、支持任意格式和类型的文件(包括图片、视频)下载
7、可以突破防盗文件
8、支持动态文件URL解析
9、支持需要登录才能访问的网页集合
10、可设置捕获关键词
11、可以设置敏感词防止采集
12、可设置图片水印软件亮点1、支持发表有回复的文章,可广泛应用于论坛、博客等项目
2、 与采集数据分离的发布参数项可以自由对应采集数据或预设值,大大增强了发布规则的复用性
3、 支持随机选择发布账号
4、支持任何语言的发布项目翻译
5、支持编码转换,支持UBB码
6、 可选择文件上传自动创建年月日目录
7、模拟发布支持无法安装接口的网站发布操作
8、程序可以正常运行
9、防止网络运营商劫持HTTP功能
10、 可以手动采集
发布单项
11、详细的工作流程监控和信息反馈,让您快速了解工作状态。使用说明一、选择工作计划
工作计划包括从源头获取原创
信息、处理信息并最终将其发布到目标网站的所有设置指令。它是ET自动采集
工作的指挥官。当我们需要的计划制定后(参见计划用户手册-设置),您可以在主窗口中选择工作计划并开始采集
工作。
1、了解项目区域;
主窗口左上角的树状目录区是解决方案区。点击鼠标右键弹出操作菜单
2、查看方案;
点击程序名称前面的选择框,选择要执行的程序,可以多选
如果选择的计划缺少关键配置,会提示并取消勾选
ET工作时,会先从当前的焦点计划开始执行,即蓝色高亮的计划,见图4“Website-discuz 6.0 (with reply)”
选定的多个方案将循环执行。
在主窗口右上方的文章列表区,会显示所选焦点方案的待审文章。
右键单击项目名称,弹出菜单
点击编辑计划,进入计划编辑窗口;
也可以通过双击程序名称直接进入程序编辑窗口。
二、自动工作
选择要执行的工作计划后,点击主窗口左下角的“自动”按钮,开始全自动工作。从此用户可以丢掉鼠标键盘,抛开繁琐的网站更新,和朋友一起出门,网站内容自带ET,为你默默采集
更新
要停止自动工作,请单击“停止”按钮;
三、手工作业
在调试程序时,通常使用手动获取。
1、 采集
目录;
点击主窗口左下方的“采集
目录”按钮,ET将对当前选中的焦点方案执行目录采集
动作,如果没有焦点方案,则依次执行
采集的目录信息显示在主窗口右上角的文章列表区
注:当方案的采集
规则修改时,未发表的文章将被自动清除,包括发送失败的文章,以防止用户继续使用错误的文章条目进行采集
。
2、处理文章;
当文章列表区有待处理的文章时,点击主窗口左下角的“处理文章”按钮,将依次采集
文章列表区第一条待处理的文章
在文章处理过程中,工作记录会显示在主窗口右下方的信息区
处理后,文章列表区对应条目会显示处理状态
3、另一种手动处理文章的方式;
在文章列表区,双击文章条目,无论文章是否被处理,都会对该文章进行采集动作。
四、了解文章列表区
主窗口右上方的表格区为文章列表区,显示已执行项目的待处理文章
1、 文章列表区每一栏的说明;
标题:这是通过采集
规则-列表分析规则得到的文章标题。如果采集
规则没有设置标题数据项的分析规则,那么ET会使用这里的文章采集
标题作为出版物标题,文章采集
标题可以更改,点击标题后面的省略号按钮进入编辑状态。
Status-Send:当该项的值为YES时,表示文章已成功发布;
Status-Sensitive:当该项值为YES时,表示文章正文收录
敏感关键词;
Status-Error:0表示没有错误,其他错误代码的含义请参考相关主题;
Status-Processing:打勾的文章条目表示已执行,可以点击取消勾选再次执行;
2、 转换显示代码;
在文章列表区右击,会弹出编码菜单
3、双击执行文章采集
;
前文提到,可以在文章列表区双击文章条目进行采集
;
4、浏览按钮;
点击文章条目的浏览按钮,访问文章网址,用于确认网址是否正确,查看网页源代码等。
五、了解信息吧
信息栏用于跟踪执行过程并反馈各种信息。是了解ET工作情况、解决采集
中遇到的问题的重要工具。
1、工作记录:
本栏目记录了ET每一步的工作过程和状态,包括目录采集和文章处理两部分。通过工作记录,我们可以了解采集
是否正确完成或发生了什么问题;当出现问题时,我们可以按照提示,结合信息栏中的其他反馈内容,用户可以快速准确地找到故障原因并解决。
2、 采集
源码:
该栏目显示了在执行过程中采集
到的文章列表页、文章页、文章分页等源代码。有了本专栏的源码,可以方便的测试规则,为规则定制提供基础。
请注意,某些网站会根据不同的访问浏览器显示不同的源代码。因此,在自定义ET的采集规则时,以本栏目源码为准,例如采集规则示例中的'SMF1.。1.5',其网站与有财云采集器
通过IE访问时获得的源代码不同。
3、分析数据:
该栏显示文章处理过程中各个数据项的信息,从解析的原创
代码,到排序后的代码,再到URL修正后的代码。通过查看该栏,用户可以了解设置的数据项分析规则是否为Accuracy,组织规则是否完整,最终信息是否符合自己的要求。
例如:当工作记录栏提示错误“正字符数大于或小于发布设置”时,我们可以查看该列中的“正文”数据项,查看是大于还是小于比发布设置,无论是正常的还是因为整理组设置不当。调整每个设置。
4、发送代码:
此栏显示ET发送到发布网站的数据,包括文章查看部分和文章发布部分;
用户可以利用本栏目的信息,通过一系列的分析整理操作,了解最终提交给发布网站的数据,从而检查自己的采集规则数据项、发布规则参数设置等是否正确、完整.
5、返回信息:
本栏目显示ET向发布网站发送数据后发布网站的反馈,包括文章查看反馈和文章发布反馈;
通过查看本专栏,我们可以清楚地了解采集
过程中出现问题的大部分原因。
当某些接口返回错误信息时,该信息可能是HTML代码。不熟悉 HTML 代码的用户会发现难以阅读。单击 WEB 浏览按钮可在操作系统的默认浏览器中查看它们。更新日志1、 修正:每天程序执行次数不准确的问题。
2、 优化:提高数据提取的准确性和兼容性。
3、 优化:SFTP 兼容性提升。
4、 优化:采集配置测试结果窗口现在可以自动记忆位置和大小。