24小时无人监管自动采集,有需要的用户不要错过了
优采云 发布时间: 2021-03-09 11:0324小时无人监管自动采集,有需要的用户不要错过了
EditorTools3是一款功能强大且免费的全自动信息采集软件,可以帮助用户实时监视采集指定的站点内容,支持一键下载文本,图像,视频和音频文件,并且可以每天24小时自动监控采集,需要它的用户,不要错过它,欢迎下载并使用!
软件功能
1、引导后自动运行ET:启动计算机并进入系统后,ET程序将自动运行;
2、 ET启动后自动工作:ET启动后,它将自动执行上次使用ET时检查的工作计划。只有启用此项目,才会自动保存当前检查的工作计划;
3、启动后最小化:启动ET后,主窗口将被隐藏,仅显示托盘图标;
4、忽略规则开头和结尾的空格:启用此项目后,采集配置中的每个规则都会自动删除空格开头和结尾,回车符,换行符等的空白字符,防止用户输入多个空格或换行符导致规则分析失败;如果用户需要使用空格或换行符来确定规则的开始和结束,请取消选中;
5、计划执行间隔:执行自动工作并选择多个计划时,在完成计划采集的当前列表之后,更改下一个计划采集需要多长时间;
6、访问网络超时时间:设置访问网络时无响应的时间,该时间将被强制断开;
7、访问网络重试次数:设置访问网络时失败的自动重试次数,例如采集网页,下载文件,FTP上传等。这是2.版本中的新增功能2.功能;
8、无法访问网页后自动重新启动ET:设置为在访问网页失败一定次数后自动重新启动ET,以解决一些可能导致网络拥塞且无法继续正常工作的问题;该功能仅在自动工作时生效,停止自动工作将重置失败计数,重试访问不计数;这是2. 3.版本7中的新功能;
软件功能
[全自动无人值守]
无需人工,24小时自动实时监控目标,实时高效采集,可为您提供全天候的内容更新。满足长期的运营需求,使您免于繁重的工作
[广泛适用]
最通用的采集软件,支持任何类型的网站 采集,适用率高达9 9. 9%,支持发布到所有类型的网站程序,并且还可以采集本地文件,免费界面发布。
[自由信息]
支持信息的自由组合,通过强大的数据分类功能对信息进行深度处理以及创建新内容
[下载任何格式的文件]
根据需要,它是静态的还是动态的,无论是图片,音乐,电影,软件还是PDF文档,WORD文档甚至*敏*感*词*文件
[伪原创]
高速同义词替换,多词随机替换,随机段落排序,帮助内容SEO
[无限多级页面采集]
无论是垂直的多层页面,还是并行的多个页面,还是AJAX调用页面,它采集都很容易
[自由扩展]
开放接口模式,免费二次开发,自定义任何功能,满足所有需求
软件功能
设置劫持功能代码;
许多地区的电信宽带用户在上网时将被迫访问信息,用一些代码替换访问信息,以便用户只能通过代码中的框架查看他们最初想要访问的网页。通常用于显示电信。此行为称为劫持浏览器;这种行为称为“劫持浏览器”。发生这种情况时,ET 采集的源代码只能获取这些被劫持的代码,而采集的网页源代码则无法获取
设置UserAgent;
网站使用userAgent来确定当前用户正在使用哪种浏览器,并根据该浏览器可以支持的情况提供相应的功能。当浏览器访问网页时,通常会发送一个标识字符串来告诉网站它是什么浏览器软件,而我们访问网站的部分将限制UserAgent。我们可以在基本设置中修改UserAgent,或单击“获取本机UserAgent”按钮以获取本机IE默认的UserAgent
设置支持的语言;
采集对于某些网页,网站可能会检查支持的语言,用户可以在此处进行调整。
锁定设置
此功能用于在打开每个配置窗口时设置密码。设置了锁定密码后,使用菜单锁定功能可以防止其他人在用户离开计算机后访问和操作各种配置。
数据项设置
数据项用于定义从采集页获得的各种信息,但[title],[thumbnail],[文章 URL](即发布规则中的[文章 URL])除外。可以在列表设置页面之外获取项目数据
数据项属性编辑区
不能修改[缩略图],[标题],[文本]和[文章 URL]这四个基本数据项的名称。
[文章 URL]数据项的值是列表规则中文章 URL合成的结果。
[title]数据项与列表分析中的[文章 title]标签相对应,默认值为通过列表分析获得的文章标题。
[thumbnail]数据项对应于列表分析中的[thumbnail]标记,默认值为通过列表分析获得的缩略图。
功能介绍
广泛适用
比较通用的采集软件,支持任何类型的网站 采集,适用率高达9 9. 9%,支持发布到所有类型的网站程序,并且还可以采集免费的本地文件接口已发布。
信息自由
支持信息的自由组合,通过强大的数据分类功能对信息进行深度处理以及创建新内容
任何格式的文件下载
根据需要,它是静态的还是动态的,无论是图片,音乐,电影,软件还是PDF文档,WORD文档甚至*敏*感*词*文件
伪原创
高速同义词替换,多词随机替换,随机段落排序,帮助内容SEO
无限多级页面采集
无论是垂直的多层页面,还是并行的多个页面,还是AJAX调用页面,它采集都很容易
自由扩展
开放接口模式,免费二次开发,自定义任何功能,满足所有需求
该软件内置了许多常用系统,包括discuzX,phpwind,dede cms,wordpress,php cms,empire cms,Dongyi,joomla,pbdigg,php168,bbsxp,phpbb, dvbbs,typecho,emblog等示例。
主要优点
1、工作记录:
此列记录ET的每个步骤的工作过程和状态,包括目录采集和文章处理的两个部分。我们可以了解采集的执行是否正确完成或通过工作记录发生了什么。问题:出现问题时,用户可以根据信息栏中的提示和其他反馈内容快速,准确地找到故障原因并解决。
2、 采集源代码:
此列显示执行过程中采集的文章列表页,文章页,文章分页等的源代码。此列中的源代码可用于方便地测试和提供规则。定制的基础。
请注意,某些网站会根据不同的访问浏览器显示不同的源代码。因此,在自定义ET的采集规则时,以本列中的源代码为准,例如采集规则示例在'SMF 1. 1. 5'中,通过以下方式访问网站的源代码IE和优采云 采集器不同。
3、分析数据:
此列显示文章过程中每个数据项的信息,从分析的原创代码到排序的代码,再到URL校正后的代码。用户可以通过查看此列来了解设置,这些数据项分析规则是否正确,归类组规则是否完整以及最终信息是否满足您的要求。
例如:当工作记录列提示错误“正数大于或小于发布设置”时,我们可以检查此列中的“正文”数据项以找出是否大于小于或小于释放设置(无论是正常设置还是归类不当设置),请调整每个设置。
4、发送代码:
此列显示ET发送到版本网站的数据,包括文章检查部分和文章发布部分;
用户可以使用此列中的信息,通过一系列分析和排序操作来检查最终提交给发布网站的数据,以检查他们的采集规则数据项和发布规则的参数设置是否正确正确而完整。
5、返回信息:
此列显示了ET在发送数据到发布网站后由ET释放的网站反馈,包括文章检查反馈和文章释放反馈;
通过查看本专栏,我们可以清楚地了解采集流程中出现问题的大多数原因。
当某些接口返回错误信息时,该信息可能是HTML代码。不熟悉HTML代码的用户会发现它很难阅读。单击“ WEB”按钮以在操作系统的默认浏览器中查看它们。