网页文章自动采集( 中小型网站每月省下N个更新员的数万元工资支出)
优采云 发布时间: 2021-09-01 19:04网页文章自动采集(
中小型网站每月省下N个更新员的数万元工资支出)
Editortools(ET)是一款可以无人值守自动工作的独立软件,将个人站长从繁重的编辑工作中解放出来,为中小型网站每月节省N个更新者的工资开支;
ET 不要求您对现有论坛或网站 进行任何更改;
ET适用于任何网站或论坛;
功能介绍:
自动采集信息,发布到指定网站(非广告群发帖),适用于网站站长或管理员。
软件功能:
您可以采集发布任何文件,包括图片、FLASH、mp3、RAR文件;
可以建立多个采集方案,网站可以自动添加各种信息;
可以建立多个发布计划,可以同时管理多个网站,或者论坛的不同版块;
安装简单,运行稳定,可以运行在服务器上,也可以运行在站长的工作机上;
独立软件,无需修改网站,不消耗宝贵的服务器资源;
无人值守,24小时自动工作,相当于9个以上的更新编辑(三班倒,每班三到五人)。
运行环境:
windows系统,windowsXP,windows2000、windows2003已经测试过了。
发布网站服务器类型不限,WINDOWS、LINUX、FREEBSD均可。
v1.3 版本新特性介绍:
一、模拟发布
使用网站release页面模拟手动登录网站release文章;使用这个函数,你不需要创建网站接口;目前ss5.5信息,帝国Ecms新闻已提供系统发布规则实例。
二、自动列表改进
采集规则的自动列表可以设置增量步长,方便在列表页对URL号间隔超过1的网站自动列表采集。
三、多级转采集
一些网站文章页面使用JS脚本重定向URL或多次打开新窗口来访问正确的文章。这个功能可以支持采集这样的网站。
四、其他细节调整
不再需要1、列表规则中的title变量,适用于网站列表中没有title的一些情况;
2、FLASH的下载上传不再单独列出,合并为文件下载上传;
3、工作区增加“自动关闭”选项;
4、release配置中附加参数项的填写方式改为以行分隔;
5、发布配置增加当前文章URL和文件列表参数,提高界面制作的灵活性;
6、Publishing 规则可导出导入,方便分享模拟发布规则;
v1.2 版本新特性介绍:
1、支持COOKIES,需要登录的采集网站即可;
2、文章校验网址可以为空,方便部分不需要校验的用户加快发布速度。
3、修改复制规则时,省略了部分数据项。
4、支持userAgent自修改访问某些网站有特殊限制;
5、修复部分图片解析无结果的问题;
6、支持命令行操作,参数如下:
/pall 或 /p1,2,3 自动运行所有计划或自动运行1、2、3 计划(按顺序)
/c 运行后关闭ET(每个方案列出采集一次,如果开启自动列表,所有自动列表执行完后运行结束)
7、间隔时间可以保存以备下次使用;
8、自定义项可任意扩展和添加,并有自己独立的过滤规则,以适应各种网站程序;
9、提供扩展下载,支持任意文件格式下载,支持动态链接下载,支持FTP协议URL下载;
10、 提供强制发布。图片等文件下载或上传失败时,当前文章仍可发布;
ET基本特性说明:
1、防盗链无害:无障碍下载使用防盗链的文件。动态防盗链接,如在asp、php、jsp等文件中显示图片,或静态防盗链接,如网易相册。
2、support文章分页采集;
3、图片水印:在过滤器配置中添加水印设置,按照计划给下载的图片添加水印;
4、Autolist:列表的URL自动增减;
5、多个text采集:适用于采集论坛回复或类似网页内容;
6、最小化到托盘:静默工作,不影响桌面应用;
7、文章整理:浏览和管理历史文章,错误文章;
8、code 监控窗口:适合高级用户,分析采集code;