内容采集软件(关键词标记优化采集内核优化去重复工具算法修正遇出错)
优采云 发布时间: 2021-09-27 06:00内容采集软件(关键词标记优化采集内核优化去重复工具算法修正遇出错)
2、用户可以随意导入和导出任务
可以为3、任务设置密码,以确保采集任务详细信息的安全性
4、它还具有N个页面采集暂停/拨号以更改IP,采集暂停/拨号以更改IP以防出现特殊标记和其他防裂功能采集
5、您可以直接输入URL,或通过JavaScript脚本生成URL,或通过关键词
6、您可以登录到采集采集只能使用登录帐户查看的web内容
7、可无限深入N列内容采集,采用链接,支持多级内容分页采集
8、支持多种内容提取模式,可以处理所需的采集内容,如清除HTML、图片等
9、您可以编写自己的JavaScript脚本来提取网页内容,并轻松实现内容的任何部分
10、采集的文本内容可以根据设置的模板保存
11、可以根据模板将多个采集的文件保存到同一个文件中
12、网页上的多个部分内容可以单独分页采集
13、您可以设置自己的客户信息,以模拟目标上的百度和其他搜索引擎网站采集
14、支持智能采集,只需输入网站即可采集网站内容
15、此软件终身免费
更新日志(2020.07.30)
采用了新的智能软件控制界面
将用户反馈添加到电子邮件功能
增加了将初始化链接直接设置为最终内容页的功能
增强内核功能,支持post中的关键词搜索和替换关键词标记
优化采集内核
优化的断开拨号算法
优化的重复数据消除工具算法
修复拨号显示IP不正确的错误
修复错误关键词暂停或拨号时不会重置采集错误页面的错误
修复当限制的较大值为0时无法正确保存较小值的错误