网页内容抓取工具(优采云采集器编辑采集数据:您可以在本地可视化编辑已采集的数据)
优采云 发布时间: 2022-01-16 14:14网页内容抓取工具(优采云采集器编辑采集数据:您可以在本地可视化编辑已采集的数据)
优采云采集器是目前使用最多的互联网数据采集、处理、分析和挖掘软件。该软件以其灵活的配置和强大的性能,领先国内data采集产品,得到了众多用户的一致认可。
适用范围
1.网站编辑:打破编辑必须手动转载文章的传统现状,他们将有更多时间编辑和处理数据,工作效率更高。该程序可以与TRS等采集编辑系统完美结合,海量网站信息采集会更简单有效。
2.内网:打破内网信息单一、获取难的神话,内网也能体验到各种互联网信息。它可以解决与互联网隔离的军队等重要部门的互联网信息需求问题。
3.政府机构:实时跟踪,采集*敏*感*词*新闻、政策法规、经济、行业等政府工作相关信息,解决政府主要问题网站地方层面的网站信息采集和整合问题。
4.企业应用:实时准确采集*敏*感*词*新闻、行业新闻、科技文章。可以轻松进行数据集成,智能处理更快更高效,业务成本大大降低。
5.SEO人员或站长:更容易获取数据,可以快速增加网站信息量,可以更专注于优化和推广。
软件功能
1.支持所有编码格式的数据采集,你可以使用它采集worldwide文章。该程序还可以在编辑之间执行完美的转换。
2.多个接口;支持所有主流或非主流的cms、BBS、下载站等。通过系统的接口可以实现采集器和网站的完美结合。
3.无人值守工作:配置程序后,程序可以根据您的设置自动运行,无需人工干预。
4.本地编辑采集数据:您可以在本地直观地编辑采集数据。
5.采集内容测试功能:这是其他任何采集软件都无法比拟的,您可以直接查看结果并测试发布。
6.易管理:使用站点+任务模式管理采集节点,任务支持批量操作,管理更多数据轻松。
变更日志
1、调整列表页的重新排列方式,现在只会在同级列表页之间重新排列。
2、任务完成后增加运行统计预警功能(Email邮件警告)【终极版功能】
3、增加了对部分请求返回码不是200时配置采集的支持。
4、添加了将下载地址保存为 html 文件的支持。
5、二级代理服务,导入时添加代理类型,修复用户名密码显示错误。
6、发布配置页面,默认只显示当前选择的配置,加快任务加载时间。
7、修复命令行控制,closeapp参数无法自动关闭程序的问题。
8、修复未选中图片水印时无法裁剪图片的问题。
9、优化启动界面的加载方式,解决初始化界面卡顿的问题。
10、修复多行连接符收录“|”时无法检测到图片下载的问题 在配置中。
11、修复Excel导出数据时列顺序与字段顺序不一致的问题。
12、修复了从Excel导出数据时,某些收录数字的字段导出数据不正确的问题。
13、修复批量编辑任务时无法复制Json采集表达式的问题。