采集器(优采云采集器的功能介绍-)

优采云 发布时间: 2021-11-27 19:25

  采集器(优采云采集器的功能介绍-)

  优采云采集器是专为站长提供的网站采集分析工具。这个软件几乎可以采集所有网页,而且速度非常快。采集/发布与复制/粘贴一样准确。通过灵活的配置,您可以轻松地从网页中抓取文本、图片、文件等资源。

  软件特点:

  1、强大的通用性

  无论是新闻、论坛、视频、黄页、图片、下载网站,只要是浏览器可以看到的结构化内容,通过指定匹配规则,就可以采集获取内容你需要 。

  2、稳定高效

  历经五年磨一剑,软件不断更新完善,采集速度快,性能稳定,占用资源少。

  3、可扩展性强,应用范围广

  自定义网页发布,主流数据库自定义存储发布,自定义本地php和.net外部编程接口处理数据,让数据为你所用。

  特征:

  1、规则定制-通过采集规则的定义,您可以搜索到所有网站采集几乎任何类型的信息。

  2、Multitasking, multithreading-multiple information 采集 任务可以同时执行,每个任务可以使用多个线程。

  3、所见即所得-任务采集所见即所得的过程。过程中遍历的链接信息、采集信息、错误信息等会及时反映在软件界面中。

  4、数据保存-采集的同时数据自动保存到关系型数据库,数据结构可以自动适配。软件可以根据采集的规则自动创建数据库,以及其中的表和字段,也可以通过数据库导航的方式灵活地将数据保存到客户现有的数据库结构中。

  5、Breakpoint Resuming-Information 采集任务停止后可以从断点恢复采集,以后你的采集任务不用担心了被意外打断。

  6、网站Login-support 网站Cookie,支持网站可视化登录,即使网站登录时需要验证码也可以采集。

  7、定时任务-这个功能可以让你的采集任务定时、定量或循环执行。

  8、采集范围限制-采集的范围可以根据采集的深度和URL的logo进行限制。

  9、文件下载-采集收到的二进制文件(如图片、音乐、软件、文档等)可以下载到本地磁盘或采集结果数据库。

  10、结果替换-您可以根据规则将采集的结果替换为您定义的内容。

  11、条件保存-可以根据一定条件决定保存和过滤哪些信息。

  12、 过滤重复内容——软件可以根据用户设置和实际情况自动删除重复内容和重复网址。

  13、特殊链接识别-使用此功能识别由JavaScript动态生成的链接或其他奇怪的链接。

  14、数据发布-您可以通过自定义接口将采集的结果数据发布到任何内容管理系统和指定的数据库。目前支持的目标发布媒体包括:数据库(access、sql server、my sql、oracle)、静态htm文件。

  15、预留编程接口-定义多个编程接口,用户可以在活动中使用PHP、C#语言进行编程,扩展采集的功能。

  更新内容:

  2019-05-07

  1. 优化效率,修复运行大量任务时卡住的问题

  2.修复大量代理时配置文件被锁定,程序退出的问题

  3.修复某些情况下无法连接MySQL的问题

  4.其他界面和功能优化

  2018/08/06

  1、 调整列表页重新排列方式,现在只会在同级列表页之间重新排列

  2、增加任务完成后运行统计预警功能(邮件预警)【终极版功能】

  3、 增加了对一些返回码不是200的请求的支持,仍然执行采集的配置

  4、 新增支持将下载地址保存为html文件

  5、二级代理服务,增加导入时代理类型配置,同时修复用户名密码显示错误

  6、发布配置页面,默认只显示当前选中的配置,加快任务加载时间

  7、修复命令行控制,closeapp参数无法自动关闭程序的问题

  8、修复未选择图片水印时图片无法裁剪的问题

  9、优化启动界面加载方式,解决初始界面冻结问题

  10、修复多线连接器配置中“l”导致无法检测图片下载的问题

  11、修复Excel导出数据时列顺序与字段顺序不一致的问题

  12、修复Excel导出数据时部分字段收录数字的问题。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线