小蜜蜂格式数据采集系统

优采云 发布时间: 2020-08-08 17:16

  小蜜蜂格式数据采集系统是高度智能的采集系统,完全面向用户采集行为,并允许用户自行设计采集内容;适用于采集格式的数据,例如: 房地产,招聘,投标,在线业务状况,产品价格以及诸如股票/期货价格之类的信息.

  格式数据定义: 一条信息收录多个子项目,每个子项目的内容分别显示;例如,一条出租信息可能收录以下基本子项目,包括: 位置,位置,区域,房屋类型,楼层,区域,价格,方向,财产权,设施,价格,联系人,手机,电话,电子邮件...;

  格式数据采集与普通文章采集之间的区别:

  文章采集通常仅用于采集标题,文章内容,来源,作者和发行日期,并且不能扩展;文章内容连贯显示,格式数据内容独立于多个子项目显示,传统文章无法采集. 系统采集房地产,招聘,招标,网上业务情况等特殊信息,产品价格和库存/期货价格.

  运行环境: 支持PHP + Mysql + ZEND Optimizer的WEB系统

  功能介绍:

  1. 根据系统的基本采集标签,允许用户随时自定义采集标签(试用版和标准版可以自定义20个标签,高级版本不受限制);

  2. 站点+渠道管理模式使馆藏管理一目了然;

  3. 支持登录采集,可以采集一些只能浏览的登录信息的目标来源;

  4. 允许设置自定义标签内容属性,并在采集过程中自动检查内容属性以确定是否保留在库中;

  5. 支持手动筛选采集的结果,并提供快速过滤和删除“空白标题和空白内容”的功能;

  6. 支持导入和导出站点配置规则;

  7. 支持通道配置规则导入导出,提供规则复制功能以简化设置;

  8. 支持在采集过程中在断点处恢复采集的功能,该功能不受浏览器意外关闭的影响,并且在重新启动后不会重复采集;

  9. 支持自动比较和过滤功能,不会重复采集和存储采集到的链接;

  10. PHP程序开发,支持多种操作系统环境,可以安装和部署Windows,FreeBSD,Linux,Solaris;

  11. 支持远程部署. 该产品可以安装在服务器上(推荐)以运行,也可以安装在本地计算机上以运行;

  12. 在线采集服务器部署信息可充分发挥该产品的节能和高效特性;可以将采集到的数据快速导入到WEB应用程序系统中,这与非常见的脱机采集工具相当;

  13. 多种数据导出方式,可以将采集到的数据导入WEB系统;

  14. 支持两项开发以提取该系统采集的数据;

  15. 试用版可以测试采集功能,无法将数据导入库中,其他功能不受限制.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线