小蜜蜂格式数据采集系统
优采云 发布时间: 2020-08-08 17:16小蜜蜂格式数据采集系统是高度智能的采集系统,完全面向用户采集行为,并允许用户自行设计采集内容;适用于采集格式的数据,例如: 房地产,招聘,投标,在线业务状况,产品价格以及诸如股票/期货价格之类的信息.
格式数据定义: 一条信息收录多个子项目,每个子项目的内容分别显示;例如,一条出租信息可能收录以下基本子项目,包括: 位置,位置,区域,房屋类型,楼层,区域,价格,方向,财产权,设施,价格,联系人,手机,电话,电子邮件...;
格式数据采集与普通文章采集之间的区别:
文章采集通常仅用于采集标题,文章内容,来源,作者和发行日期,并且不能扩展;文章内容连贯显示,格式数据内容独立于多个子项目显示,传统文章无法采集. 系统采集房地产,招聘,招标,网上业务情况等特殊信息,产品价格和库存/期货价格.
运行环境: 支持PHP + Mysql + ZEND Optimizer的WEB系统
功能介绍:
1. 根据系统的基本采集标签,允许用户随时自定义采集标签(试用版和标准版可以自定义20个标签,高级版本不受限制);
2. 站点+渠道管理模式使馆藏管理一目了然;
3. 支持登录采集,可以采集一些只能浏览的登录信息的目标来源;
4. 允许设置自定义标签内容属性,并在采集过程中自动检查内容属性以确定是否保留在库中;
5. 支持手动筛选采集的结果,并提供快速过滤和删除“空白标题和空白内容”的功能;
6. 支持导入和导出站点配置规则;
7. 支持通道配置规则导入导出,提供规则复制功能以简化设置;
8. 支持在采集过程中在断点处恢复采集的功能,该功能不受浏览器意外关闭的影响,并且在重新启动后不会重复采集;
9. 支持自动比较和过滤功能,不会重复采集和存储采集到的链接;
10. PHP程序开发,支持多种操作系统环境,可以安装和部署Windows,FreeBSD,Linux,Solaris;
11. 支持远程部署. 该产品可以安装在服务器上(推荐)以运行,也可以安装在本地计算机上以运行;
12. 在线采集服务器部署信息可充分发挥该产品的节能和高效特性;可以将采集到的数据快速导入到WEB应用程序系统中,这与非常见的脱机采集工具相当;
13. 多种数据导出方式,可以将采集到的数据导入WEB系统;
14. 支持两项开发以提取该系统采集的数据;
15. 试用版可以测试采集功能,无法将数据导入库中,其他功能不受限制.