自动采集工具(Chrome/浏览器ú扩展插件程序)

优采云 发布时间: 2021-11-28 06:27

  自动采集工具(Chrome/浏览器ú扩展插件程序)

  这个插件程序原名Didiu,从1.1.6开始更名为DiiDú。你可以关注我们的官方网站:。------------------------------------------DiiDú 专业数据采集该软件是 Chrome/Edge 浏览器扩展程序。凭借其轻量级和敏捷的代码,它创造了强大的爬虫能力。你只需要一台装有Edge浏览器的电脑就可以采集各种页面上你需要的信息。不同于其他爬虫软件的设计理念,它不仅可以分析页面的原创HTML代码,还支持动态加载DOM元素。根据您预先设计的字段定义,将这些网页上的数据进行拆分组合并存储在您的本地,最终导出为常见的 Excel 数据格式。它是基于Edge浏览器的原生行为设计的,所以对于异步加载页面的数据很容易采集。✅ 使用说明 目前软件为原创,完全免费使用。目前,在您使用本软件的过程中不会采集任何数据,请您在使用前及时阅读相应的隐私条款。请遵守中华人民共和国相关法律法规,不得用于非法用途。使用本软件前,请务必阅读相关法律法规。您所能采集仅限于公开的互联网页面上的信息,如公开招标信息、公开招生信息、或公开产品型号性能信息等。

  恶意爬取行为导致对方服务器宕机、数据丢失或服务异常,涉嫌破坏信息安全*敏*感*词*。本软件采用的爬虫技术是基于对浏览器正常浏览行为的模拟,如页面打开、翻页、下载等。该技术不涉及对站点的HTTP请求数据进行破解、伪造、篡改、暴力刷新等非法手段。在使用本软件的过程中,请注意合理设置和使用,否则可能会遇到服务器IP封锁,或被网监部门监控,甚至触犯法律。本软件收录从1.1.第6版开始的会员服务。对于非会员用户,我们可能会在软件界面上添加必要的广告或限制某些功能。如果觉得反感,请主动卸载。目前该版本支持单页文字循环采集和次页文字采集功能。同时增加了对采集结果的自动过滤。未来将支持图片下载,实现地图采集、图片屏蔽等多项功能。使用本软件的前提是您需要了解一定的编程知识,例如Edge浏览器的开发者模式,能够快速阅读网页HTML标签等。如果你对此完全空白,你可能需要重点阅读官网的帮助文档。如果你能掌握一些最基本的“

  在正式采集之前,建议您先进行测试,检查设置的规则字段是否正常采集。如果需要自动翻页,还需要测试是否可以正常翻页。测试无误后,您就可以开始处理您的数据采集。如果想让它每天自动处理数据采集,就需要花30秒定义一个定时任务,然后绑定某个采集规则。最后打开任务调度页面,花1秒时间开启任务调度开关,然后就可以等待数据自动采集。✅ 版本变更说明 ✔v1.0.0 添加单页文字采集,调度任务,调度。✔v1.1.0 添加二级页面文字 < @采集。✔v1.1.3 新过滤器,清除日志,更新数据库,修复已知错误。✔v1.1.4 新增采集结果替换,采集字段前后排列功能,改进前后截取功能,修复采集的bug @> 跑步。✔v1.1.5 规则编辑增加计算公式,优化匹配能力,修复已知bug。✔v1.1.6 新增会员注册功能,会员限制分类,代码保护,修复已知bug。如果您有任何建议或发现任何问题,请联系:,版本不断更新,我们期待您的好评与支持。4 新增采集结果替换,采集字段前后排列功能,改进前后截取功能,修复采集运行bug。✔v1.1.5 规则编辑增加计算公式,优化匹配能力,修复已知bug。✔v1.1.6 新增会员注册功能,会员限制分类,代码保护,修复已知bug。如果您有任何建议或发现任何问题,请联系:,版本不断更新,我们期待您的好评与支持。4 新增采集结果替换,采集字段前后排列功能,改进前后截取功能,修复采集运行bug。✔v1.1.5 规则编辑增加计算公式,优化匹配能力,修复已知bug。✔v1.1.6 新增会员注册功能,会员限制分类,代码保护,修复已知bug。如果您有任何建议或发现任何问题,请联系:,版本不断更新,我们期待您的好评与支持。5 规则编辑增加计算公式,优化匹配能力,修复已知bug。✔v1.1.6 新增会员注册功能,会员限制分类,代码保护,修复已知bug。如果您有任何建议或发现任何问题,请联系:,版本不断更新,我们期待您的好评与支持。5 规则编辑增加计算公式,优化匹配能力,修复已知bug。✔v1.1.6 新增会员注册功能,会员限制分类,代码保护,修复已知bug。如果您有任何建议或发现任何问题,请联系:,版本不断更新,我们期待您的好评与支持。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线