优采云采集器怎么用?2分钟快速入门内置入门
优采云 发布时间: 2021-05-01 05:13优采云采集器怎么用?2分钟快速入门内置入门
优采云 采集器官方网站,如何使用优采云 采集器? 优采云 采集器是易于使用的网页数据采集工具,小巧方便,界面清晰,操作简单,这是一个可以使您的信息采集非常简单的工具,它可以让您付出很多更简单,更容易从Internet编译数据。
优采云 采集器功能
简单的操作,完全可视化的图形操作,不需要专业的IT人员,任何可以使用计算机访问Internet的人都可以轻松掌握它。
云采集
采集任务自动分配到云中的多个服务器以同时执行,从而提高了采集的效率,并可以在短时间内获得数千条信息。
拖放采集进程
模仿人的操作思维方式,您可以登录,输入数据,单击链接,按钮等,还可以针对不同情况采用不同的采集流程。
图形识别
内置可扩展的OCR界面,支持解析图片中的文本,并提取图片中的文本。
定时自动采集
采集任务根据指定的周期采集自动运行,并且还支持每分钟一次的实时采集。
2分钟内快速入门
从入门到精通的内置视频教程,您都可以在2分钟内上手,并且有文档,论坛,qq小组等。
免费使用
它是免费的,免费版本没有功能限制。您可以立即尝试,立即下载并安装。
优采云 采集器函数
简而言之,使用优采云可以轻松地从任何网页生成自定义的常规数据格式,以准确采集所需的数据。 优采云 Data 采集系统可以执行的操作包括但不限于以下内容:
1.财务数据,例如季度报告,年度报告,财务报告,包括自动的最新每日净资产采集;
2.主要新闻门户网站网站实时监控,自动更新和上传最新新闻;
3.监视竞争对手的最新信息,包括商品价格和库存;
4.监控主要的社交网络网站,博客,并自动获取有关公司产品的相关评论;
5.采集最新,最全面的职位招聘信息;
6.监视与网站,采集新房和二手房有关的主要房地产的最新市场状况;
7. 采集每辆主要汽车的特定新车和二手车信息网站;
8.发现并采集潜在的客户信息;
9. 采集行业网站的产品目录和产品信息;
1 0.在主要的电子商务平台之间同步产品信息,以便可以在一个平台上发布并在其他平台上自动更新。
优采云 采集器使用方法
首先,让我们创建一个新任务->进入流程设计页面->向流程中添加一个循环步骤->选择循环步骤->选中页面右侧的URL列表复选框软件->“打开URL列表”文本框->将准备好的URL列表填充到文本框中
接下来,将打开网页的步骤拖到循环中->选择打开网页的步骤->选中使用当前循环中的URL作为导航地址->单击“保存”。系统将在界面底部的浏览器中打开与在循环中选择的URL对应的网页
至此,打开网页周期的配置完成。当进程运行时,系统将一遍打开在循环中设置的URL。最后,我们不需要配置采集数据的步骤,因此在此不再赘述。您可以参考系列1:采集单个网页,从入门到熟练程度文章。下图是最终的处理过程
以下是该过程的最终运行结果
更新日志:
主要体验改进
[自定义模式]添加了触发功能,可以根据特定条件执行采集,单击以查看详细的教程:
[自定义模式]提供优采云 6内核模式,可有效解决网站在优采云 7上无法打开的一些问题
[自定义模式]页面滚动功能之间的最小间隔为0. 5秒
[自定义模式]选择所有链接后,将添加选项“ 采集跟随链接文本+链接”
[自定义模式]选择所有链接后,添加“ 采集内部元素后面的元素”和“ 采集内部元素后面的元素”选项
[自定义模式]相关任务采集支持增量模式
[自定义模式]设置关联的任务时,它支持搜索任务组名称和任务名称
[轻松模式]添加了“热门”类别
[简易模式]当前,可以按模板名称和模板在线时间进行排序
[简易模式]添加了搜索功能,可搜索的模板
[其他]增强了导出到数据库的健壮性
[其他]导出数据库以选择数据表时添加搜索功能
错误修复
解决了手动输入多个URL时循环项消失的问题
解决了“从文本导入” URL后采集速度慢的问题
解决一些计时任务错误的问题
解决了“在iframe循环采集中输入文本时点击元素无效”的问题
解决一些小问题