测评:免费爬虫工具:优采云采集器如何采集什么值得买推荐商品数据

优采云 发布时间: 2020-08-31 20:19

  免费的采集器工具: 优采云采集器如何采集值得购买的推荐产品数据

  本文主要介绍如何使用优采云采集器的智能模式,免费采集“值得购买”的产品价格,图片,标题和推荐者等信息.

  采集工具简介:

  优采云采集器是基于人工智能技术的网络爬虫工具. 它可以通过输入URL自动识别网页数据并完成数据,而无需进行配置采集. 它是业内首个支持三种操作系统(包括Windows,Mac和Linux)的数据采集软件.

  这是一个真正免费的数据采集软件. 导出采集结果没有任何限制. 没有编程知识的新手用户可以轻松实现数据采集要求.

  官方网站:

  采集对象介绍:

  “值得购买的东西”是一个在线购物产品推荐网站,它也是一个整合了媒体,购物指南,社区和工具属性的消费者决策平台. 网站成立于2010年6月30日,以早期折扣为主要内容,然后逐渐添加到海淘,原创(原创的接触,经验),信息,公共测试百科全书等渠道. 大多数内容是网民推荐的. 每天,通过网站本身,RSS,各种渠道,移动客户端和各种浏览器插件可以推送产品特价信息,以帮助网民购买更具成本效益的在线购物产品.

  采集字段:

  产品标题,产品链接,价格,产品描述,产品所属网站,主图像,推荐人,产品可用性

  功能点目录:

  如何获取列表+详细页面类型的网页

  如何下​​载图片

  采集结果预览:

  导出到Excel:

  导出为本地图片:

  让我们详细介绍如何免费采集“值得购买的东西”网站推荐的产品数据,我们以毛衣为例,具体步骤如下:

  步骤1: 下载并安装优采云采集器,然后注册并登录

  1. 单击此处打开优采云采集器的官方网站,下载并安装采集器软件工具-优采云采集器软件

  2. 单击注册以登录,注册新帐户,登录优采云采集器

  [提醒]您无需注册即可直接使用该采集器软件,但是切换到注册用户时,匿名帐户下的任务将会丢失,因此建议您在注册后使用它.

  优采云采集器是优采云cloud的产品. 如果您是优采云用户,则可以直接登录.

  第2步: 创建采集任务

  1. 复制“值得购买”毛衣的网页(需要搜索结果页面的URL,而不是首页的URL)

  单击此处以了解如何正确输入URL.

  2. 创建一个新的智能模式采集任务

  您可以直接在软件上创建采集任务,也可以通过导入规则来创建任务.

  单击此处以了解如何导入和导出采集规则.

  第3步: 配置采集规则

  1. 设置提取数据字段

  在智能模式下,输入URL后,软件可以自动识别页面上的数据并生成采集结果. 每种数据类型都对应一个采集字段. 我们可以右键单击该字段以进行相关设置,包括“修改字段名称”,“增加或减少字段”,“过程数据”等.

  单击此处以了解如何配置“采集”字段.

  由于采集软件已经识别出许多我们不需要的字段,并且我们只需要某些字段的内容,因此,在这种情况下,您可以清除以前识别的所有字段,然后手动添加字段,也可以根据该字段进行修改.

  我们添加了诸如产品标题,产品链接,价格,产品描述,产品网站和主图像之类的字段. 设置字段的效果如下:

  2. 使用深度采集功能提取详细信息页面数据

  “值得购买的”毛衣的大多数信息都显示在列表页面上,但是,如果我们要采集以获取有关引荐来源网址和所售产品状态的信息,则需要右键单击“产品链接

  ”使用深度采集功能可跳至采集的详细信息页面.

  单击此处以了解有关如何采集列表+详细页面类型网页的更多信息.

  在详细信息页面上,我们可以看到推荐器和产品可用性等信息,我们可以单击“添加字段”添加采集字段,该字段设置效果如下:

  第4步: 设置并启动采集任务

  1,设置采集任务

  添加采集数据后,我们可以启动采集任务. 开始之前,我们需要对采集任务进行一些设置,以提高采集的稳定性和成功率.

  单击“设置”按钮,然后在弹出的运行设置页面中设置运行设置和防阻塞设置. 这里我们选中“跳过继续采集”,设置为“ 2”秒请求等待时间,然后选中“不加载网页图片”,防阻塞设置将遵循系统默认设置,然后单击“保存”.

  单击此处以了解有关如何配置采集任务的更多信息.

  2,开始采集任务

  单击“保存并开始”按钮以在弹出页面上执行一些高级设置,包括定时开始,自动存储和下载图片. 在此示例中,未使用定时采集和自动存储功能. 选中将图片下载到本地的功能后,单击“开始”以运行采集器工具.

  单击此处以了解有关计时采集的更多信息.

  单击此处以了解有关自动存储的更多信息.

  单击此处以了解有关如何下载图片的更多信息.

  [温馨提示]免费版可以使用非定期定时器拍摄功能,并且图片下载功能是免费的. 个人专业版及更高版本可以使用高级计时功能和自动存储功能.

  3. 运行任务以提取数据

  任务启动后,它将自动采集数据. 我们可以从界面直观地看到程序的运行过程和采集结果. 采集结束后会有提醒.

  第5步: 导出和查看数据

  数据采集完成后,我们可以查看和导出数据. 优采云采集器支持多种导出方法(手动导出到本地,手动导出到数据库,自动发布到数据库,自动发布到网站)以及导出文件的格式(EXCEL,CSV,HTML和TXT),我们选择方法和文件类型,然后单击“确认导出”.

  单击此处以了解有关如何查看和清除采集数据的更多信息.

  单击此处以了解有关如何导出采集结果的更多信息.

  [提醒]: 所有手动导出功能都是免费的. 个人专业版及更高版本可以使用“发布到网站”功能.

  OF: 优采云采集器

  链接:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线