批量输入多个关键词的采集步骤及教程说明*敏*感*词*法

优采云 发布时间: 2021-08-17 18:33

  批量输入多个关键词采集步骤及教程说明*敏*感*词*法

  采集scene

  搜索1688热门行情首页:输入关键词search、采集搜索,获取多个商品列表数据。

  采集field

  产品名称、主图链接、价格、保证等字段

  

  点击查看高清大图,下图同理。

  采集Result

  采集 结果可以导出为Excel、CSV、HTML、数据库等格式。导出到 Excel 示例:

  

  教程说明

  本文制作时间:2020/9/28 优采云版本:V8.1.22

  如因网页改版导致网址或步骤无效,无法采集到目标数据,请联系官方客服,我们会及时更正。

  采集Steps

  步骤一、打开网页

  步骤二、批量输入多个关键词并搜索

  步骤三、使用【智能识别】,所有商品列表中采集数据

  步骤四、编辑字段

  步骤五、设置滚动并修改【循环翻页】XPath

  步骤六、Start采集

  具体步骤如下:

  步骤一、打开网页

  在首页【输入框】输入目标网址,点击【开始采集】,优采云会自动打开网页。

  

  特别说明:

  一个。打开网页后,如果开启【自动识别】,请点击【不再自动识别】或【取消识别】将其关闭。因为本文不适合使用【自动识别】。

  B. 【自动识别】适用于自动识别网页列表、滚动、翻页。识别成功后可以直接启动采集获取数据。详情请点击查看【自动识别】教程

  步骤二、批量输入多个关键词并搜索

  打开网页后,通过以下步骤批量输入多个关键词。

  1、 输入 1 关键词 并搜索

  2、 批量输入多个关键词

  1、 输入 1 关键词 并搜索

  选择搜索框,在操作提示框中点击【输入文字】,输入关键词并保存。

  选择【搜索】按钮,在操作提示框中点击【点击此按钮】,出现关键词的搜索结果。

  

  2、 批量输入多个关键词

  ①在【打开网页1】的步骤后,添加一个【循环】。

  ②将【输入文本】和【点击元素】都拖入【循环】中。

  

  ③ 进入【周期】设置页面。选择循环方式为【文本列表】,点击按钮,输入我们准备好的关键词(可以同时输入多个关键词,每行一个)并保存。

  ④ 进入【输入文本】设置页面,清除文本内容,勾选【使用当前循环中的文本填充输入框】并保存。

  

  特别说明:

  一个。示例中输入的关键词为[裤子]、[衣服]和[鞋子],可根据需要更换。

  B.一次最多输入 2W 个关键字。可以先准备一个收录多个关键字的文档,然后复制粘贴到优采云中。

  步骤三、使用【智能识别】,所有商品列表中采集数据

  点击右上角操作提示框中的【自动识别】,识别成功后点击【生成采集设置】。

  

  特别说明:

  一个。打开网页后,默认开启智能识别。在识别过程中,您可以随时【取消识别】或【不再智能识别】

  B.智能识别成功。一个网页可能有多组数据。 优采云会识别所有数据,然后智能推荐最常用的集合。如果推荐的不是你想要的,你可以自己【切换识别结果】

  步骤四、编辑字段

  【自动识别】提取字段后,我们可以自定义编辑字段,比如修改字段名称,删除多余的字段。

  

  步骤五、设置滚动并修改【循环翻页】XPath

  1、设置滚动

  点击搜索和翻页后,网页默认只显示前60个产品列表。向下滚动到页面底部以加载所有 100 种产品的列表。您还需要在优采云 中设置滚动。

  进入【点击元素】和【点击翻页】设置页面,点击【页面加载后】,设置【页面加载后向下滚动】,滚动方式为【向下滚动一屏】,【滚动次数】 10次​​,【每次间隔】3秒,设置后保存。

  

  特别说明:

  一个。设置中的滚动次数和时间间隔,请根据采集要求和网页加载条件进行设置,它们不是静态的,详情请点击查看处理滚动加载数据的网页教程

  2、Modify 【循环翻页】XPath

  自动识别生成的XPath可能不准确,导致采集时无法翻页,重复采集一个页面,此时需要修改【循环翻页】的XPath .

  进入【循环翻页】设置页面,修改XPath为://BUTTON[@class='next-btn next-btn-normal next-btn-large next-pagination-item next'][not( @禁用)]

  

  特别说明:

  一个。如何修改XPath?这里需要一些 XPath 知识。点击查看XPath学习和示例教程

  步骤六、Start采集

  1、 点击【采集】和【启动本地采集】。启动优采云后自动采集数据。

  

  特别说明:

  一个。 【本地采集】为采集使用自己的电脑,【云采集】使用优采云提供的云服务器采集,点击查看本地采集与云采集详细解释。

  2、采集 完成后,选择合适的导出方式导出数据。支持导出到 Excel、CSV、HTML、数据库等。这里导出到 Excel。数据示例:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线