网页数据抓取软件(以京东为例,演示数据抓取工具的使用方法: )

优采云 发布时间: 2021-09-16 05:05

  网页数据抓取软件(以京东为例,演示数据抓取工具的使用方法:

)

  以京东为例,演示如何使用数据捕获工具:

  单击uibot编辑器工具栏上的[data capture]按钮打开数据捕获工具:

  

  数据捕获工具需要首先选择一个目标,然后单击选择目标按钮:

  

  此目标是采集的数据字段。如果需要采集商品名称,请首先选择商品名称:

  

  如果要采集商品价格,首先选择商品价格元素、采集其他字段等,如评估数量:

  

  点击选择目标后,进入第二步,然后选择同类目标。Uibot将自动分析目标之间的关系,并进一步推断页面中的所有相关元素:

  

  目标选择完成后,如果两个目标类型一致且存在关联关系,则进入本页面,可以选择采集内容是文本还是链接;我这里的采集数据是商品价格,所以只能选择文本。单击“确定”进入下一步:

  

  成功捕获数据后,将显示捕获的数据列。单击捕获更多数据按钮并重复前面的步骤。您可以添加多个数据捕获列,例如产品名称、评估和其他数据。您可以单击打开的数据或捕获链接:

  

  数据捕获完成后,点击下一步按钮进入捕获页面翻页,可以一次捕获多页数据:

  

  单击捕获翻页按钮并选择数据页面上的[下一页]按钮,以在数据捕获期间自动翻页以捕获数据:

  

  翻页和爬网完成后,批量爬网数据的组件将自动添加到编辑器中:

  

  组件属性设置的屏幕截图如上图所示。目标是要捕获的数据来自哪个元素。元数据定义是要捕获的数据特征和相应的字段名设置。翻页元素对应于翻页按钮的元素选择特征。您可以在此处设置要提取的页数。默认设置为5,即取5页数据后退出:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线