免费采集器(优采云 问:如何过滤列表中的前N个数据?)

优采云 发布时间: 2021-12-30 01:34

  免费采集器(优采云

问:如何过滤列表中的前N个数据?)

  软件介绍

  优采云

采集器是一款超高效的信息数据采集软件,几乎支持所有网站数据采集。该软件不仅在网页内容采集方面效率高,而且在采集的同时还能生成Excel表格。api 数据库文件和其他呈现方法。

  

  软件特点

  一键提取数据

  简单易学,通过可视化界面,鼠标点击即可采集数据

  快速高效

  内置一套高速浏览器内核,外加HTTP引擎模式,实现快速数据采集

  适用于各种网站

  能够采集

99%的互联网站点,包括单页应用Ajax加载等动态类型站点

  软件功能

  向导模式

  简单易用,轻松通过鼠标点击自动生成

  脚本定期运行

  可按计划定时运行,无需人工

  原装高速核心

  自研浏览器内核,速度快,远超对手

  智能识别

  可智能识别网页中的列表和表单结构(多选框下拉列表等)

  广告拦截

  自定义广告拦截模块,兼容AdblockPlus语法,可添加自定义规则

  各种数据导出

  支持 Txt、Excel、MySQL、SQLServer、SQlite、Access、网站等。

  指示

  第一步:输入采集

网址

  打开软件,新建一个任务,输入需要采集的网址。

  第二步:智能分析,全程自动提取数据

  进入第二步后,优采云

采集

器自动智能分析网页,从中提取列表数据。

  第三步:将数据导出到表格、数据库、网站等。

  运行任务,将采集到的数据导出到Csv、Excel及各种数据库,支持api导出。

  常见问题

  问题:如何过滤列表中的前N个数据?

  1.有时候我们需要过滤采集

到的列表,比如过滤掉第一组数据(采集

表的时候,过滤掉表列名)

  2.在列表模式菜单中点击设置列表xpath

  Q:如何通过抓包获取cookie并手动设置?

  1.首先使用谷歌浏览器打开要采集的网站,并登录。

  2.然后按F12,会出现开发者工具,选择Network

  3.然后按F5刷新下一页并选择其中一个请求。

  4. 复制完成后,在优采云

采集

器中,编辑任务,进入第三步指定HTTP Header。

  更新日志

  1.添加插件功能

  2.添加export txt(一个文件另存为一个文件)

  3.多值连接器支持换行

  4.修改数据处理的文本映射(支持查找替换)

  5.修复登录时DNS问题

  6.修复图片下载问题

  7.修复一些json问题

  安装方法

  1、下载软件

  2、使用压缩软件解压软件(推荐使用winrar压缩软件)

  3、开始安装

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线