智能标签采集器(优采云采集器,标签编辑使用教学,帮助大家更好的使用)

优采云 发布时间: 2021-12-05 06:23

  智能标签采集器(优采云采集器,标签编辑使用教学,帮助大家更好的使用)

  优采云采集器是一款专业的互联网数据采集、处理、分析、挖掘软件,多数据库支持,用户可以在Access/MySQL/MsSQL/Sqlite/Oracle Release中保存和保存各类数据库,功能丰富,实用易操作,支持多种文件数据格式,图片、压缩文件、视频等任意格式文件均可轻松下载,兼容性强,适用于各种微软系统,运行流畅,完美匹配. 多种搜索引擎,强大的数据搜索能力,行业领先,用户无需下载其他搜索软件,今天小编为您带来优采云采集器,标签编辑与使用教学,助您更好使用本软件!

  

  优采云采集器标签编辑与使用示教图1

  优采云采集器标签编辑

  编辑数据内容标签定义,数据获取方式如下:

  一种)。从源代码中获取数据

  B)。生成固定格式数据

  C)。现有标签组合

  一种)。从源代码中获取数据:可以准确设置的标签的来源来自于默认页面的源代码、返回头信息和网页地址。

  或者分页、循环块、多页。

  数据提取方法包括:

  啊)。捕获之前和之后

  Ab).常规提取

  交流)。文本提取

  Ad).Xpath 提取

  Ae).JSON 提取

  B)。生成固定格式数据:可生成固定字符串、系统时间、随机字符串、随机数、系统时间戳、随机抽取信息

  C)。现有标签组合:可以组合现有标签生成新的标签内容

  啊)。捕获之前和之后

  通过设置开始和结束字符串获取中间的字符,可以在开始和结束字符串中设置通配符(*)

  Ab).常规提取

  支持两种正则,一种是纯正则,一种是参数正则。

  先介绍纯正典,例如,

  例如:before string (?[\s\S]*?) after string,这个正则表达式的效果其实和截取前后是一样的。

  如果需要获取所有代码,则是 ^(?[\s\S]*?)$。该功能的使用需要一定的规律性。

  关于参数规律性,通过参数组合生成内容。

  比如匹配“新用户注册”和作者“神秘嘉宾”的标题,代码如下:

  新用户注册

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线