智能标签采集器(优采云采集器,标签编辑使用教学,帮助大家更好的使用)
优采云 发布时间: 2021-12-05 06:23智能标签采集器(优采云采集器,标签编辑使用教学,帮助大家更好的使用)
优采云采集器是一款专业的互联网数据采集、处理、分析、挖掘软件,多数据库支持,用户可以在Access/MySQL/MsSQL/Sqlite/Oracle Release中保存和保存各类数据库,功能丰富,实用易操作,支持多种文件数据格式,图片、压缩文件、视频等任意格式文件均可轻松下载,兼容性强,适用于各种微软系统,运行流畅,完美匹配. 多种搜索引擎,强大的数据搜索能力,行业领先,用户无需下载其他搜索软件,今天小编为您带来优采云采集器,标签编辑与使用教学,助您更好使用本软件!
优采云采集器标签编辑与使用示教图1
优采云采集器标签编辑
编辑数据内容标签定义,数据获取方式如下:
一种)。从源代码中获取数据
B)。生成固定格式数据
C)。现有标签组合
一种)。从源代码中获取数据:可以准确设置的标签的来源来自于默认页面的源代码、返回头信息和网页地址。
或者分页、循环块、多页。
数据提取方法包括:
啊)。捕获之前和之后
Ab).常规提取
交流)。文本提取
Ad).Xpath 提取
Ae).JSON 提取
B)。生成固定格式数据:可生成固定字符串、系统时间、随机字符串、随机数、系统时间戳、随机抽取信息
C)。现有标签组合:可以组合现有标签生成新的标签内容
啊)。捕获之前和之后
通过设置开始和结束字符串获取中间的字符,可以在开始和结束字符串中设置通配符(*)
Ab).常规提取
支持两种正则,一种是纯正则,一种是参数正则。
先介绍纯正典,例如,
例如:before string (?[\s\S]*?) after string,这个正则表达式的效果其实和截取前后是一样的。
如果需要获取所有代码,则是 ^(?[\s\S]*?)$。该功能的使用需要一定的规律性。
关于参数规律性,通过参数组合生成内容。
比如匹配“新用户注册”和作者“神秘嘉宾”的标题,代码如下:
新用户注册