算法 自动采集列表(智能巡检使用流式图算法和流式分解算法进行数据巡检 )
优采云 发布时间: 2021-10-26 01:04算法 自动采集列表(智能巡检使用流式图算法和流式分解算法进行数据巡检
)
日志服务提供智能巡检功能,对监控指标或业务日志等数据进行自动、智能、自适应的异常巡检。目前智能巡检采用流图算法和流分解算法进行数据巡检。本文介绍了流图算法和流分解算法的适用场景、参数配置、预览说明等。
流图算法
流图算法是基于Time2Graph系列模型中的原理开发的,可以降低数据的整体噪声,分析异常数据的相对偏差。流图算法适用于*敏*感*词*、嘈杂、不显眼的时间序列的异常检测。有关更多信息,请参阅使用进化状态图进行时间序列事件预测。
场景描述
流图算法使用在线机器学习技术实时学习和推断每条数据。适用于一般的时间序列异常检测场景,包括:
参数配置
您可以在创建智能检测作业向导页面的算法配置区完成算法配置。具体操作请参考。
每个参数的说明如下表所示。
参数说明
时序段数
对时间序列值进行划分,将时间序列离散化,构建时间序列演化图,减少噪声的影响。建议预览不同时序段下的检测结果,选择最合适的值。
观察长度
要观察的历史数据点的数量。
灵敏度
异常分数输出的敏感性。
预览说明
预览示例如下图所示。
流分解算法
流分解算法是基于 RobustSTL 系列模型中的原理开发的。它可以批量处理数据流,但具有更高的计算成本。适用于小规模业务指标数据的精准检查。在*敏*感*词*数据场景下,建议您拆分数据或使用流图算法。有关更多信息,请参阅 RobustSTL:长期序列的稳健季节性趋势分解算法。
场景描述
流分解算法适用于周期性数据序列的检查,要求数据的周期性更明显。例如,适用于周期性变化明显的业务指标的检查场景。
说明周期性数据在日常生活中比较常见,比如游戏访问次数和客户订单数量。
参数配置
您可以在创建智能检测作业向导页面的算法配置区完成算法配置。具体操作请参考。
每个参数的说明如下表所示。
参数说明
周期长度
以点为单位描述一个周期内数据序列中收录的数据点数。数据系列默认为天数。例如,如果粒度为120秒,周期为天,那么一个周期中收录的数据点数为24×60×60/120=720。
注意周期长度必须是时间序列的周期,否则会影响检查效果。
灵敏度
异常分数输出的敏感性。
预览说明
预览流式分解算法的异常检测结果时,系统默认选择最后4个周期的数据进行预览。预览示例如下图所示。
对于嘈杂的周期数据,您需要在预览页面上继续调试,直到配置了确切的周期长度。在噪声较大的情况下,由于噪声干扰,可能存在漏报或虚报。预览示例如下图所示。