You need to enable JavaScript to run this app.
导航
差异模式统计函数
最近更新时间:2024.11.25 11:52:58首次发布时间:2024.11.22 11:13:39

本文介绍日志服务支持的差异模式统计函数语法及常见场景的使用示例。

说明

目前,机器学习函数正处于公测阶段。

函数列表

函数

说明

pattern_diff

根据给定的字段样本和判断条件,分析影响该条件划定的差异模式集合。

pattern_diff

函数语法

  • 语法格式

    pattern_diff(array_char_value, array_char_name, array_numeric_value, array_numeric_name, condition, supportScore,posSampleRatio,negSampleRatio ) 
    
  • 参数说明

    参数

    数据类型

    说明

    array_char_value

    Array

    字符型数据的输入列。

    说明

    array_char_valuearray_numeric_value不能同时为空。

    array_char_name

    Array

    字符型数据的输入列的名称。

    array_numeric_value

    Array

    数值型数据的输入列。

    array_numeric_name

    Array

    数值型数据的输入列的名称。

    condition

    String

    筛选数据的条件。条件为 True 则为正样本,条件为 False 则为负样本。

    supportScore

    Double

    正负样本在进行模式挖掘时的支持度。取值为 (0,1]。

    posSampleRatio

    Double

    正样本的采样率。默认为 0.5,表示只取 50% 正样本集合。取值为 (0,1]。

    negSampleRatio

    Double

    负样本的采样率,默认为 0.5,表示只取 50% 负样本集合。取值为 (0,1]。

  • 返回值说明
    如果输入值为 NULL,则将返回 NULL。

函数示例

检索与分析语句

* | select pattern_diff(array[client_ip], array['client_ip'], array[stamp,value], array['stamp','value' ], ReqSize > 2000, 0.1,0.1,
      0.1) from (select client_ip, stamp,value,ReqSize,RespSize limit 10000)