本文介绍日志服务支持的差异模式统计函数语法及常见场景的使用示例。
说明
目前,机器学习函数正处于公测阶段。
函数 | 说明 |
---|---|
根据给定的字段样本和判断条件,分析影响该条件划定的差异模式集合。 |
语法格式
pattern_diff(array_char_value, array_char_name, array_numeric_value, array_numeric_name, condition, supportScore,posSampleRatio,negSampleRatio )
参数说明
参数 | 数据类型 | 说明 |
---|---|---|
array_char_value | Array | 字符型数据的输入列。 说明
|
array_char_name | Array | 字符型数据的输入列的名称。 |
array_numeric_value | Array | 数值型数据的输入列。 |
array_numeric_name | Array | 数值型数据的输入列的名称。 |
condition | String | 筛选数据的条件。条件为 True 则为正样本,条件为 False 则为负样本。 |
supportScore | Double | 正负样本在进行模式挖掘时的支持度。取值为 (0,1]。 |
posSampleRatio | Double | 正样本的采样率。默认为 0.5,表示只取 50% 正样本集合。取值为 (0,1]。 |
negSampleRatio | Double | 负样本的采样率,默认为 0.5,表示只取 50% 负样本集合。取值为 (0,1]。 |
返回值说明
如果输入值为 NULL,则将返回 NULL。
检索与分析语句
* | select pattern_diff(array[client_ip], array['client_ip'], array[stamp,value], array['stamp','value' ], ReqSize > 2000, 0.1,0.1, 0.1) from (select client_ip, stamp,value,ReqSize,RespSize limit 10000)