本文介绍日志服务支持的数学统计函数语法及常见场景的使用示例。
说明
在日志服务分析语句(SQL 语句)中,需要使用单引号('')包裹代表字符串的字符,无符号包裹或被双引号("")包裹的字符为字段名或列名。例如'time'
代表字符串,time
或 "time"
代表字段名或列名。
函数名称 | 函数语法 | 说明 |
---|---|---|
BETA_CDF(α, β, v) | 在给定参数 α 和 β 的情况下,计算随机变量小于 v 的累积概率。 | |
CORR(KEY1, KEY2) | 计算两组值的相关度。 | |
COVAR_POP(KEY1, KEY2) | 计算两组值的总体协方差。 | |
COVAR_SAMP(KEY1, KEY2) | 计算两组值的样本协方差。 | |
INVERSE_NORMAL_CDF(x, y, p) | 根据给定的累积概率 p 来计算正态分布中的某个数值。 | |
NORMAL_CDF(x, y, v) | 计算一个正态分布中随机变量小于或等于特定值 v 的概率。 | |
STDDEV(KEY) | 计算值的样本标准差。 | |
STDDEV_SAMP(KEY) | 计算值的样本标准差。 | |
STDDEV_POP(KEY) | 计算值的总体标准差。 | |
VARIANCE(KEY) | 计算值的样本方差。 | |
VAR_SAMP(KEY) | 计算值的样本方差。 | |
VAR_POP(KEY) | 计算值的总体方差。 |
BETA_CDF 函数是 Beta 分布的累积分布函数(CDF),用于计算在给定参数 α 和 β 的情况下,随机变量小于 v 的累积概率。
语法格式
BETA_CDF(α, β, v)
参数说明
参数 | 说明 |
---|---|
α | Beta 分布参数,其值为 Double 类型,取值大于 0。 |
β | Beta 分布参数,其值为 Double 类型,取值大于 0。 |
v | 累积分布函数的输入参数,其值为 Double类型,取值范围为 |
返回值说明
返回值为 Double 类型。
场景
在 Beta 分布( 10 和 20)中,计算随机变量小于等于 0.5 的概率。
检索和分析语句
* | SELECT BETA_CDF(10, 20, 0.5)
检索和分析结果
CORR 函数用于计算两组值的相关度。返回的值越大表示两列的相关性越高。
语法格式
CORR(KEY1, KEY2)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型。 |
返回值说明
返回值为 Double 类型,范围为 [0,1]。
场景
计算 ReqTime
字段值与 ReqSize
字段值的相关度。
检索和分析语句
* | SELECT CORR(ReqTime,ReqSize)
检索和分析结果
COVAR_POP 函数用于计算两组值的总体协方差。
语法格式
COVAR_POP(KEY1, KEY2)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime
和 ReqSize
的总体协方差。
检索和分析语句
*|SELECT COVAR_POP(ReqTime, ReqSize) AS "总体协方差"
检索和分析结果
COVAR_SAMP 函数用于计算两组值的样本协方差。
语法格式
COVAR_SAMP(KEY1, KEY2)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 和 ReqSize 的样本协方差。
检索和分析语句
*|SELECT COVAR_SAMP(ReqTime, ReqSize) AS "样本协方差"
检索和分析结果
INVERSE_NORMAL_CDF 函数是反正态累积分布函数,用于根据给定的累积概率 p 来计算正态分布中的某个数值。
语法格式
INVERSE_NORMAL_CDF(x, y, p)
参数说明
参数 | 说明 |
---|---|
x | 正态分布的均值,double 类型。 |
y | 正态分布的标准差,double 类型,取值大于 0。 |
p | 概率值,double 类型,取值范围为 (0, 1)。 |
返回值说明
返回值为 Double 类型。
场景
在均值为 35、标准差为 6 的正态分布中,根据给定的累积概率 0.046 来计算该正态分布中的某个数值。
检索和分析语句
* | SELECT INVERSE_NORMAL_CDF(35, 6, 0.046)
检索和分析结果
NORMAL_CDF 函数用于计算一个正态分布中随机变量小于或等于特定值 v 的概率。
语法格式
NORMAL_CDF(x, y, v)
参数说明
参数 | 说明 |
---|---|
x | 正态分布的均值,其值为 Double 类型。 |
y | 正态分布的标准差,其值为 Double 类型,取值大于 0。 |
v | 累积分布函数的输入参数,其值为 Double类型。 |
返回值说明
返回值为 Double 类型。
场景
在一个均值为 20、标准差为 40 的正态分布中,计算随机变量小于或等于 60 的概率。
检索和分析语句
* | SELECT NORMAL_CDF(20, 40, 60)
检索和分析结果
STDDEV 函数用于计算值的样本标准差。
语法格式
STDDEV(KEY)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型或 Bigint 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 的样本标准差。
检索和分析语句
*|SELECT STDDEV(ReqTime) AS "样本标准差"
检索和分析结果
STDDEV_SAMP 函数用于计算值的样本标准差。
语法格式
STDDEV_SAMP(KEY)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型或 Bigint 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 的样本标准差。
检索和分析语句
*|SELECT STDDEV_SAMP(ReqTime) AS "样本标准差"
检索和分析结果
STDDEV_POP 函数用于计算值的总体标准差。
语法格式
STDDEV_POP(KEY)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型或 Bigint 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 的总体标准差。
检索和分析语句
*|SELECT STDDEV_POP(ReqTime) AS "总体标准差"
检索和分析结果
VARIANCE 函数用于计算值的样本方差。
语法格式
VARIANCE(KEY)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型或 Bigint 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 的样本方差。
检索和分析语句
*|SELECT VARIANCE(ReqTime) AS "样本方差"
检索和分析结果
VAR_SAMP 函数用于计算值的样本方差。
语法格式
VAR_SAMP(KEY)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型或 Bigint 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 的样本方差。
检索和分析语句
*|SELECT VAR_SAMP(ReqTime) AS "样本方差"
检索和分析结果
VAR_POP 函数用于计算值的总体方差。
语法格式
VAR_POP(KEY)
参数说明
参数 | 说明 |
---|---|
KEY | 字段、表达式,值为 Double 类型或 Bigint 类型。 |
返回值说明
返回值为 Double 类型。
场景
计算 ReqTime 的总体方差。
检索和分析语句
*|SELECT VAR_POP(ReqTime) AS "总体方差"
检索和分析结果