获取评测任务结果
下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数。
参数 | 类型 | 是否必填 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | GetEvaluationResult | 要执行的操作,取值:GetEvaluationResult。 |
Version | String | 是 | 2024-01-01 | API的版本,取值:2024-01-01。 |
Id | String | 是 | - | 模型评测结果的ID |
下表仅列出本接口特有的返回参数。更多信息请参见返回结构。
参数 | 类型 | 示例值 | 描述 |
---|---|---|---|
Id | String | - | 模型评测结果的ID |
EvaluationJobId | String | - | 模型评测结果对应的模型评测任务的ID |
DatasetType | String | - | 模型评测结果对应的评测集种类 |
AdminEvaluationDatasetId | String | - | 模型评测结果对应的预置评测集的ID |
DatasetName | String | - | 模型评测结果对应的评测集名称 |
DatasetDisplayName | String | - | 模型评测结果对应的评测集展示名称 |
EvaluationAbility | String | - | 模型评测结果对应的评测集的能力维度 |
ScoringWeight | Integer | - | 模型评测结果的分数比重 |
DatasetTosLocation | Object | - | 用户自定义数据集的 TOS 地址 |
Method | String | - | 评测算法 |
Metrics | Object | - | 模型评测结果指标 |
TokenUsage | Object | - | 模型评测结果总 token 消耗量 |
SampleTosLocation | Object | - | 模型评测结果文件的 TOS 地址(最多 50 条样本) |
CreateTime | String | - | 模型评测结果创建时间,RFC3339格式 |
UpdateTime | String | - | 模型评测结果更新时间,RFC3339格式 |
{ "Id": "er-20240326054800-shhvj" }
text
{
"ResponseMetadata": {
"RequestId": "202404111438083076CAB39885F31BD671",
"Action": "GetEvaluationResult",
"Version": "2024-01-01",
"Service": "ark",
"Region": "cn-beijing"
},
"Result": {
"Id": "er-20240326054800-shhvj",
"EvaluationJobId": "ej-20240326054800-gl9rp",
"DatasetType": "AdminDataset",
"AdminEvaluationDatasetId": "aed-20240227112053-bt425",
"DatasetName": "ark-ff-mmlu-other-5shots",
"DatasetDisplayName": "MMLU 其他学科",
"EvaluationAbility": "MMLU",
"ScoringWeight": 3107,
"Method": "BuiltIn",
"Metrics": null,
"TokenUsage": {
"TotalTokenCount": 0
},
"SamplesTosLocation": {
"BucketName": "",
"ObjectKey": ""
},
"CreateTime": "2024-03-26T05:48:00Z",
"UpdateTime": "2024-03-26T05:48:00Z"
}
}
json
您可访问公共错误码,获取更多错误码信息。