获取评测任务结果
下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数。
参数 | 类型 | 是否必填 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | GetEvaluationResult | 要执行的操作,取值:GetEvaluationResult。 |
Version | String | 是 | 2024-01-01 | API的版本,取值:2024-01-01。 |
Id | String | 是 | - | 模型评测结果的ID |
下表仅列出本接口特有的返回参数。更多信息请参见返回结构。
参数 | 类型 | 示例值 | 描述 |
---|---|---|---|
Id | String | - | 模型评测结果的ID |
EvaluationJobId | String | - | 模型评测结果对应的模型评测任务的ID |
DatasetType | String | - | 模型评测结果对应的评测集种类 |
AdminEvaluationDatasetId | String | - | 模型评测结果对应的预置评测集的ID |
DatasetName | String | - | 模型评测结果对应的评测集名称 |
DatasetDisplayName | String | - | 模型评测结果对应的评测集展示名称 |
EvaluationAbility | String | - | 模型评测结果对应的评测集的能力维度 |
ScoringWeight | Integer | - | 模型评测结果的分数比重 |
DatasetTosLocation | Object | - | 用户自定义数据集的 TOS 地址 |
Method | String | - | 评测算法 |
Metrics | Object | - | 模型评测结果指标 |
TokenUsage | Object | - | 模型评测结果总 token 消耗量 |
SampleTosLocation | Object | - | 模型评测结果文件的 TOS 地址(最多 50 条样本) |
CreateTime | String | - | 模型评测结果创建时间,RFC3339格式 |
UpdateTime | String | - | 模型评测结果更新时间,RFC3339格式 |
{ "Id": "er-20240326054800-shhvj" }
{ "ResponseMetadata": { "RequestId": "202404111438083076CAB39885F31BD671", "Action": "GetEvaluationResult", "Version": "2024-01-01", "Service": "ark", "Region": "cn-beijing" }, "Result": { "Id": "er-20240326054800-shhvj", "EvaluationJobId": "ej-20240326054800-gl9rp", "DatasetType": "AdminDataset", "AdminEvaluationDatasetId": "aed-20240227112053-bt425", "DatasetName": "ark-ff-mmlu-other-5shots", "DatasetDisplayName": "MMLU 其他学科", "EvaluationAbility": "MMLU", "ScoringWeight": 3107, "Method": "BuiltIn", "Metrics": null, "TokenUsage": { "TotalTokenCount": 0 }, "SamplesTosLocation": { "BucketName": "", "ObjectKey": "" }, "CreateTime": "2024-03-26T05:48:00Z", "UpdateTime": "2024-03-26T05:48:00Z" } }
您可访问公共错误码,获取更多错误码信息。