获取评测任务结果列表
下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数。
参数 | 类型 | 是否必填 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | ListEvaluationResults | 要执行的操作,取值:ListEvaluationResults。 |
Version | String | 是 | 2024-01-01 | API的版本,取值:2024-01-01。 |
PageNumber | Integer | 否 | - | 分页查询时的起始页码,从 1 开始,默认为 1 |
PageSize | Integer | 否 | - | 分页查询时每页显示的记录数,取值:
|
SortOrder | String | 否 | - | 指定排序顺序。 可指定值:
|
SortBy | String | 否 | CreateTime | 指定排序指标。 可指定值:
|
ProjectName | String | 否 | - | 项目名称 |
Filter | Object | 否 | - | 待查询模型评测结果的筛选条件 |
EvaluationJobId | String | 是 | - | 模型评测任务的ID |
下表仅列出本接口特有的返回参数。更多信息请参见返回结构。
参数 | 类型 | 示例值 | 描述 |
---|---|---|---|
TotalCount | Integer | - | 总评测结果数 |
PageNumber | Integer | - | 分页查询时的起始页码,从 1 开始,默认为 1 |
PageSize | Integer | - | 分页查询时每页显示的记录数,取值:
|
Items | Array of Object | - | 模型评测结果 |
{ "EvaluationJobId": "ej-20240326054800-gl9rp", "PageNumber": 1, "PageSize": 1, "SortOrder": "Desc", "SortBy": "CreateTime" }
{ "ResponseMetadata": { "RequestId": "202404111456299465E1DB51F5B325605A", "Action": "ListEvaluationResults", "Version": "2024-01-01", "Service": "ark", "Region": "cn-beijing" }, "Result": { "TotalCount": 1, "PageNumber": 1, "PageSize": 1, "Items": [ { "Id": "er-20240326054800-shhvj", "EvaluationJobId": "ej-20240326054800-gl9rp", "DatasetType": "AdminDataset", "AdminEvaluationDatasetId": "aed-20240227112053-bt425", "DatasetName": "ark-ff-mmlu-other-5shots", "DatasetDisplayName": "MMLU 其他学科", "EvaluationAbility": "MMLU", "ScoringWeight": 3107, "Method": "BuiltIn", "Metrics": null, "TokenUsage": { "TotalTokenCount": 0 }, "SamplesTosLocation": { "BucketName": "", "ObjectKey": "" }, "CreateTime": "2024-03-26T05:48:00Z", "UpdateTime": "2024-03-26T05:48:00Z" } ] } }
您可访问公共错误码,获取更多错误码信息。