通过 StartSubtitle
接口,将用户语音转为字幕文本,字幕结果可通过客户端或服务端来接收。支持生成以下 2 种类型的字幕:
两种类型的字幕所用服务、支持识别的语种、费用等均存在差异。详细说明,请参见 实时通话字幕和翻译。
注意
onRoomBinaryMessageReceived
回调来接收字幕数据。Url
地址。调用该接口生成字幕前,先按照需求开通相关服务:
需求 | 所需开通服务 |
---|---|
按源语言生成字幕 |
|
生成指定语言的字幕 |
|
单账号下 QPS 不得超过 60。
关于调用接口的请求结构、公共参数、签名方法、返回结构,参看调用方法。
下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数。
参数 | 类型 | 是否必选 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | StartSubtitle | 接口名称。当前 API 的名称为 StartSubtitle 。 |
Version | String | 是 | 2024-06-01 | 接口版本。当前 API 的版本为 2024-06-01 。 |
参数 | 类型 | 是否必选 | 示例值 | 描述 |
---|---|---|---|---|
AppId | String | 是 |
| 音视频应用的 ID。如何获取 AppId? |
RoomId | String | 是 |
| 需生成字幕的 RTC 房间 ID。 |
TaskId | String | 是 |
| 设置字幕任务 ID,用于唯一标识字幕任务。 说明
|
LanguageConfig | Object | 是 |
| 设置用户语音的原始语种;若需翻译字幕,还需设置翻译目标语种。 |
SourceLanguages | Object[] | 是 |
| 设置用户语音的原始语种。 注意
|
RoomTargetLanguages | String[] | 否 |
| 字幕需翻译为的目标语种,请填写语种代号。支持翻译的语种及代号? 注意
|
DistributionMode | Integer | 是 |
| 指定字幕结果接收地址,支持的取值及含义如下:
注意
|
ServerMessage | Object | 否 |
| 接收字幕的服务器的 URL 地址和鉴权签名。 注意 当 |
Signature | String | 否 |
| 鉴权签名。 |
Url | String | 否 |
| 接收字幕结果的 URL 地址。需支持 HTTP(S) 协议。 |
ReceiverList | String[] | 否 |
| 字幕返回给客户端时,可指定字幕接收用户。
注意 该参数仅在 |
本接口无特有的返回参数,公共返回参数请见返回结构。
其中,返回值 Result
仅在请求成功时返回 ok
,请求失败时返回空。
以生成字幕并翻译为英文,字幕结果同时通过客户端和服务端接收为例:
POST https://rtc.volcengineapi.com?Action=StartSubtitle&Version=2024-06-01 { "AppId": "661e****543cf", "RoomId": "Room1", "TaskId": "Task1", "LanguageConfig": { "SourceLanguages": [ { "UserId": "user1", "LanguageCode": [ "en" ] }, { "UserId": "user2", "LanguageCode": [ "zh" ] } ], "RoomTargetLanguages": [ "zh" ] }, "DistributionMode": 3, "ServerMessage": { "Signature": "TestSignature", "Url": "http://127.0.0.0:8080/subtitlemsg" }, "ReceiverList": [ "user1", "user2" ] }
{ "Result": "ok", "ResponseMetadata": { "RequestId": "20230604110420****100232280022D31", "Action": "StartSubtitle", "Version": "2024-06-01", "Service": "rtc", "Region": "cn-north-1" } }