You need to enable JavaScript to run this app.
导航
API接入FAQ
最近更新时间:2024.01.29 16:42:10首次发布时间:2022.07.14 20:12:07

Q:音频文件格式和大小有什么限制?

A:音频文件有这几处限制:

  1. 音频时长需小于一小时;
  2. 音频大小需小于150MB;
  3. 支持MP3、MP4、WAV、OGG等音视频格式。

Q:不同类型识别的区别?

A:字幕服务支持说话、唱歌、自动三种类型识别(audio_type),用户根据音频类型在参数中设置。说话类型只识别音频中的说话部分,唱歌类型只识别唱歌部分,自动类型对于说话和唱歌部分均可识别。

Q:常见错误信息

A:这里列出常见的接入错误和解决办法:

  • 服务未授权

    • 错误信息:{"id": "", "code": 1022, "message": "requested grant not found"}
    • 错误原因:未能够正确匹配授权,火山控制台没有开启或添加字幕服务;可以阅读控制台说明文档开通字幕服务
  • 鉴权失败

    • 错误信息:{"id":"","code":1022,"message":"authenticate request: authentication signature from request: invalid authorization method requested: bearer xzgdougwgig3mmzhexx2qhvazheebq8jumx","duration":0,"utterances":null}
    • 错误原因:鉴权头设置错误,可以阅读鉴权文档正确设置鉴权
  • quota 超限

    • 错误信息:{"id": "", "code": 1022, "message": "quota exceeded for types duration"}
    • 错误原因:应用的时长超限,可以阅读控制台说明文档,在控制台申请更多时长。
  • 音频转码失败

    • 错误信息:{"id":"335187b8-ccb8-4eeb-8d0e-d8b8aeb77bc6","code":1022,"message":"ffmpeg error (see stderr output for detail)","duration":0,"utterances":[]}
    • 错误原因:音频数据转码失败,请检查传入的音频文件,不能是以下类型:本地文件路径、非音频格式、PCM 格式音频。

Q:自动字幕打轴服务是如何对输入文本进行分句的?

  • 当文本不包含标点时,会根据换行符/回车分句。
  • 当文本包含标点时,会根据句号、问号、叹号、分号、换行符/回车进行分句。
  • 建议尽可能将文本中每个分句使用回车换行,用空格代替标点;或者删除分句中出现的句号、问号、叹号和分号。