You need to enable JavaScript to run this app.
导航
产品简介
最近更新时间:2024.04.07 17:25:38首次发布时间:2022.12.14 16:13:12

火山引擎的智能语音技术,基于业界先进的语音识别、语音合成、自然语言理解等技术,广泛应用于智能客服、小说阅读、在线教育、会议纪要、音视频字幕等多个企业应用场景,赋能开发者,让您的产品能“听”会“说”。

目前主要提供以下产品,详细的产品介绍可查看各产品目录下的说明文档:

  • 语音合成,适用于有声阅读、音视频创作、汽车等场景。
  • 声音复刻,基于语音大模型技术,可实现秒级别录音的极速复刻,适用于有声阅读、音视频创作、汽车、新闻播报等场景。
  • 精品音色定制,适用于有声阅读、音视频创作、智能硬件、智能客服、教育点读等多种业务场景。
  • 音色转换,适用于音视频创作、虚拟形象、电商直播、游戏、汽车等场景。
  • 语音识别
    一句话识别,适用于语音输入法、语音内容搜索、语音对话等场景;
    流式语音识别,适用于长语音输入,需要实时出结果的场景;
    录音文件识别,适用于离线录音文件转写场景。
  • 音视频字幕
    音视频字幕生成,适用于视频剪辑、视频观看、视频会议等多个场景;
    自动字幕打轴,适用于已有文本场景下的视频创作场景。