火山引擎的智能语音技术,基于业界先进的语音识别、语音合成、自然语言理解等技术,广泛应用于智能客服、小说阅读、在线教育、会议纪要、音视频字幕等多个企业应用场景,赋能开发者,让您的产品能“听”会“说”。
目前主要提供以下产品,详细的产品介绍可查看各产品目录下的说明文档:
- 语音合成,适用于有声阅读、音视频创作、汽车等场景。
- 声音复刻,基于语音大模型技术,可实现秒级别录音的极速复刻,适用于有声阅读、音视频创作、汽车、新闻播报等场景。
- 精品音色定制,适用于有声阅读、音视频创作、智能硬件、智能客服、教育点读等多种业务场景。
- 音色转换,适用于音视频创作、虚拟形象、电商直播、游戏、汽车等场景。
- 语音识别
一句话识别,适用于语音输入法、语音内容搜索、语音对话等场景;
流式语音识别,适用于长语音输入,需要实时出结果的场景;
录音文件识别,适用于离线录音文件转写场景。 - 音视频字幕
音视频字幕生成,适用于视频剪辑、视频观看、视频会议等多个场景;
自动字幕打轴,适用于已有文本场景下的视频创作场景。