You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

豆包·语音大模型创业者加速计划

为 AI 语音初创企业提供包括语音合成、声音复刻和语音识别大模型资源
3个月免费

3个月免费

资源支持,以产品代金券的方式发放至企业账户 查看活动详情 >>查看活动详情 >>
3种大模型能力

3种大模型能力

免费支持,AI语音新产品有长期明确的发展和迭代计划 查看活动详情 >>查看活动详情 >>
1000家创业企业扶持

1000家创业企业扶持

利用AI语音进行新产品研发的1000家初创公司 查看活动详情 >>查看活动详情 >>
3个月免费

3个月免费

资源支持,以产品代金券的方式发放至企业账户 查看活动详情 >>查看活动详情 >>
3种大模型能力

3种大模型能力

免费支持,AI语音新产品有长期明确的发展和迭代计划 查看活动详情 >>查看活动详情 >>
1000家创业企业扶持

1000家创业企业扶持

利用AI语音进行新产品研发的1000家初创公司 查看活动详情 >>查看活动详情 >>

优惠套餐

限时特惠,一键获取抖音、剪映、飞书同款服务
HOT
语音合成大模型
在情绪演绎、拟人度等各方面带来更生动、更具情感表现力的听觉体验。
依托新一代大模型能力
情绪更有表现力、韵律更为自然
满足不同用户的个性化需求
新客专享
限购5个
36.00/个
45元/个
依托新一代大模型能力
情绪更有表现力、韵律更为自然
满足不同用户的个性化需求
新客专享
限购5个
640.00/个
800元/个
依托新一代大模型能力
情绪更有表现力、韵律更为自然
满足不同用户的个性化需求
新客专享
限购5个
5600.00/个
7000元/个
立即购买
HOT
声音复刻大模型
超轻量级音色定制方案,开放环境中录制秒级别录音即可极速拥有专属定制音色。
超低录制成本
秒级别快速复刻
高还原音色特点
新客专享
限购5个
60.00/个
75元/个
超低录制成本
秒级别快速复刻
高还原音色特点
新客专享
限购5个
1120.00/个
1400元/个
立即购买
短文本语音合成
单次支持300字语音合成,效果自然逼真
20+款免费精品音色
默认赠送100并发
享抖音、剪映、番茄小说同款服务
新客专享
限购5个
4000.00/个
5000元/个
立即购买
精品长文本语音合成
单次支持10万字以内文本一键转语音
20+款免费精品音色
支持多语言、多风格
单次调用最高10万字文本
新客专享
限购5个
80.00/个
100元/个
20+款免费精品音色
支持多语言、多风格
单次调用最高10万字文本
新客专享
限购5个
1440.00/个
1800元/个
含情感预测功能
自动区分旁白和对话,对话支持七大情感
11款多情感音色
新客专享
限购5个
160.00/个
200元/个
含情感预测功能
自动区分旁白和对话,对话支持七大情感
11款多情感音色
新客专享
限购5个
2880.00/个
3600元/个
立即购买
一句话识别
短语音实时识别成文本
可识别中/英/日/法/俄/西语等10+种语种
具备时间戳、自动标点能力
适用语音消息转写、语音搜索等场景
新人专享
限购5个
1200.00/个
1500元/个
可识别中/英/日/法/俄/西语等10+种语种
具备时间戳、自动标点能力
适用语音消息转写、语音搜索等场景
1760.00/个
2200元/个
立即购买
限时折扣
流式语音识别
将长音频实时识别成文字,实现“边说话边出文字”效果
可识别中/英/日/法/俄/西语等10+种语种
具备智能分句、时间戳能力
适用实时会议字幕、直播字幕、智能外呼
新客专享
限购5个
1200.00/个
1500元/个
可识别中/英/日/法/俄/西语等10+种语种
具备智能分句、时间戳能力
适用实时会议字幕、直播字幕、智能外呼
新客专享
限购5个
1440.00
1800元/个
立即购买
限时折扣
录音文件识别
支持5小时内音频文件转写成文本
半实时返回识别结果
包含自动标点、语义顺滑、数字规整等功能
适用于准实时外呼质检、有声内容转写等场景
6折特惠
新客专享
限购5个
690.00/个
1150元/个
半实时返回识别结果
包含自动标点、语义顺滑、数字规整等功能
适用于准实时外呼质检、有声内容转写等场景
6折特惠
新客专享
限购5个
1080.00/个
1800元/个
可识别中/英/日/法/俄/西语等10+种语种
含说话人识别、智能分句、语义顺滑能力
适用会议记录总结、智能外呼等场景
新客专享
限购5个
510.00/个
850元/个
可识别中/英/日/法/俄/西语等10+种语种
含说话人识别、智能分句、语义顺滑能力
适用会议记录总结、智能外呼等场景
新客专享
限购5个
780.00/个
1300元/个
立即购买
音视频字幕生成
支持自动将音/视频中的语音、歌词识别转换为文本
可识别中/英/日/法/俄/西语等10+种语种
具备智能分句、时间戳等能力
适用视频剪辑、视频观看、视频会议场景
新客专享
限购5个
2000.00/个
2500元/个
可识别中/英/日/法/俄/西语等10+种语种
具备智能分句、时间戳等能力
适用视频剪辑、视频观看、视频会议场景
新客专享
限购5个
3600.00/个
4500元/个
立即购买

核心产品

丰富领先的AI语音能力,接入快速便捷
语音合成语音合成语音合成
语音合成
精品音色定制精品音色定制精品音色定制
精品音色定制
语音识别语音识别语音识别
语音识别
音视频字幕音视频字幕音视频字幕
音视频字幕

语音合成

音人而异,打造多样之声
提供适用不同性格、全年龄段音色,适配小说、汽车、金融、教育、视频配音、新闻播报、游戏等领域。
以声传情,让交互更有温度
提供丰富的情感演绎能力,可淋漓尽致地表达出喜怒哀厌悲惊等多种情感风格,打造极致听觉体验。
稳定流畅,适配不同网络环境
提供在线+离线配套端云一体方案,在离线音色音质趋于一致。自适应网络进行离在线切换,有效避免无网、弱网时的延迟卡顿。
语音合成

精品音色定制

业界领先的合成技术
提供业界领先的端到端语音合成技术,高度还原真人录音的发音特色,提供自然流畅的听感体验。
丰富的发音人资源
提供丰富的发音人与专业录音棚资源,为企业筛选出契合品牌形象的专属音色。
配套的专业服务
拥有业内资深语音语言学专家和配音导演团队,为录音数据效果与质量保驾护航。
精品音色定制

语音识别

精准识别,技术领先
采用业内先进的Conformer端到端语音识别框架,基于海量GPU训练资源,与抖音、飞书等业务深度合作,准确率业内领先。
场景丰富,语种多样
适配客服、娱乐、办公场景,深度打磨金融、汽车、电商、游戏等行业识别效果,拥有中英日法等多语种识别能力。
简单接入,轻松调优
支持公有云和私有化接入,通过自学习平台免费自助上传热词,快速调优识别效果。
语音识别

音视频字幕

垂直领域,定向识别
业内先进的语音识别技术,长期与抖音、剪映等亿量级音视频平台合作,沉淀海量数据,不断打磨字幕能力。
语种丰富,超低延时
支持中英日韩俄法西等多语言识别,涵盖粤语、吴语、闽南语等多方言识别,字幕生成超低延时。
特色能力,智能高效
精心打造字幕打轴、歌词打轴、水词标记等能力,支持中文方言、说话唱歌等混合识别。
音视频字幕

语音合成

音人而异,打造多样之声、以声传情,让交互更有温度、稳定流畅,适配不同网络环境。
语音合成

精品音色定制

业界领先的合成技术、丰富的发音人资源、配套的专业服务。
精品音色定制

语音识别

精准识别,技术领先、场景丰富,语种多样、简单接入,轻松调优。
语音识别

音视频字幕

垂直领域,定向识别、语种丰富,超低延时、特色能力,智能高效。
音视频字幕

语音合成

语音合成
音人而异,打造多样之声、以声传情,让交互更有温度、稳定流畅,适配不同网络环境。
精品音色定制
业界领先的合成技术、丰富的发音人资源、配套的专业服务。
语音识别
精准识别,技术领先、场景丰富,语种多样、简单接入,轻松调优。
音视频字幕
垂直领域,定向识别、语种丰富,超低延时、特色能力,智能高效。

产品优势

多维度产品优势,助力您的企业高效拓展
多种产品形态
支持多场景、高效率接入

快速接入

原子能力到解决方案的多层次服务
20+种公有云/私有化语音产品
在/离线、SDK等多种接入
领先自研算法
抖音、剪映同源算法

算法实力

日均亿级别大流量调用,服务稳定
高品质音色模型,打造国民级爆款
海量数据积累,识别准确率98%
多领域打磨
重点行业能力积累

领域覆盖

娱乐、汽车、金融、客服、教育等
不同领域专有名词高效打磨
个性化定制,助力打造企业形象
30+语种覆盖
全球重点语言覆盖

助力企业出海

中、英、日、法等语种智能转换
支持海外集群部署,安全合规性强
助力企业拓展全球市场,挖掘商机
支持多场景、高效率接入
多种产品形态

快速接入

原子能力到解决方案的多层次服务
20+种公有云/私有化语音产品
在/离线、SDK等多种接入
抖音、剪映同源算法
领先自研算法

算法实力

日均亿级别大流量调用,服务稳定
高品质音色模型,打造国民级爆款
海量数据积累,识别准确率98%
重点行业能力积累
多领域打磨

领域覆盖

娱乐、汽车、金融、客服、教育等
不同领域专有名词高效打磨
个性化定制,助力打造企业形象
全球重点语言覆盖
30+语种覆盖

助力企业出海

中、英、日、法等语种智能转换
支持海外集群部署,安全合规性强
助力企业拓展全球市场,挖掘商机

应用场景

沉淀11种应用方案,让视频娱乐、汽车、金融等行业客户灵活应用
会议访谈转写
将会议、访谈录音批量识别为文字,支持智能分句、说话人识别,提升内容整理效率。
口语评测
面向多年龄段语言学习者,精准检测发音问题,作为AI发音老师,提升学习者发音水平。
智能硬件交互
适用智能座舱、智能穿戴、智能家居等行业硬件,打造自然人机交互体验。
客服助手
赋能金融、汽车、电商等行业,提供高拟真、超自然的对话交互体验。
视频配音
为短视频、广告、纪录片等场景提供多风格、多语种配音服务,激发创作者灵感。
有声小说
番茄小说同款,支持多情感、多风格演绎能力,将小说有声化,提供沉浸式听书体验。
视频字幕
自动将视频中的语音、歌词转换为字幕文本,辅助视频创作,解放创作者双手。
新闻资讯播报
将新闻资讯转换成高质量播报音频,高效管理时间,实现无障碍阅读。
即时通讯输入
飞书、抖音同款能力,适用于社交、办公等多场景下的语音输入及互动,方便又高效。
视频配音
有声小说
视频字幕
新闻资讯播报
即时通讯输入
会议实时识别
智能质检
会议访谈转写
口语评测
智能硬件交互
客服助手

视频配音

为短视频、广告、纪录片等场景提供多风格、多语种配音服务,激发创作者灵感。
视频配音

有声小说

番茄小说同款,支持多情感、多风格演绎能力,将小说有声化,提供沉浸式听书体验。
有声小说

视频字幕

自动将视频中的语音、歌词转换为字幕文本,辅助视频创作,解放创作者双手。
视频字幕

新闻资讯播报

将新闻资讯转换成高质量播报音频,高效管理时间,实现无障碍阅读。
新闻资讯播报

即时通讯输入

飞书、抖音同款能力,适用于社交、办公等多场景下的语音输入及互动,方便又高效。
即时通讯输入

会议实时识别

实时识别会议音频,支持智能生成字幕、智能分句、自动标点、语义顺滑等能力。
会议实时识别

智能质检

将客服通话识别为文字并分析,及时监控违规内容并干预处理,发掘潜在商机。
智能质检

会议访谈转写

将会议、访谈录音批量识别为文字,支持智能分句、说话人识别,提升内容整理效率。
会议访谈转写

口语评测

面向多年龄段语言学习者,精准检测发音问题,作为AI发音老师,提升学习者发音水平。
口语评测

智能硬件交互

适用智能座舱、智能穿戴、智能家居等行业硬件,打造自然人机交互体验。
智能硬件交互

客服助手

赋能金融、汽车、电商等行业,提供高拟真、超自然的对话交互体验。
客服助手

合作案例

来自行业领先企业的信任,质量服务有保障
抖音
豆包语音大模型为抖音持续提供行业领先算法能力及丰富配音服务,上线多款IP角色、趣味方言、解说等音色,用AI语音打造抖音百万爆款视频,引领潮流热点;同时支持抖音语音搜索及输入等功能,让用户使用更便捷。
抖音
剪映
剪映是豆包语音大模型技术深度合作伙伴,基于行业领先的语音合成、语音识别算法及近100款音色储备,持续为专业及普通创作者提供文本朗读、音色转换、智能字幕等语音服务,打造多元创新、便捷高效的AIGC工具。
剪映
番茄小说
基于精品音色矩阵、NLP智能文本理解技术及自研有声创作平台,打造业界领先的精品多播方案,支持多情感、多风格、多语种的文本转语音能力,及长文本批量合成服务,效果媲美真人,已完成千级别书籍的有声化落地。
番茄小说
飞书
飞书是火山引擎语音技术在办公通讯领域的深度合作伙伴,提供语音输入、会议实时字幕、会议录音转写等AI能力,为企业高效智能化办公提供保障,强化飞书在办公工具行业的领先地位。
飞书
抖音剪映番茄小说飞书

更多合作客户

今日头条
巨量引擎
capcut
一键启动火山引擎之旅
联系我们