You need to enable JavaScript to run this app.
导航
产品动态
最近更新时间:2024.12.13 17:37:55首次发布时间:2024.06.26 11:49:40

大模型语音合成

【2024.11】

  1. 产品升级|混音功能上线。

豆包语音合成的超强混音打破了语音合成的音色数量限制,能够精准捕捉不同声音的韵律、音色、表达方式、语气语调等特色,并将不同声音进行自由组合,比如将温柔的女声与雄浑的男声巧妙融合,创造出极具戏剧张力的语音效果,如万花筒通过组合变化出无数的声音图案。

  1. 音色上新|新音色*33,新增美式英语、英式英语、澳洲英语音色。

详见https://www.volcengine.com/docs/6561/1257544

【2024.10】

  1. 产品升级|支持时间戳
  • 单向流式、双向流式、非双向流式、支持字级别时间戳。

【2024.09】

  1. 音色上新|新音色*13,新增角色扮演、通用场景类音色。新增老年音。

语种

类别

名称

Speaker

中文

角色扮演

病弱少女

ICL_zh_female_bingruoshaonv_tob

中文

角色扮演

活泼女孩

ICL_zh_female_huoponvhai_tob

中文

角色扮演

和蔼奶奶

ICL_zh_female_heainainai_tob

中文

角色扮演

邻居阿姨

ICL_zh_female_linjuayi_tob

中文

角色扮演

温柔小雅

zh_female_wenrouxiaoya_moon_bigtts

中文

通用场景

甜美小源

zh_female_tianmeixiaoyuan_moon_bigtts

中文

通用场景

清澈梓梓

zh_female_qingchezizi_moon_bigtts

中文

角色扮演

东方浩然

zh_male_dongfanghaoran_moon_bigtts

中文

通用场景

解说小明

zh_male_jieshuoxiaoming_moon_bigtts

中文

通用场景

开朗姐姐

zh_female_kailangjiejie_moon_bigtts

中文

通用场景

邻家男孩

zh_male_linjiananhai_moon_bigtts

中文

通用场景

甜美悦悦

zh_female_tianmeiyueyue_moon_bigtts

中文

通用场景

心灵鸡汤

zh_female_xinlingjitang_moon_bigtts

【2024.07】

  1. 音色上新|新音色*7,新增日语、西语音色,满足客户跨语种需求。
  • 音色列表:https://www.volcengine.com/docs/6561/1257544

日语

场景

音色名称

voice_type

时间戳

付费

通用场景

かずね(和音)

multi_male_jingqiangkanye_moon_bigtts

×

免费

はるこ(晴子)

multi_female_shuangkuaisisi_moon_bigtts

×

免费

あけみ(朱美)

multi_female_gaolengyujie_moon_bigtts

×

免费

ひろし(広志)

multi_male_wanqudashu_moon_bigtts

×

免费

西班牙语

场景

音色名称

voice_type

时间戳

付费

通用场景

Javier or Álvaro

multi_male_jingqiangkanye_moon_bigtts

×

免费

Esmeralda

multi_female_shuangkuaisisi_moon_bigtts

×

免费

Roberto

multi_male_wanqudashu_moon_bigtts

×

免费

【2024.06】

  1. 音色上新|新音色*22,覆盖通用场景、角色扮演、趣味方言等不同场景。同时新增英文音色,满足不同客户需求。
  • 体验中心:https://www.volcengine.com/product/tts
  • 能力支持及配置相关文档:https://www.volcengine.com/docs/6561/1257544
  • 音色列表:https://www.volcengine.com/docs/6561/1257544

语种

类别

名称

Speaker

中文

通用场景

邻家女孩

zh_female_linjianvhai_moon_bigtts

中文

角色扮演

高冷御姐

zh_female_gaolengyujie_moon_bigtts

中文

趣味方言

湾区大叔

zh_female_wanqudashu_moon_bigtts

中文

趣味方言

呆萌川妹

zh_female_daimengchuanmei_moon_bigtts

中文

通用场景

少年梓辛

zh_male_shaonianzixin_moon_bigtts

中文

趣味方言

广州德哥

zh_male_guozhoudege_moon_bigtts

中文

通用场景

渊博小叔

zh_male_yuanboxiaoshu_moon_bigtts

中文

趣味方言

北京小爷

zh_male_beijingxiaoye_moon_bigtts

中文

通用场景

阳光青年

zh_male_yangguangqingnian_moon_bigtts

英文

通用场景

Harmony

zh_male_jingqiangkanye_moon_bigtts

英文

通用场景

Skye

zh_female_shuangkuaisisi_moon_bigtts

英文

通用场景

Alvin

zh_male_wennuanahu_moon_bigtts

英文

通用场景

Brayan

zh_male_shaonianzixin_moon_bigtts

中文

角色扮演

傲娇霸总

zh_male_aojiaobazong_moon_bigtts

中文

角色扮演

魅力女友

zh_female_meilinvyou_moon_bigtts

中文

角色扮演

深夜播客

zh_male_shenyeboke_moon_bigtts

中文

角色扮演

柔美女友

zh_female_sajiaonvyou_moon_bigtts

中文

角色扮演

撒娇学妹

zh_female_yuanqinvyou_moon_bigtts

中文

趣味方言

浩宇小哥

zh_male_haoyuxiaoge_moon_bigtts

中文

趣味方言

广西远舟

zh_male_guangxiyuanzhou_moon_bigtts

中文

趣味方言

妹坨洁儿

zh_female_meituojieer_moon_bigtts

中文

趣味方言

豫州子轩

zh_male_yuzhouzixuan_moon_bigtts

【2024.05】

  1. PR发布|515火山引擎FORCE大会,正式发布语音大模型

2024春季火山引擎FORCE原动力大会于5月15日举办,正式发布云雀大模型家族。语音大模型(包含语音合成、语音识别、声音复刻)作为云雀家族的垂类模型,也进行正式发布。

【2024.04】

  1. 音色上新|新音色*4,超自然音色首发!

语种

类别

名称

Speaker

中文

趣味方言

京腔侃爷

zh_male_jingqiangkanye_moon_bigtts

中文

通用场景

爽快思思

zh_female_shuangkuaisisi_moon_bigtts

中文

通用场景

温暖阿虎

zh_male_wennuanahu_moon_bigtts

中文

趣味方言

湾湾小何

zh_female_wanwanxiaohe_moon_bigtts

  1. 体验优化|官网页面升级4.0版本,体验中心同步升级,支持超自然音色体验

https://www.volcengine.com/product/tts

  1. PR发布|不止5秒复刻,大模型驱动火山引擎语音合成技术全面升级

https://mp.weixin.qq.com/s/j6NPixR26udSrRoY9JTq1w

火山引擎语音团队曾于2023年推出 zero-shot (零样本学习)的极速版声音克隆。近期火山语音再一次升级,推出大模型版超自然语音合成和5s极速声音克隆升级版。致力于多个语音场景的深耕,为陪伴式 AI 交互、沉浸式听书、跨语种内容生产、企业客户服务等场景的企业级客户提供超自然的声音体验。

大模型声音复刻

【2024.07】

  1. 产品升级
  • 音色的相似度提升:尤其是在高表现力、口音的输入上做到高度还原。
  • 声音的自然度提升:讲话的音调、韵律、节奏、情感等更接近真人表现。
  • 多语种表现力提升:在英文等外语的发音上更标准,讲话韵律上更接近当地人的表达。
  • 多语种迁移:录制一个语种的声音,可支持中文、英文、日语、西班牙语(墨西哥口音)、葡萄牙语(巴西口音)、印尼语多个语种的合成

【2024.04】

  1. 产品升级|V1.7.5版本更新
  • 增加免费测试额度:10次提交音频训练音色的机会,赠送5000字符免费调用额度
  • 支持自定义文本试听功能:用户上传音频后可自定义文本试听,如果效果不满意可更换训练音频重新训练试听,每个音色可最多支持提交10次训练音频;如果效果满意可启用音色,启用后不可再上传音频训练;如果10次机会用完,则以最后一次上传音频为准;
  • 新增按纯并发调用计费模式:客户可选择按照纯并发计费模式,该模式只需购买并发,不再收取字符调用费用,音色和模型存储费正常计费。

【2024.03】

  1. 体验优化|官网页面改造升级4.0版本,下单更便捷

https://www.volcengine.com/product/voicecloning

  • 增加定价跳转入口、折扣组件等,用户下单更便捷。
  • 界面重新设计调整,内容更详实、UI更美观。

【2024.01】

  1. 产品升级|支持日语复刻。

megaTTS6.2版本上线,修复一些语速过快、变调等异常case,并支持日语复刻

大模型语音识别

【2024.12】

  1. 产品升级|2.0.4版本发布上线。音乐、方言识别效果优化。

【2024.10】

  1. 产品升级|BigASR支持context能力

https://www.volcengine.com/docs/6561/1354868

【2024.09】

  1. 产品升级|录音文件识别功能升级
  • 录音文件支持说话人识别、 支持双通道识别已上线。

【2024.08】

  1. 产品发布|大模型语音识别上线
  • BigASR流式语音识别发布已上线。
  • BigASR录音文件识别已发布上线。
  1. 体验优化|官网页面改造升级4.0版本,下单更便捷

https://www.volcengine.com/product/asr

  • 增加定价跳转入口、折扣组件等,用户下单更便捷。
  • 界面重新设计调整,内容更详实、UI更美观。