You need to enable JavaScript to run this app.
导航
实时对话式 AI 计费
最近更新时间:2025.03.04 17:21:05首次发布时间:2024.12.04 11:17:11
我的收藏
有用
有用
无用
无用

免费试用

实时对话式 AI 产生的费用由以下部分组成,每个计费项均提供免费试用额度,具体如下:

计费项免费试用额度领取试用及规则
音视频通信费可通过 10000 分钟免费资源包抵扣10000 分钟免费资源包
对话式 AI 音频/视频处理时长费可通过 10000 分钟免费资源包抵扣10000 分钟免费资源包
LLM 推理费每个模型赠送 50 万 tokens 的免费推理额度模型服务计费
ASR 语音识别费
  • 流式语音识别:20 小时
  • 大模型流式语音识别:20 小时
  • 试用额度
    TTS 语音合成费
  • 语音合成:20000 次
  • 大模型语音合成:20000 字符
  • 大模型声音复刻:20000 字符
  • 试用额度

    计费规则

    音视频通信费

    包括真人纯音频通话费和 AI 的音视频通话费。费用计算标准和普通的音视频通话费用一致。具体计费规则,请参见音视频通话计费

    目前,AI 仅支持发布音频流,在真人侧,只会订阅 AI 的音频流,产生纯音频通话费用。

    对话式 AI 音频/视频处理时长费

    AI 智能体处理用户音频或视频流时产生的计算资源费用。具体计费规则如下:

    计费规则说明
    计费公示
  • 音频处理时长费 = 音频处理时长单价 × 音频处理计费时长
  • 视频处理时长费 = 视频处理时长单价 × 视频处理计费时长
  • 单价
  • 音频处理时长(即账单中的对话式AI-音频时长):9元/千分钟
  • 视频处理时长:99元/千分钟
  • 计费时长
    • 视频处理计费时长:实时对话式 AI 任务处理视频帧的总时长。若一个任务中有多段不连续的视频处理,每段视频处理单独计算时长,然后累加作为该任务的视频总时长。
    • 音频处理计费时长:任务时长 - 视频处理时长
    • 其中,
      • 实时对话式 AI 任务时长:为服务端调用智能体任务从开始到结束的整体时长。
      • 每个自然日的计费时长独立计算,精确到分钟,如果单个自然日内的总计费时长不足 1 分钟,则按 1 分钟来计费。
    付费方式
  • 通过 10000 分钟免费资源包抵扣:具体的抵扣规则,请参见 10000 分钟免费资源包
  • 按量付费:即先使用,后付费,按月结算,每月初出具上一月账单并扣费,通过账户余额抵扣。
  • LLM 模型服务费

    使用大语言模型(LLM)进行推理服务时产生的费用,基于模型的输入和输出 tokens 计算。具体计费项和规则以实际使用的模型为准,请参见模型服务计费

    ASR 语音识别费

    AI 实时对话过程中将用户语音转换为文本的费用。具体计费项和规则以实际使用的服务为准,请参见 ASR 语音识别

    TTS 语音合成费

    AI 实时对话过程中将 AI 智能体的文本回复转换为语音的费用。具体计费项和规则以实际使用的服务为准,请参见 TTS 语音合成

    计费示例

    用户 A 进入 RTC 房间,与 AI 智能体进行了 10 分钟的实时语音对话。对话结束后,用户 A 退房,房间关闭。在这 10 分钟内:

    • 用户 A 的说话时长:4 分钟
    • 用户 A 的语音转录文字数:800 字
    • 智能体回复文字数:1000 字
    • 使用到的模型:Doubao-pro-32k(LLM)、大模型流式语音识别(ASR)、大模型语音合成(TTS)

    各模块费用如下:

    以下费用基于各计费项的后付费刊例价计算,不考虑上下文和免费额度,每个字按 0.59 tokens 计算。

    计费项单价时长/字符数费用
    音视频通话7元/千分钟10 × 2=20 分钟(双向通话)0.007 × 20=0.14元
    对话式 AI 音频处理时长9元/千分钟10 分钟0.009 × 10=0.09元
    LLM 处理
    (Doubao-pro-32k)
  • 推理服务(输入):0.0008 元/千token
  • 推理服务(输出):0.0020 元/千token
  • 输入:800 × 0.59=472 tokens
  • 输出:1000 × 0.59=590 tokens
  • 0.0008 × 472/1000+0.002 × 590/1000=0.0015576元
    ASR 语音识别
    (大模型流式语音识别)
    4.5元/小时4 分钟4.5 × 4/60=0.3元
    TTS 语音合成
    (大模型语音合成)
    5元/万字符1000 字符5 × 1000/10000=0.5元
    合计1.0315576 元(约 1.03元