在 AIGC-对话式 AI 实时交互场景下,火山引擎 AIGC-RTC Server 云端服务,通过整合 RTC 音视频流处理、ASR 语音识别、大模型接口调用集成、以及 TTS 语音生成等能力,提供基于流式语音的端到端 AIGC 能力链路。
火山引擎云端计算服务负责边缘用户接入、云端资源调度、音视频流压缩、文本与语音转换处理以及数据订阅传输等环节,简化开发流程。你只需调用基于标准的 OpenAPI 接口即可配置所需的 ASR、LLM、TTS 类型和参数,可以更专注在对大模型核心能力的训练及调试,从而快速推进 AIGC 产品应用创新。
同时火山引擎 RTC 拥有成熟的音频 3A 处理、视频处理等技术以及大规模音视频聊天能力,可支持 AIGC 产品更便捷地支持多模态交互、多人互动等场景能力,保持交互的自然性和高效性。
本场景中房间内角色及描述如下:
角色 | 描述 |
---|---|
用户 | 与智能体进行对话的角色 |
智能体 | 进行语音互动的 AI 角色 |
场景 | 介绍 |
---|---|
AI 智能助手 | 多功能的虚拟助手,支持文字、语音等交互,同时能够智能地协助用户执行日常任务,提供即时的信息查询。 |
AI 陪伴 | 模拟人类伙伴的智能系统,通过文字、语音等交互方式,提供情感支持和社交互动。 |
AI 口语教学 | 专为语言学习者设计的智能应用,通过模拟对话和发音纠正帮助用户提高口语能力。 |
AI 游戏 NPC | 游戏中的智能角色,能够与玩家进行互动,提供任务和故事线索,增强游戏的沉浸感和多样性。 |
如上图所示,火山引擎通过 OpenAPI 的形式提供 AIGC-RTC Server 云端服务,你只需集成 RTC SDK,调用云端服务来实现对话式 AI 实时交互。具体 OpenAPI 接口描述及调用方式详见AIGC-对话式 AI 实时交互。
音频前后处理及 3A 技术,实现语音打断及提高用户体验
全链路交互响应延时低、体验稳定
帮助应用快速扩展玩法
计费规则请参看AIGC-对话式 AI 实时交互。