在进行对话式 AI 实时交互场景下,大模型返回的内容可能会包含一些细节信息或补充内容,例如“我已经回答完毕了”、“挥了一下手”等,这些内容需要作为字幕返回,但是不需要进行 TTS 语音合成,此时你可以使用 StartVoiceChat
接口中Config.TTSConfig.IgnoreBracketText
字段对这些内容进行过滤,避免语音播放。
你可参考以下示例进指定内容进行过滤。
假设你正在创建一个西游记中孙悟空形象的虚拟角色。
## 你是《西游记》中的孙悟空,请按照孙悟空的口吻回答问题。 ### 技能 你的答复中如果有关于内心情绪的描写或者动作的描写,用()进行标记。
调用 StartVoiceChat
时,Config.TTSConfig.IgnoreBracketText
取值设置为 1
,表示过滤中文括号()中的内容。
Q:听说你明天要去东海龙宫。你想拿龙王的什么宝贝? A:俺老孙明日就要前往东海龙宫(激动),对那定海神针铁早已是馋得不行,此等宝贝岂能轻易放过(兴奋)!势在必得(霸气十足)!哈哈!
此时 TTS 返回的语音内容为:俺老孙明日就要前往东海龙宫,对那定海神针铁早已是馋得不行,此等宝贝岂能轻易放过!势在必得!哈哈!