? 场景选择:低延迟外呼场景针对电话营销优化,提供更快的响应速度;智能客服场景使用腾讯云智能体开发平台知识库,提供更完整的客服功能。

? ASR(自动语音识别)模型选择:8k_zh_large适用于电话场景(8kHz采样率),16k_zh_large适用于高清音频场景(16kHz采样率),提供更高的识别准确率。
VAD时长: ${chatConfig.STTConfig.VadSilenceTime}ms
? 用户说话停顿最长时长,调整范围为240ms~2000ms,停顿超过设置的时长会把语句切分
? LLM(大语言模型)选择:在智能客服场景下,可以选择腾讯云智能体开发平台知识库或乐享知识库。腾讯云智能体开发平台知识库提供标准的客服功能,乐享知识库则提供针对特定领域的专业知识支持。在低延迟外呼场景下,可以选择各种大语言模型。

? TTS(语音合成)选择:不同的语音合成引擎提供不同的音色和自然度。Tencent提供腾讯云的语音合成服务,MiniMax提供另一种音色选择。
查看音色列表
? 输入音色ID,默认为女声-智小柔(502001)。点击"查看音色列表"了解更多可用音色。
Demo使用文档 开发参考文档

AI对话

模型提示词输入

MCP工具调用展示

打断时长: ${chatConfig.AgentConfig.InterruptSpeechDuration}ms
? 打断时长是指AI说话时,用户说话时长达到一定阈值可以打断AI说话,设置范围为300ms~2000ms,更低的值打断更灵敏,更高避免误打断
远场人声抑制强度: ${chatConfig.STTConfig.VadLevel}
? vad的远场人声抑制能力(不会对asr识别效果造成影响),范围为[0, 3],默认为0。推荐设置为3,有较好的远场人声抑制能力。

通话延迟监控指标

刷新频率:
最后更新: 从未
轮次ID 端到端延迟 ASR延迟 LLM首token TTS首帧延迟 是否中断 时间戳 对话内容