近日,阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime。该模型现已全面上线,开发者可以通过阶跃星辰开放平台进行接入。StepAudio 2.5 Realtime 旨在为用户提供更为真实的对话体验,围绕副语言感知、人设自定义和对话能力进行了全面的技术提升。
StepAudio 2.5 Realtime 的核心创新在于其对副语言信息的处理能力。副语言包括语调、语速、停顿,以及叹息或轻笑等非文字表达方式,这些细节是传递情感的关键。通过分析这些元素,模型能够感知用户的情绪和潜在意图,例如从低沉的声调中识别出疲惫,或从急促的语速中判断出烦躁情绪,并据此动态调整回复的语气与策略,提升交流的自然感。
在人设自定义方面,StepAudio 2.5 Realtime 允许开发者进行灵活调节。用户可以通过 API 调整 AI 角色的性格特征、背景经历以及语言习惯等。该模型基于超过 10,000 个高质量原生人设,经过算法生成了百万级的人设特征矩阵,并通过大量真实对话数据进行训练。开发团队还进行了强化学习优化,确保模型在极端场景下保持稳定的角色一致性。此外,模型内置了 5 个预设人设,供用户直接体验。
在整体对话能力上,StepAudio 2.5 Realtime 强调智商与情商的双重提升。除了能够深入理解复杂语义、应对交流中的各种情境外,模型还能够调用多领域知识,提供更深层次的对话体验,既能作为情感交流的聊天伙伴,也能模拟专业 HR 进行面试等正式场合。
根据官方最新评测数据显示,该模型在五个测试维度中表现卓越,特别是在用户体验评分中,StepAudio 2.5 Realtime 的得分达到 80.41,显著高于其他同类产品,如 GPT-Realtime-1.5 和 Gemini Live,展示了其强大的性能和应用潜力。
划重点:
🌟 StepAudio 2.5 Realtime 具备先进的副语言处理能力,能精准感知用户情绪。
🎭 用户可通过 API 自定义 AI 角色的性格与背景,提升交互个性化。
📊 官方评测显示,该模型在多项测试中表现优异,得分远超同类产品。
via AI新闻资讯 (author: AI Base)