摘要:AI浪潮席卷各行各业,Soul App创始人张璐带领团队积极探索AI技术在社交场景的应用。日前,社交平台Soul宣布其自研的端到端全双工语音通话大模型已全面升级,这一进展标志着AI技术在重构人机交互方式上迈出了重要一步,为AI赋予交互“自主性”,让用户更加流畅
AI浪潮席卷各行各业,Soul App创始人张璐带领团队积极探索AI技术在社交场景的应用。日前,社交平台Soul宣布其自研的端到端全双工语音通话大模型已全面升级,这一进展标志着AI技术在重构人机交互方式上迈出了重要一步,为AI赋予交互“自主性”,让用户更加流畅自然、“类真实”的沟通体验。
此次Soul技术升级都有哪些亮点?Soul App自研端到端全双工语音通话大模型摒弃了传统语音交互中依赖的 VAD(话音活性检测)机制与延迟控制逻辑,打破了行业中普遍存在的“轮次对话”模式,可以赋予 AI 自主决策对话节奏的能力。具体来看,AI不仅能主动打破沉默、适时打断对话、实现边听边说和并行发言讨论,还具备时间感知、环境感知、事件感知等多维度理解能力。同时,系统支持口语化表达,如语气词、语义重复、情绪起伏等“人性化”细节,并可进行音色复刻,进一步增强交互真实感。值得一提的是,Soul新升级的端到端全双工通话大模型即将开启站内内测,后续将陆续落地于虚拟人实时通话、AI匹配等1V1互动场景。
伴随着AI在大众层面的渗透率进一步提升以及技术能力的持续跃进,“AI应用爆发”成为行业共识。作为较早思考将AI应用于社交的互联网平台,Soul 在创始人张璐团队带领下不但以AI为社交带来了新感受,还极大提升了人机交互具备在场感和情感温度,让AI社交不再“冷冰冰”。
来源:最江阴一点号