摘要:2025年4月5日,美国科技巨头Meta正式发布了其最新一代开源人工智能模型Llama 4。作为Meta在AI领域的重要突破,Llama 4不仅首次采用了混合专家(MoE)架构,还以其多模态处理能力和高效的计算效率,成为人工智能技术发展的重要里程碑。
2025年4月5日,美国科技巨头Meta正式发布了其最新一代开源人工智能模型Llama 4。作为Meta在AI领域的重要突破,Llama 4不仅首次采用了混合专家(MoE)架构,还以其多模态处理能力和高效的计算效率,成为人工智能技术发展的重要里程碑。
Llama 4系列目前包含两个版本:Scout和Maverick。Scout拥有170亿个活跃参数、16个“专家”模型和1090亿个总参数,而Maverick则具备170亿个活跃参数、128个“专家”模型和高达4000亿的总参数量。这种混合专家架构通过将复杂任务分解为子任务,并由专门的“专家”模型处理,显著提升了模型的训练和推理效率。Meta表示,这种设计使得Llama 4在处理多模态数据(如文本、图像、视频和音频)时表现出色,能够在不同格式之间灵活转换内容。
此外,Meta还在训练一款更为强大的模型Behemoth,称其为“新模型中的教师”。所有Llama 4系列模型均经过大量未标注的文本、图像和视频数据的训练,具备广泛的视觉理解能力。目前,Scout和Maverick已在Llama.com网站及Meta的合作伙伴平台公开获取,并集成到WhatsApp、Messenger和Instagram Direct等应用中。Meta AI助手已在40个国家更新为使用Llama 4模型,尽管多模态功能目前仅在美国以英语提供。
Meta首席执行官马克·扎克伯格在发布会上表示,Meta的目标是建立世界领先的人工智能,并将其开源,以造福全球用户。他提到,开源人工智能将成为未来的主导模型,而Llama 4的推出标志着这一趋势的开始。Meta首席产品官Chris Cox此前也曾表示,Llama 4将显著提升AI智能体的推理和行动能力。
然而,Llama 4的开发并非一帆风顺。据知情人士透露,该模型在技术基准测试中未能完全达到Meta的预期,尤其是在推理和数学任务方面。此外,Meta也对其在模拟人类语音对话方面的表现感到担忧。尽管如此,Meta计划今年投入高达650亿美元扩展其AI基础设施,以应对日益激烈的市场竞争。
Llama 4的发布不仅是Meta在AI领域的一次重要尝试,也为开源人工智能的发展提供了新的方向。混合专家架构的应用,标志着AI模型设计从单一任务向多任务协同的转变,为未来更高效、更智能的AI系统奠定了基础。随着技术的不断演进,Llama 4有望在更多领域展现其潜力,推动人工智能技术的普及与应用。
来源:金融界