揭秘千卡 GPU 集群如何高效训练多模态大模型:vivo AI 团队实战经验分享|AICon
多模态大模型在智能客服、自动驾驶、AIGC 等领域的应用需求不断增长,但其训练工程面临计算、存储、数据处理、分布式通信等多重挑战。特别是在千卡级 GPU 训练集群上,如何优化数据加载、提升训练稳定性、突破计算与存储瓶颈,成为 AI Infra 需要重点攻克的难
多模态大模型在智能客服、自动驾驶、AIGC 等领域的应用需求不断增长,但其训练工程面临计算、存储、数据处理、分布式通信等多重挑战。特别是在千卡级 GPU 训练集群上,如何优化数据加载、提升训练稳定性、突破计算与存储瓶颈,成为 AI Infra 需要重点攻克的难
作为开源社区近年来备受瞩目的推理引擎,SGLang自发布以来持续迭代优化。截至 2025 年 6 月,其在 GitHub 上已收获近 15K Stars,月均下载量突破 10 万次。凭借出色的性能表现和设计,SGLang 已被多个行业巨头采纳:包括 xAI(用
5 月 23~24 日,由极客邦科技旗下InfoQ中国主办,中欧AI与管理创新研究中心、上海人工智能研究院学术指导的 AICon 全球人工智能开发与应用大会·上海站(2025)圆满落幕。大会吸引了超 800 位 AI 开发者、技术专家与相关从业者齐聚一堂,现场
5 月 23-24 日AICon 上海站,聚焦 Agent、多模态、端侧智能、Data for AI 等 50+ 热点话题,涉及 20+ AI 应用案例,兼具实操价值与未来洞见。点击了解详情。