摘要:步入AI时代,以大模型为代表的通用人工智能正迎来突破性进展,逐渐成为推动新质生产力发展的核心引擎。近年来,多模态大模型作为人工智能领域的核心技术之一,已成为各大科研机构和企业的重点布局方向。
步入AI时代,以大模型为代表的通用人工智能正迎来突破性进展,逐渐成为推动新质生产力发展的核心引擎。近年来,多模态大模型作为人工智能领域的核心技术之一,已成为各大科研机构和企业的重点布局方向。
2024 年 12 月 18 日,重大科技成就发布会于北京国家科技传播中心举办,上海人工智能实验室现场发布书生大模型科技成就。作为项目推介人,上海人工智能实验室主任、首席科学家周伯文表示,上海人工智能实验室致力于打造自主可控的开源大模型体系,基于“通专融合”的路径探索通用人工智能的未来。
让 AI 成为人类的 Intern,迈向通用人工智能
继 2021 年 10 月发布以来,书生通用大模型体系历经从单一视觉模型到多模态大模型、通用大模型体系,再到通专融合大模型体系的成长历程。同时开源了全链条的工具体系,包括书生·万卷、MinerU 等数据工具,InternEvo、XTuner 等预训练和微调工具,以及 LMDeploy 模型推理部署框架和 Open Compass 大模型评测体系。在整个链条环节上,部分开源工具目前已经达到了开源社区的最优水平和最好性能。此外,书生通用大模型体系和国内外比较优秀的开源项目、开源生态进行兼容和融合,可支持国内外各种各样的训练框架、推理框架以及应用工具等等。
会上,上海人工智能实验室青年科学家陈恺特别介绍了书生·浦语 2.5 谱系、书生·万象多模态大模型 InternVL2.5 以及强推理模型书生 InternThinker。
书生·浦语 2.5 谱系
作为一个对标 GPT 系列的大语言模型,书生·浦语 2.5 谱系覆盖了从 1.8B、7B、20B 到 102B 的跨量级模型尺寸,可满足不同的应用需求,其中 1.8B 到 20B 都是开源的。除了基础语言模型之外,书生·浦语衍生出一系列多模态创作模型,包括 InternLM-XComposer(灵笔)、InternLM-Math(数学)、InternLM-WQX(文曲星)。
陈恺谈到,书生·浦语有三个主要特点:首先,推理能力领先。和同量级的开源模型相比,它在众多推理榜单和实际使用的推理体验上都有非常出色的表现;其次,是社区首批支持了 100 万字上下文的开源模型,百万字长文的理解和精确处理性能均处于开源模型前列。另外,它还具备基于自主规划和搜索解决复杂问题的能力,针对复杂问题撰写专业回答,效率可提升 60 倍。
书生·万象多模态大模型 InternVL2.5
书生·万象多模态大模型 InternVL2.5 采用渐进式的训练策略来减少整体的训练资源消耗,同时也支持多种多样的输入模态和输出的格式。作为首个在 MMMU 验证集上突破 70% 的开源多模态大模型,书生·万象 2.5 成为了继 OpenAI o1 后第一个 MMMU性能突破 70% 的模型。会上,陈恺特别以复杂的金融图表分析为例,展示了书生·万象 2.5 的演示 Demo。模型可以通过非常复杂的专业知识提取里面的内容,进行分析以及里面各种数据的处理和计算。
强推理模型——书生 InternThinker
自 11 月起,上海人工智能实验室开放了强推理模型书生 InternThinker 试用体验。该模型具备长思维能力,并能在推理过程中进行自我反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。陈恺提到,实验室研发团队设计了一系列“元动作”来引导模型解决问题的过程,如对问题的理解、知识回忆、规划、执行、反思、总结等,使得 InternThinker 能够以更加接近人类学习的方式高效提升能力,在面对复杂任务时,会动态地选择“元动作”,再进一步展开相关动作的具体思维过程。
会上,陈恺特别介绍了 InternThinker 的两个技能特点。其一,基于通、专模型协作合成高密度数据。InternThinker 独创性地采用了基于通专融合的技术路线生产所需数据,采用多种通用模型和专业模型的协作流程,模型和数据交替迭代,达到协同增强的效果。其二,构建大规模沙盒环境,在交互中获得反馈信号。InternThinker 针对专业任务构建了大规模的沙盒环境,为可形式化验证的推理任务提供反馈信号,通过自动化专家模型、人机协同策略生成等方法,构建了超过50种不同逻辑思维方式的推理任务思考过程。
赋能新型工业化,培养大模型新锐人才
“书生通用大模型体系不仅仅面向学术领域,我们也非常关注它在产业当中的应用。”据陈恺介绍,如今书生通用大模型体系已经和许多重点企业开展合作。比如辅助中远海运重工做落地的智能体应用、利用书生·浦语作为振华重工核心业务的智能体驱动模型。此外,上海钢联采用书生通用大模型体系做数字智能助手,在垂直领域做定制化微调。“可以看到,书生大模型在很多国计民生重点行业领域都得到了比较好的应用。”
同时,上海人工智能实验室也非常重视大模型在开源社区的交流以及反馈。团队通过书生大模型进行大模型人才培养和科普,目前已经举办四期大模型实战营,累计吸引超 2 万名学员报名,来自国内 800+ 高校的学生及 3000+ 企事业单位员工,线上课程学习 20 万人/次。实战营通过其优质的课程、实战内容和配套的答疑、辅导,让学员真正可以从无基础或少量基础学习大模型全套开发、使用流程。陈恺介绍,目前已收到若干企业、高校希望在开设线下课程的需求,如字节跳动、中核集团、阿里巴巴、商飞等知名企业。
AGI 是新质生产力的重要引擎,是“生产力的生产力”。陈恺表示,上海人工智能实验室将积极推动以通用人工智能的发展,以场景应用为牵引,促进大模型与制造业深度融合,助力人工智能创新生态的构建。
来源:CSDN一点号