摘要:大模型(large models)是人工智能技术发展的最新前沿领域,也是新质生产力发展的关键技术要素,有望广泛适用于经济社会各领域任务。开源(open-source)是计算机软件发展过程中诞生的对开放共享的创新协作模式的统称。作为数字技术的一种创新协作模式,
大模型(large models)是人工智能技术发展的最新前沿领域,也是新质生产力发展的关键技术要素,有望广泛适用于经济社会各领域任务。开源(open-source)是计算机软件发展过程中诞生的对开放共享的创新协作模式的统称。作为数字技术的一种创新协作模式, 开源创新(open-source innovation)是一系列通过开放媒介和资源共享来实现数字技术创新和数字产品生产的人类经济社会领域的创新协作活动。 对开源创新活动的有效组织,不仅决定了开源创新能力的释放,也产生了一类具有较大技术正外部性的公共政策问题。自20世纪90年代以来,开源模式已从开源软件拓展至开放数据、开放标准、开放存取、开放科学、开源硬件、开源人工智能大模型等多种形态,对创新驱动发展和大国科技博弈具有重大战略意义。
2024年以来,人工智能大模型的创新研发活动中出现了以深度求索的DeepSeek系列、Meta的Llama-3为代表的大模型开源路径和以OpenAI的GPT-3及之后系列为代表的大模型闭源路径,二者已产生一定冲突。事实上,OpenAI成立之初是非营利性组织,以开发开源人工智能技术为己任,试图挑战当时美国谷歌公司在人工智能领域的主导地位。但当OpenAI的GPT技术路线逐步成为主流后,OpenAI放弃了开源承诺,在国际开源社区引发大模型开源与闭源的路径争议。这表明,大模型不仅仅是人工智能技术发展的最新成就,也正在引发人工智能治理新变革,其挑战了西方学术传统中商业公司与开源社区合作的公地治理范式。尤其是2025年初至今,中国人工智能初创公司深度求索密集发布多款较低训练成本、较高计算效率、高水平算法优化、具备思维链和推理性能的原创性开源大模型,短时间内获得全球高度关注。
面对人工智能治理变革的新阶段和大国科技竞争的新挑战,总结中国大模型开源创新的技术叙事及其对全球人工智能开源治理的贡献,是中国学者的职责所在。 为此,本文拟着力探讨三个问题:首先,开源创新为何能成功,其背后蕴含的创新规律及价值逻辑是什么;其次,在人工智能的大模型时代,开源创新能否革新此前的范式,其价值逻辑在中国表现出何种独特优势或面临何种挑战;最后,如何基于中国的大模型开源创新公地实践,在人工智能开源治理变革中构建具有世界性的中国叙事。
历史演进:开源如何走向成功
开源最初起源于欧美等国科学共同体自发组织的软件源代码学习与分享活动,已历经半个多世纪的发展进程。1969年,贝尔实验室向学术界开放源代码,是开源创新活动的重要里程碑;基于开放软件源代码的自由软件运动,则产生于个人计算机和软件产业刚兴起的20世纪80年代。自由软件作为商业软件闭源模式的挑战者,在当时并没有成为主流,反而被微软等商业公司视为“毒瘤”,发展十分“煎熬”。直到21世纪初,随着互联网技术的普及和大型互联网公司的兴起,开源逐渐成为信息技术创新的主流范式。
软件技术领域的开源创新活动主要经历了四个发展阶段(见表1)。在20世纪60至80年代的诞生萌芽阶段,软件技术领域开源创新活动的核心特征是面向科研环境,由商业公司主导,目的是促进程序员的交流,创新主体主要是高校和企业的研究人员。从价值逻辑看,开源创新的萌芽来自数百年来科学共同体的学术创新传统和新兴程序员群体专业精神的有机融合。
然而,这一价值逻辑在20世纪80至90年代曾遭遇来自专有化商业软件的冲击。以微软、IBM为代表的商业企业通过构建软件知识产权壁垒获取垄断利润,并雇佣大量高水平技术人才为之服务,面向计算机环境的商业软件一度成为发展主流。为与之对抗,“自由软件”概念由此诞生。彼时,麻省理工学院的研究人员理查德·斯托尔曼(Richard Stallman)带头反对软件代码专有化趋势和签署保密协议的做法,于1985年创立了自由软件基金会(Free Software Foundation,简称FSF),发起“自由软件运动”,希望恢复极致的“黑客伦理”。从价值逻辑看,在20世纪八九十年代,以获取商业利润为目的的“专有软件”和以代码传播、开源协作为目的的“自由软件”之间产生了激烈的价值冲突,开源创新活动在此期间陷入“低谷”和“煎熬”。但在此期间应运而生的自由软件运动,为激发群体创新活力、吸引广泛创新主体参与提供了可能。
到20世纪90年代末,微软对操作系统和办公软件的市场垄断行为引发了美国司法部的调查,同期,网景、Oracle、SAP、Sybase和Informix等软件供应商为与微软竞争,相继宣布接纳开源软件,将部分应用程序移植到开源的Linux上,为开源软件的复兴提供了新机会。1998年,欧美主要开源社区的技术领导者召集开源社区峰会,决定采用“开源许可证”(open-source license)对源代码生成、分发和使用规则进行约束,就不同创新主体参与开源创新活动的事实性规则达成共识。相较于“自由软件”,“开源软件”对商业使用和商业利益的获取更为宽容,也得到商业公司的更多支持。同期,开源技术社区领袖埃里克·雷蒙(Eric Raymond)和 布鲁斯·斐伦斯(Bruce Perens)成立了名为“开放源代码促进会”(Open Source Initiative,简称OSI)的开源基金会。该基金会在开源许可证框架内向商业企业提供开源代码,给企业、社区和个人带来了更多实际经济效益和社会效益。随着互联网技术的普及,以谷歌为代表的新兴科技公司为突破专有软件公司的市场垄断,构建新的互联网商业服务生态,增加了对开源创新活动和开源基金会组织的贡献与投入。通过激发群体参与,它们较好地平衡了互联网时代技术发展的不确定性,并通过主导安卓等开源许可证协议,与开源社区合作,实现了长期商业价值。从价值逻辑看,到21世纪初,随着互联网技术的成熟和基于互联网平台的商业模式兴起,欧美的开源社区和商业企业面向新兴的互联网环境,建立了第三方知识产权托管模式和开源许可证机制,以开源基金会等非营利性组织为纽带,构建了事实上的开源标准。开源创新的价值规律能够同时包容基于科学发表的自由创作和基于商业利益的战略驱动。在此时期,相比专有软件,开源软件孕育出众包、开放式创新、用户创新、创新公地等全新创新范式,在技术进步和商业发展中均取得了巨大成就,催生出全球化的软件产业。
21世纪20年代至今,开源创新在人工智能技术发展中加速普及, 开源创新由此进入面向人机物融合环境的开放智能发展阶段。 在此阶段,仅依托松散的技术社区无法满足训练、推理等产品化需求;仅依靠互联网平台的商业模式实现创新盈利,亦难以长期承担大模型等人工智能技术创新研发的巨量算力和数据基础设施的投入需求。在此过程中,开源创新的核心特征转变为通过政府、市场、社会等多元群体协同,实现各类主体共同参与获益并降低创新成本。建立算力、数据、治理风险等共担共享的新型开源公共基础设施,实现各类创新主体共同参与受益,是应对人工智能时代技术、产业、安全、社会等领域多重不确定性的本质要求,也是开源创新在人工智能时代价值逻辑的具体体现。
大模型时代开源创新的价值逻辑
在20世纪个人计算机兴起时,开源并未取得商业成功,直到21世纪初互联网时代开启,开源开始获得巨大的商业成功。开源本身的四个特点是其从“煎熬”走向“光鲜”的关键因素:第一,开源是应对技术发展不确定性的创新模式;第二,开源是吸引各类型创新主体参与贡献、激发创新活力的重要生态途径;第三,开源是破除行业垄断的有效商业策略;第四,开源是保证新兴产业在大众监督的“阳光”下安全发展的治理路径。大模型开源创新活动的人工智能治理变革正在发生,在以大模型为代表的人工智能时代,开源创新的四大价值逻辑将如何延续,并助力中国优势的发挥?
(一)技术发展:开源作为应对技术发展不确定性的创新模式
近年来,在欧美主流技术媒体舆论话语中流传一种说法,即ChatGPT之后人工智能大模型的主流技术路线已经确定,人工智能技术路线的不确定性从此“消失”,开源实践获得成功的生态土壤不再存在。自ChatGPT发布以来,虽然各界对如何利用大模型实现产业赋能存在争论,但百花齐放的大模型产业应用实践已不可阻挡。
相比于互联网时代的开源成功,人工智能时代源自中国深度求索系列开源大模型的创新实践表明,开源作为应对技术不确定性创新模式的价值逻辑依然奏效。更进一步,从人类文明发展传承出发,文明成果只有公开发布,才能得到有效保护和长期传承;从技术史出发,开源模式和闭源模式二者相伴相生、相互促进、相互制衡、相互转换,共同推动创新发现和技术进步,成为当代人类数字文明发展的独特现象。
(二)群体激励:开源作为激发各类创新主体参与贡献的激励机制
历史上,信息技术的发展历程是在不确定性世界中获得更多确定性的探索过程。开源对群体智能的激励和吸引,是在技术不确定性中把握生态确定性的创新模式。当下,新一轮科技革命和产业变革竞争加剧,大模型技术为人类社会从互联网时代向人工智能时代转型提供了重要推力。面对更加不确定的世界,开源创新吸引各类型创新主体参与贡献、激发创新活力的生态价值逻辑得以延续,中国也更有可能以开源模式探索不同技术路径,激发和汇聚群体智慧,同时分担创新成本,实现人工智能技术的持续演化,主动适应变化的世界。具体来说,开源对中国创新主体的独特价值体现在三大维度。
首先,开源创新的激励机制与中国的规模优势高度契合。 作为一项基于神经网络算法的技术发明,大模型具有积累性和共享性特征,其技术共同体的社区规模是影响技术发展水平的最重要因素。中国在庞大的市场和受教育人口规模基础上,以开源协作为激励机制,吸引和激发各类型主体参与创新协作,将扩大技术群体智慧激发规模,使新技术获得更多试验机会和改进经验,从而提高产生重大发明的可能性。从鼓励协作的角度看,开源通过代码、文档和开发过程的部分或完全公开,实现技术知识的学习、查看、使用和改进,允许开发者“分叉”(fork)项目,即在原有基础上独立开发新方向。这种方式既保留原项目的成果,又鼓励实验性创新,打破了传统闭源开发的壁垒,使得全球开发者能够基于同一目标协作,通过广泛的社区成员的贡献,整合多样化的技能和视角,提升软件的质量和功能,形成“众人拾柴火焰高”的效果。而开源贡献者则收获声誉和技能作为反馈和激励,更积极地参与创新,推动开源技术项目的进一步发展。这种协作模式不仅推动了大模型技术的迭代更新,还促进了知识共享、技术创新和人才流动。可见,在大模型开源创新过程中,中国具备的规模优势与开源作为群体激励机制的价值逻辑具有高度契合性。
其次,开源创新的激励机制契合人类命运共同体的价值理念。 开源模式通过技术细节透明化,吸引全球开发者参与优化,推进人工智能的技术普惠。例如,深度求索大模型定义的高性能、低成本的训练和推理路径,打破了美国科技巨头的技术壁垒和大模型估值神话,使得更多中小企业、研发机构和个人开发者能够负担大模型的使用和迭代成本。在大模型时代,开源创新通过代码开放、免费使用和自由修改的激励机制,打破了发达国家对核心技术的垄断,降低了大模型技术的获取门槛和研发成本。中国等发展中国家可基于开源大模型技术,更快速地搭建数字基础设施,促进知识流动与创新能力建设,这与人类命运共同体理念在价值导向上具有一致性。
最后,开源创新的激励机制契合人工智能敏捷治理的中国方案。 中国在全球人工智能治理中坚持敏捷治理、科技向善,开源创新的协作模式有望成为实现人工智能敏捷治理的具体路径。一方面,开源创新的激励机制有助于多元主体凝聚共识、确立标准。尽管学术界对开源大模型的具体定义和标准仍有争议,但深度求索系列在各类大模型中的开源程度目前是最高的,其将大模型的参数权重、算法架构和部分训练日志等核心技术开源提供给全球开发者,定义了新的开源大模型的事实性标准。另一方面,开源有助于原创性技术快速产生国际影响力。2025年1月《自然》(Nature)杂志连发重磅评论,肯定深度求索大模型的成本优势及其对全球科学家和技术人员的价值。开源创新的激励机制鼓励所有参与者通过开放参与、透明协商、实践验证、规模化应用的方式,达成事实性标准和治理共识,降低大模型技术垄断风险,加速跨组织协作,使技术标准更贴近实际需求。开源社区本身也成为大模型标准演进的“试验场”,最终形成人工智能技术领域的共同语言。
(三)市场竞争:开源作为挑战行业垄断者的商业策略
人工智能技术发展至今,产业界希望借助开源创新模式突破OpenAI、微软和英伟达共同塑造的行业垄断规则。以深度求索为代表的中国科技公司的崛起,更是打破了高算力投入、稠密参数权重的大模型研发路径,重塑全球人工智能前沿领域的竞争格局。其在开源创新方面的技术突破,被认为是OpenAI停止闭源转型的重要动因。
如表2所示,开源大模型的参与主体是初创企业、学术界、技术社区和独立开发者,研发门槛相较于闭源大模型更低,迭代速度更快,对商业变现的时间周期容忍度也更高;而闭源大模型以大型商业公司为主进行研发,依赖对确定技术路线的高资本投入,其迭代速度受到公司内部研发周期和人员密集度的影响,因此对短期商业变现的需求更高。这进一步印证了企业选择开源与闭源商业策略的转换逻辑: 在缺乏市场地位和技术发展不成熟时寻求开源创新,在达成市场领先和技术垄断后寻求闭源获利。
与历史上开源软件经历漫长的共识达成阶段、形成以开源许可证为蓝本的事实性开源标准不同的是,目前各界对大模型的开源策略仍存在广泛争议。尤其是对具有高投入门槛的大模型技术发展而言,实际上没有绝对的开源,也没有绝对的闭源。商业公司选择开源还是闭源,何时开源、开源什么、开源给谁,与技术发展阶段、公司盈利战略和市场竞争环境息息相关。无论如何,大模型的开源治理已成为人工智能敏捷治理实践的前沿议题。
(四)安全发展:开源作为保障新兴产业安全发展的治理路径
各国学者对大模型开源治理的安全问题也存在一定争议。部分学者和政产界人士将人工智能治理与核技术治理相比较,但二者的治理逻辑差异显著。原因在于,核技术的起点是制造原子弹用于战争,从风险到危害的路径清晰,需要各个主权国家参与防控;而人工智能技术的起点是由开源社区和科技企业主导,本质上是为了在经济生活中应用并推动创新福祉的扩散,其风险是在应用过程中伴生的,具有较大不确定性。因此,各国政府在进行人工智能风险治理时,很难将大模型“一禁了之”。相较于少数人声称“应由特定群体负责人工智能安全”的论调,人们更倾向于开源安全的“阳光”策略,即通过大众参与和监督来保障人工智能的安全发展。
尤其是在当今大国竞争的背景下,以开源协作促进国际信任、达成国际合作,已成为少数能跨越政治壁垒的协作领域。例如,欧美人工智能开源社区的技术群体,对中国深度求索等大模型的开源策略总体上是高度肯定的,开源社区为中国人工智能技术发展争取了更多国际参与和支持,有力推动着全球人工智能开源社群建设与安全共识讨论。同时,开源有助于通过技术共享化解大模型带来的安全焦虑,提升技术透明度和可追溯性,减少“技术黑箱”引发的不信任。
但如何权衡开源收益与潜在风险,则需要根据人工智能技术的进步持续评估。在大模型时代的治理实践中,中国更需要坚持敏捷治理理念:监管不是“关门禁入”,而是实现“开门有序进入”,既要维护大模型技术创新,也要规避技术发展带来的安全风险,促进公共利益最大化,实现创新目标与安全风险之间的有机平衡。
综上所述,相比开源软件阶段,在大模型时代,开源创新作为技术创新模式、群体激励机制、商业竞争策略和安全治理路径的四大价值逻辑依然延续。在此背景下, 构建大模型开源创新公地的中国叙事,将更好地发挥中国的创新能力和全球影响力。
大模型开源创新公地的中国叙事
纵观人类信息文明发展史,开源创新模式为充满不确定性的技术发展路径带来了价值逻辑上的确定性;回到当下的人工智能大模型开源创新实践,大模型开源治理也面临诸多挑战。其根本原因在于,伴随着技术发展演进,大模型的开源内容与软件相比已有较大不同,开源治理维度更复杂,其背后所引发的人工智能技术竞争格局的调整也更为深刻。一方面,大模型时代的开源治理维度更为复杂,大模型的开源对象已经不再局限于软件开源活动中的源代码,而是拓展到模型的训练过程、训练数据、模型参数、推理过程、推理结果、参数权重、开发工具、硬件资源、应用接口等全链条各环节,至少包含开源模型、开源工具和开放科学层次。另一方面,大模型时代的全球开源生态格局正在发生改变。美国凭借其强大的科技力量与先发优势在开源开发者的各项指标中依然占据领先位置,但无论是影响力还是贡献度在近年来都出现了明显下滑。
在此背景下,人工智能开源治理的内涵也变得更为丰富、治理主体更为多元、中国的参与度和影响力也可能进一步提高。构建具有中国叙事优势的大模型开源创新公地,也正由理论构想转向实践落地。
(一)构建大模型开源创新公地的实践需求
2021年前后,开源创新发展历程中曾出现了两大里程碑式事件,它们共同构成了构建大模型开源创新公地中国叙事的时代背景。一是在美国,OpenAI发布GPT-3大模型及其产品ChatGPT,定义了人工智能技术发展的新前沿;二是在中国,“开源创新”首次被写入国家发展规划。在《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》的第十五章“打造数字经济新优势”中,“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务”已然在列。
当开源创新伴随人工智能技术的发展从社区走向市场,也逐渐被各国政府纳入政策视野。因此,如何更好发挥政府在人工智能技术发展和当下大模型技术治理中的作用也成为争论的焦点。开源创新既是推动大模型等人工智能前沿技术发展的一个重要协作机制,也是中国迈向世界科技强国、让世界看到中国创新贡献和中国开放精神的重要契机。当前中国的大模型开源创新正处于从“参与融入”到“蓄势引领”的关键阶段,构建大模型开源创新公地中国叙事的独特性,不仅需要鼓励开源技术社区的自发投入和企业以盈利为目的的市场开拓,也需要发挥有为政府的积极作用,降低大模型等人工智能技术在科学研究和垂直行业领域的研发与应用门槛,优化社会和市场中各类主体的创新成本,赋能行业效率提升。
(二)构建大模型开源创新公地的理论内涵
笔者曾从公地治理理论视角出发,将“大模型开源创新公地”界定为, 以开源方式对大模型创新活动中各类创新资源,如源代码、数据、算法、模型架构、参数权重、硬件算力、算力网、工具链、创新政策、治理策略等投入的共建共享创新公共基础设施及服务。 大模型开源创新公地的中国叙事,其内涵是构建并实践具有中国特色的、“政府—市场—社会”三位一体的大模型开源创新公地治理模式,强调通过政府服务于人工智能敏捷治理能力建设,推动大模型等人工智能技术健康有序发展,长期造福人类社会。
在开源创新技术史中,公地治理理论是解释开源创新何以成功延续的经典理论框架。以诺贝尔经济学奖得主奥斯特罗姆(E. Ostrom)为代表的经济学家和管理学者将软件开源创新实践与人类既有经济物品的属性进行比较后发现,开源软件的核心特点是允许任何人在接受开源许可证的条件下自由获取、修改或分发软件源代码,这区别于大众熟悉的基于传统私有产权制度的商业软件开发模式。人们对开源软件的使用具有非排他性和非竞争性,在此基础上学者们提出了“市场—社会”合作的开源创新模式,并对开源创新的可持续性问题进行解释。
大模型是本次人工智能技术浪潮的最新前沿,开源创新正成为大模型发展的新引擎。中国是全球最重要的人工智能应用市场和开源创新源发地之一,以大模型为最新代表,人类社会正在进入一个人机物三元融合、万物互联的智能时代,人机协作、持续学习、成长演化成为人工智能技术发展的核心特征。由于大模型开源与传统软件开源在开源要素、策略、竞争模式、算力和数据需求等方面差异显著,开源软件阶段“市场—社会”合作的开源创新模式面临挑战;在大模型技术进步和应用普及过程中,人工智能开源治理变革也正在发生。
尽管大模型研发和应用需要建设大型人工智能基础设施已达成共识,但是中国和美国的具体实施路径存在明显差异。以OpenAI尝试由非营利性组织转型为商业公司为例,其对机构性质的权衡及对开源路径与闭源获利的“纠结”,源于大模型研发创新过程中能源、算力和数据成本投入巨大、技术外溢风险高企,仅依靠社会或市场主体难以维持大模型创新公地的有效供给。大模型的训练成本随迭代升级呈指数级增长,从创新发现到产业规模化应用的盈利闭环尚未形成,不同利益主体对大模型的经济、社会和国家安全影响尚未达成共识。单一市场组织或社会组织难以承担大模型的研发投入与治理成本,而曾经成功的开源社区、开源基金会与商业企业合作提供创新公地并实现软件商业价值转化的模式,在大模型时代则面临算力、能源和数据等创新边际成本递增的挑战。
目前,美国更多依靠私人投资推进大模型等人工智能基础设施建设。近年来,美国科技巨头持续加大对能源、算力和数据资源的投资。比如,2025年3月19日,埃隆·马斯克领导的xAI公司宣布参与美国资产管理公司贝莱德牵头的人工智能基础设施投资基金,用于生成式人工智能的研发和配套数据中心的算力支撑;2024年9月,微软公司与星座能源公司达成一项20年核电购买协议,重启三里岛核电站;2024年10月,谷歌宣布将考虑追加对太阳能等方面的投资,并评估小型模块化核反应堆等技术。这些科技巨头企业大举投资核能等基础设施建设,主要目的都是为人工智能算力中心储备高效能源。不过,特朗普政府于2025年1月推出的“星际之门”(Stargate)计划,已将人工智能算力投入纳入联邦预算。
与此相比,中国在大模型开源创新公地建设方面具备独特优势。中国政府通过有效参与人工智能创新基础设施的建设和维护,以开源共享方式投入大模型创新资源,形成“有为政府、有效市场、有机社会”三位一体的开源创新公地。在大模型开源创新公地中,“有为政府”强调政府在推动开源发展战略和引导应用落地方面,可以发挥试点示范和政策引领作用,例如指导地方建立开源创新联合体、发布开源相关的政策法规、对相关风险进行兜底和预测。“有效市场”强调企业作为大模型等人工智能技术创新的主体,应从开源参与者转变为核心贡献者及全球性开源项目的发起者。“有机社会”强调社会主体的积极参与,鼓励高校、科研机构、国际组织、学会协会以及开源基金会等为大模型开源活动提供知识、服务和平台支持。
推动有为政府、有效市场和有机社会的协同治理,尤其是通过政府协调大模型开源创新活动中的公共资源配置,可以纾解创新成本压力,也得到越来越多的实证支持。例如,2025年4月,麦肯锡联合Mozilla开源基金会发布的《2025人工智能时代下的开源技术研究报告》显示,开源AI在成本效益、性能表现以及开发者社区吸引力方面优势显著,开源AI将在未来融入企业和国家的核心战略,但在价值实现速度和风险感知上面临网络安全、合规性和知识产权等挑战,建议各国政府、企业与国际组织建立完善的风险评估和应对机制以及形成相应的治理框架。
(三)如何构建大模型开源创新公地
构建大模型开源创新公地的中国叙事已经具备一定的公众认知基础与创新实践积累,与此同时,中国大模型开源创新公地建设也不乏挑战,这些挑战主要来自算力、平台和认知三方面。一是来自算力资源的地缘挑战。目前,中国顶尖的开源大模型主要依托美国英伟达公司的GPU芯片构建计算平台并完成训练和推理部署。面对美国可能对高端芯片及其产业链实施的精准封锁,中国开源大模型的可持续发展和国际竞争力仍面临较大不确定性。二是来自开源平台的地缘挑战。中国的大模型主要依赖于主流开源平台GitHub和Hugging Face发布并产生全球性影响力,实现国际技术社区追随和社交媒体传播。鉴于美国在全球开源平台上的主导地位,中国开源大模型生态的健康发展也面临较大不确定性。三是来自社会认知的地缘挑战。中国开源大模型的推出面对十分复杂的舆论环境,国内外对中国人工智能技术能力和发展路径等方面存在认知混乱。
准确把握人工智能技术尤其是开源大模型带来的颠覆性机遇,发挥好新型举国体制优势,需要有为政府、有效市场和有机社会协同发力,建好建强中国的开源大模型创新基础设施,实现中国人工智能开源创新生态的“蓄势引领”。为此,本文围绕大模型开源创新公地建设,提出三方面政策建议。
其一,加快中国大模型开源创新公地中的人工智能创新基础设施建设。 一是在中国智算软硬件平台上适配大模型。支持和引导人工智能技术研发企业与国产智算芯片企业积极合作,在国产智算平台上适配大模型,丰富大模型训练和推理的基础软件栈及开发工具,与中国算力网和代码托管平台实现生态互通。二是在中国算力网上共享算力资源。指导相关国家实验室以中国算力网为平台,汇聚和调配各类主体在各地建设部署的算力资源,提供“云际”算力资源调度服务,满足中国人工智能开源生态伙伴对算力的需求,降低算力成本,打破国际算力壁垒,培育具有世界吸引力的人工智能算力基础设施。三是在中国开源平台上培育开源生态。鼓励人工智能技术研发企业依托开放原子开源基金会等提供的AtomGit开源平台、中国计算机学会等社会力量提供的GitLink开源平台、开源中国等市场力量提供的Gitee开源平台,将基础大模型以及基于其开发的分支版本,同步更新在中国的开源平台上,并使之逐步成为生态主场,为中国人工智能大模型开源创新发展提供更多可供选择的开源代码托管平台,培育更多类似于深度求索的发源于中国、具有世界影响力的开源根社区。
其二,强化中国人工智能开源开放的国际叙事。 一是塑造中国开源创新的价值内核。以深度求索为例,其大模型开源在全球技术社区与美国社交媒体引发现象级传播,打破了西方对中国开源创新 “拷贝模仿” 的刻板认知,展现了中国开源创新从“学习借鉴、参与融入”向“自主创新、蓄势引领”的跃升态势。为此,应抓住机会,在全球社交媒体和开源社区中持续传播中国开源创新的价值追求,在全球范围内推广多元包容的开源创新公地叙事,构建面向世界的技术自信和开源开放价值体系。二是形塑中国青年创新群体的国际形象。鼓励在大模型研发过程中展现战略眼光和创新能力的青年人才在国内外开源平台发布成果、进行国际交流,以创新叙事重构国际社会对中国科技青年的认知。三是把握网络认知和舆情塑造的基本规律。关注并研判国内外网络媒体和社会舆论对中国人工智能开源技术发展的刻意解读和信息伪造,用新一代科技创新形象扭转国际技术社群和创新主体对中国的“刻板印象”,形成中国人工智能开源发展、普惠包容的全新世界性叙事。
其三,坚持包容审慎的敏捷治理机制。 一是主动推进敏捷包容的大模型开源创新治理机制。在开源大模型领域推进和加强标准治理,解决好开源什么、如何开源、何时开源、开源给谁等突出问题,深入研究如何在大模型等人工智能前沿技术治理中引入可控开源方案,将开源大模型的监管卡口设置在基础模型预训练之后、垂直领域微调之前,既通过大模型赋能垂直领域的千行百业,又实现大模型与人类社会的价值对齐,有效解决大模型开源内容治理、支撑技术治理、产业社会风险治理及地缘政治与安全治理难题,实现创新灵感激发、商业价值转化、生态资源汇聚、风险安全需求之间的平衡。二是鼓励市场主体自觉履行人工智能安全治理职责。引导和监督人工智能企业主动加强行业自律,遵守安全治理承诺,发挥人工智能创新主体在人工智能创新和安全治理方面的主动性和创造性。相关监管部门应采取常态监管模式,给像深度求索这样的企业更加宽松的监管环境,允许一定范围内的试错纠错,不过度干预市场主体的正常活动,引导形成行业自律的主导态势。三是通过多种渠道积极参与人工智能国际治理。建议通过正式外交渠道及二轨渠道,保护相关市场主体能够基于现有国际治理规制进行日常运营,保持其国际影响力和市场竞争力,争取国际开源技术社区对中国开源项目的持续支持。同时,考虑在全球性场合发起学术界和科技产业界对人工智能大模型开源伦理框架和技术标准的常态化对话机制。
结语
开源创新活动源于20世纪七八十年代信息技术的突破和个人计算机的兴起,在21世纪初的互联网技术革命中通过与平台商业模式的结合获得了巨大成功,实现了产业价值与知识创新的共赢。大模型时代开源创新的价值贡献突出体现在四大方面:第一,通过开源社区中的优胜劣汰,实现不同技术路径的适者生存,在前沿信息技术发展的不确定性中,实现对路径选择成本的控制;第二,通过有效激发与汇聚全球智力资源,实现对前沿技术创新活动的高效组织;第三,通过跨越时空的全球化、分布式协作打破商业垄断,实现后发优势;第四,通过多元参与、共同制衡、相互依赖的协作模式,实现技术创新与风险治理的有机平衡。上述价值逻辑在以大模型为代表的人工智能技术发展中依然延续,但其治理逻辑已发生显著变化。建设“政府—市场—社会”有机协作的大模型开源创新公地,成为中国引领全球人工智能技术有序健康发展的重要机遇。
开源的核心要义是协作、开放、共享和创新,这与中国社会变迁、技术发展和自主知识生产具有一致性。 在中文语境中,“开源”原指河流源头的开拓。随着社会发展和语言变迁,“开源”一词被应用于科技、经济等领域,同时也被赋予了新的时代内涵。如今,开源不仅是一种实践科学,还是一种文化和精神,既关注开源开发、治理与运营,也鼓励创新、协作和共享。构建大模型开源创新公地的题中之义,是在人工智能前沿技术创新领域推进“有为政府”“有效市场”和“有机社会”的高效协同,通过三方协作提供开源大模型基础设施与服务,提升创新效能。与此同时,在全球人工智能敏捷治理实践中,需要积极推进人工智能技术普惠、有效应对技术发展风险、激发群体创新智慧,提供普惠、开放、包容的开源大模型创新基础设施与服务。
尽管开源创新活动发端并繁荣于欧美国家,但随着中国科技创新能力的提升,开源实践已走过“学习借鉴”“参与融入”阶段。中国能否在人工智能领域打造世界级创新生态,取决于我们能否抓住新一轮人工智能技术和产业变革的机遇,认知并把握颠覆性技术开源创新的价值规律,实现历史性跨越。构建大模型开源创新公地的中国叙事,将为中国人工智能治理理论与开源创新实践带来新的历史性机遇。
来源:梦宇讲历史