Nature刊文:“open AI”的实际作用非常有限

B站影视 2024-12-01 16:41 2

摘要:在大众的认知中,“open”通常意味着透明、共享和合作,尤其是在开源软件领域。然而,在人工智能(AI)领域,“open”一词却带来了许多模糊性和争议。事实上,AI 行业资源高度集中,“open”的真正意义和影响值得深入探讨。

整理:阮文韵

一贯坚持开源的 Meta 也会被业内人士狂喷。

开放源代码促进会负责人 Stefano Maffulli 就曾公开斥责 Meta,称用“open”描述 Llama 模型,是在混淆用户和污染“open”。

在大众的认知中,“open”通常意味着透明、共享和合作,尤其是在开源软件领域。然而,在人工智能(AI)领域,“open”一词却带来了许多模糊性和争议。事实上,AI 行业资源高度集中,“open”的真正意义和影响值得深入探讨。

那么,我们究竟该如何理解“open”呢?

在一篇发表在权威科学期刊 Nature 上的文章中,科学家们系统地剖析了“open” AI 的定义、实质特征与局限性。

“‘open’ AI 这个术语被广泛使用,但其实际涵义并不明确。我们发现,当代 AI 系统的开发和应用依赖于高度集中的资源,即便标榜“open”的 AI,其透明性、可重用性和可扩展性仍然受到资源垄断的限制。”研究人员在文章中写道。

他们通过分析“open” AI 的当前生态,探讨了其对资源共享、技术创新和市场竞争等的深远影响,同时呼吁对其经济政治背景进行更深入的反思和措施介入。

AI 的定义自其诞生以来就充满争议。在 70 多年的历史中,AI 这个词被应用于各种不同的技术方法,与其说是一个严谨的技术术语,不如说是一种营销概念和对未来愿景的表达。

近年来,AI 的定义倾向于描述基于概率的大型机器学习系统,尤其是生成式 AI,如大语言模型(LLM)。这些系统因其生成自然语言文本或图像的能力而广受关注。

类似的,“open”这一概念也在 AI 领域被频繁误用和扩展。传统意义上的“open”源于开源软件运动,具有透明性、可重用性、公平性的理念特征,但将这些理念直接应用于现代 AI,特别是生成式 AI 时,面临着以下挑战:

模型复杂性与黑箱性:现代 AI 系统由庞大的神经网络组成,仅公开模型权重和代码,不足以完全揭示其运作机制。

资源依赖性:这些模型的开发和训练需要昂贵的计算力和数据,这些资源通常由少数大公司控制。

技术应用的不对等性:“open”的模型可能会被滥用,而原开发者在这些问题上难以施加影响。


文章指出,当前一些所谓的“open AI”模型仅提供部分模型权重或受限制的 API,这种做法更接近“开放洗白”(openwashing),与真正的 open 相去甚远。

同时,文章强调,即便 AI 系统实现了更大的透明性或可用性,也不意味着行业权力格局会因此发生显著变化。AI 开发的资源成本(如计算力和数据获取)仍集中于少数大企业手中,使得市场竞争更加不均衡。

文章作者也对“open”AI 带来的三个关键优势进行了逐一剖析,并客观阐明了其潜力与局限性,指明尽管“open”AI 提供了关键优势,特别是在资源共享、技术创新和数据使用方面,但这些优势并未能真正打破由少数大公司主导的行业格局。

1. 透明性

透明性是“open”AI 最受关注的特性之一。一些 AI 模型会公开训练数据、权重或相关文档,允许研究人员验证系统行为,但透明性本身无法完全解答系统的复杂行为。例如,大模型的“涌现”(emergent)往往难以预测,仅仅知道模型权重或代码并不能全面理解其运行原理。因此,文章呼吁理性看待透明性的价值,特别是在 AI 系统的行为责任问题上。

2. 可重用性

“open”AI 通常允许第三方在已有的模型或数据基础上进行再利用。公开许可的数据和模型权重,以及经常使用传统的开源许可来提供这些数据,为“open”AI 将对市场竞争产生固有积极影响的说法提供了依据。

然而,市场访问仍然是一种受限制的资源。即使是有资源的参与者,他们拥有创建大规模模型的资金、人才和数据,也不总是有明确的方法来部署这些模型或确保投资回报,这是由于市场访问存在重大瓶颈。

3. 可扩展性

“open”AI 的可扩展性表现在其支持用户基于基础模型进行微调,从而将模型适配于特定领域或任务。这是公司支持“open”AI 的关键特征,在很大程度上是因为,“扩展”现成模型的工作也为那些可能想要重新利用微调模型的人提供了免费的产品开发。

扩展“open”AI 模型意味着从事这项工作的人不会从一张白纸开始。他们采用了一个已经经过艰苦且昂贵的训练的大模型,并调整其参数,通常在进一步的数据上进行训练,通常是专门的数据,以适应特定领域或任务的性能。

尽管“open”AI 这个概念听起来充满潜力,但 AI 系统的开发和应用依赖于一系列高度集中的关键资源,包括模型、数据、劳动力、算力和开发框架。这些资源不仅决定了技术的可用性,也深刻影响着市场竞争和权力分配的格局。

具体而言,在“open”AI 的讨论中,AI 模型是最直观的焦点。近年来,像 Meta 的 Llama 3 和 BigScience 的 BLOOM 等 AI 模型虽一直在标榜自身“open”,但这些“open”模型的实际作用却非常有限。许多模型仅提供 API 接口,并不能让用户真正了解其内部机制或进行修改。即便是那些较为透明的模型,也依赖于企业独占的训练资源,其他开发者难以复制这些资源,从而无法平等参与竞争。

在 AI 系统中训练数据同样至关重要,但许多开源模型并未完全公开其训练数据的来源和处理方式,这一不透明极大限制了外界对模型的验证。此外,采集高质量数据往往需要巨大的成本和资源,而这通常只有少数大型企业能够承担,这进一步巩固了它们在行业中的主导地位。

在 AI 领域,除了模型与数据外,劳动力同样是关键资源之一,尤其是训练和开发这些复杂模型的高技能人才。然而大型科技公司不仅掌握着计算能力和数据资源,同时也主导着 AI 研究和开发所需的顶级人才市场。

与此同时,算力也是一项受垄断的关键资源。AI 训练需要大量的计算资源,而像英伟达这样的企业几乎垄断了高性能 GPU 市场。即使模型或代码被公开,运行这些模型的计算成本依然高昂,导致中小型开发者无法参与竞争。一些计算框架(如英伟达的 CUDA)也进一步强化了技术垄断,使得开源模型仍然依赖于特定的计算生态,限制了其实际应用范围。

此外,在开发框架方面,一些开发框架诸如 Meta 的 PyTorch 和 Google 的 TensorFlow 虽然是开源的,但它们的设计和控制权掌握在少数大公司手中,这些公司不仅定义了技术标准,还通过构建自己的生态系统进一步巩固了市场主导地位。

总而言之,“open”AI 虽然在透明度与共享方面具有一定价值,但无法单独解决 AI 领域权力集中与资源不平等的问题。当前的开放性讨论更多地被大公司用作规避监管和争夺市场的工具,如果想要真正改变现状则需要有更强有力的措施介入,包括反垄断执法和数据隐私保护,否则仅仅追求开放性不太可能带来多大益处。

未来,各方应更加关注 AI 的实际影响,而非仅局限于开放与封闭的概念之间,只有开展多维度的政策和技术实践才能构建出更公平、更负责任的 AI 生态系统。

阅读最新前沿科技研究报告,欢迎访问米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到11月25日 ”未来知识库”精选的100部前沿科技趋势报告

Air Street Capital《2024 年人工智能现状报告》

未来今日研究所:2024 技术趋势报告 - 广义计算篇

科睿唯安中国科学院 2024 研究前沿热度指数报告

文本到图像合成:十年回顾

《以人为中心的大型语言模型(LLM)研究综述》

经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版

波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告

理解世界还是预测未来?世界模型的综合综述

Google Cloud CSA2024 AI 与安全状况调研报告

英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施

花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告

国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景

国际可再生能源署 IRENA2024 年全球气候行动报告

Cell: 物理学和化学 、人工智能知识领域的融合

智次方 2025 中国 5G 产业全景图谱报告

未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇

Deepmind:AI 加速科学创新发现的黄金时代报告

PitchBookNVCA2024 年第三季度全球风险投资监测报告

德科 2024 年未来全球劳动力报告

高工咨询 2024 年协作机器人产业发展蓝皮书

国际能源署 IEA2024 年全球能源效率报告

基因慧基因行业蓝皮书 2024 - 2025

普华永道 PwC2024 全球经济犯罪调查英国报告 - 智对风险直面挑战

中国互联网协会 2024 面向未来网络的数字孪生城市场景应用白皮书

中移智库 2024 先进感知新技术及新应用白皮书

智次方研究院 2025 中国 AIoT 产业全景图谱报告

未来今日研究所:2024 技术趋势报告 - 人工智能篇

国际电联:迈向衡量数字经济的通用框架的路线图

联合国粮食与农业组织:2024 年世界粮食安全和营养状况

大语言模型综述

李飞飞等,AI 智能体:探索多模式交互的前景综述

哈尔滨工业大学 - ChatGPT 调研报告

2024《美国核部署战略报告》最新文件

清华大学:AIGC 发展研究 3.0 发布版 b 版

OpenAI:2024 年 OpenAI o1 大模型技术报告

Verizon2024 年世界支付安全报告

皇家学会哲学学报 从复杂系统角度评估人工智能风险

复旦大学 大模型 AI 代理的兴起和潜力:综述

经合组织 OECD2024 年气候行动监测报告

Wevolver2024 年边缘人工智能现状报告 - 探索各行业边缘 AI 应用动态

2024 全球人形机器人产品数据库报告 - 人形机器人洞察研究 BTIResearch

《全球金融稳定报告》 把舵定航 不确定性、人工智能与金融稳定

瑞士洛桑联邦理工学院 《人工智能中的 - 创造力:进展与挑战》

《你所需要知道的理 - 论:人工智能、人类认知与决策》牛津大学最新 53 页报告

世界经济论坛 新兴技术时代的网络弹性导航:应对复杂挑战的协作解决方案 2024

ADL 理特咨询 2024 汽车出行未来展望报告

2024 中国硬科技创新发展白皮书 - 开辟未来产业新赛道

科学时代的大语言模型中的人工智能

Gartner2025 年重要战略技术趋势报告

CBInsights2024 年第三季度全球人工智能投融资状况报告

TrendHunter2025 年全球趋势报告 - 全行业顶级创新和变革趋势前瞻

天津大学 2024 大模型轻量化技术研究报告

欧洲海洋局 2024 导航未来报告将海洋置于更广泛的地球系统中第六版

美国安全与新兴技术中心 2024 AI 生成代码的网络安全风险研究报告

国际原子能机构 2024 年世界聚变展望报告

复旦大学 2024 大语言模型的能力边界与发展思考报告

安盛 AXA2024 年气候与生物多样性报告气候过渡计划路线图

YouGov2024 美国公众对人工智能 AI 的态度调研报告

麦肯锡中国报告:《中国与世界》完整版

麦肯锡全球研究所 2024 下一代竞技场报告 - 重塑全球经济的 18 个新兴行业领域

Project Sid,一个旨在模拟多智能体交互以研究 AI 文明的项目

德国研究与创新专家委员会 德国研究创新与科技成果报告

2024 年欧洲关键产业的科技重塑研究报告

智能体专题报告之二 - 智能体时代来临具身智能有望成为最佳载体

ActivateConsulting 2025 年顶级技术和媒体发展趋势报告

兰德 全球灾难风险评估

斯坦福李飞飞 《AI agent 综述》Agent AI 开启多模态交互新纪元

中国联通研究院 2024 中国生成式人工智能应用与实践展望白皮书中文版

普华永道 2024 第五次工业革命研究报告迈向弹性可持续和以人为本的未来

大成 Dentsons2024 年全球智慧城市与互联社区智库年度报告

TechUK2024 量子技术挑战与机遇并存构筑量子韧性的策略与实践研究报告

Emakina 将塑造 2024 年的技术趋势报告

图灵奖得主 Yann LeCun《机器如何才能达到人类智能水平?》——Yann LeCun, 附 Slides 及视频

华为:2024 鸿蒙生态应用开发白皮书 V3.0(最新版)

CASA:2023 第三代半导体产业发展报告

大型视觉语言模型中幻觉现象的综述

IEA PVPS:2024 光伏应用趋势报告(英文版)

ABI Research:82 个将会或不会在 2024 年发生的技术趋势白皮书

《美国反无人机系统未来趋势报告(2024 - 2029 年)》

《军事自主系统:未来之路》美空军

空间智能如何?牛津大学博士论文《深度具身智能体的空间推理与规划》

2024 低空经济场景白皮书 v1.0

战略与国际研究中心(CSIS)人类地月空间探索的总体状况研究报告(2024)

Artificial Intelligence Review:人工智能与物理学相遇的综述

麦肯锡:全球难题,应对能源转型的现实问题

欧米伽理论,智能科学视野下的万物理论新探索(研究论文)

Gartner 2025 年主要战略技术趋势研究报告

2024 人工智能国外大模型使用手册 + 中文大模型使用手册

详解光刻巨人 ASML 成功之奥妙 - 241015

CB Insights:未来变革者:2025 年九大科技趋势研究报告

国际电信联盟 2023 - 2024 年联合国人工智能 AI 活动报告

《人工智能能力的人类系统集成测试和评估》最新 51 页,美国防部首席数字和人工智能办公室(CDAO)

2024 瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

MHP 2024 全球工业 4.0 晴雨表白皮书

世界经济论坛白皮书《AI 价值洞察:引导人工智能实现人类共同目标》

瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

AI 智能体的崛起:整合人工智能、区块链技术与量子计算 (研究报告,书)

OpenAI o1 评估:AGI 的机遇和挑战(280 页)

世界知识产权组织:2024 年全球创新指数

美国白宫:国家近地天体防御策略与行动计划

上下滑动查看更多

来源:人工智能学家

相关推荐