美国大模型生存之战:xAI、Anthropic、OpenAI、Meta Llama 全方位竞争扫描

B站影视 2024-12-03 12:09 2

摘要:前几天分享了中国大模型生存之战:只有BATH四巨头,没有群雄反响很强烈,一天时间有很多朋友转发。OpenAI GPT-3.5 于 2022 年 11 月 30 日正式发布,距离现在整2年时间,这2年时间,美国大模型生态已形成AI四强格局,xAI、Anthrop

前几天分享了 中国大模型生存之战:只有BATH四巨头,没有群雄 反响很强烈,一天时间有很多朋友转发OpenAI GPT-3.5 于 2022 年 11 月 30 日正式发布,距离现在整2年时间,这2年时间,美国大模型生态已形成AI四强格局,xAI、Anthropic、OpenAI、Meta Llama。那四强在技术与商业上有哪些各自的差异呢?兵哥带大家慢慢看。

核心思想:OpenAI是发现新大陆的人但不代表就是他是最后的王者,最后应该是马斯克的xAI和亚马逊投资的Anthropic应该是真正的黑马。

11月22日,亚马逊宣布向AI创业公司Anthropic再投资40亿美元。这笔投资以可转换债券的形式分阶段进行,首笔付款为13亿美元。这是亚马逊近30年最大的一笔对外投资,也是两年来对Anthropic的第三次投资。今年 3 月,亚马逊曾向Anthropic投资27.5亿美元。2023年9月,亚马逊也曾对Anthropic投资12.5亿美元。迄今为止,亚马逊总计已向Anthropic投资80亿美元,是Anthropic的最大投资者,持股比例为58.4%。Anthropic的第二大投资者是谷歌,2023年谷歌曾向Anthropic投资23亿美元。谷歌对Anthropic的持股比例为14.6%。

埃隆·马斯克的人工智能初创公司 xAI 告诉投资者,它在一轮融资中筹集了 50 亿美元,估值达到 500 亿美元——是几个月前估值的两倍多。

卡塔尔的主权财富基金卡塔尔投资局,以及投资公司 Valor Equity Partners、Sequoia Capital 和 Andreessen Horowitz 预计将参与这一轮融资,知情人士透露。这笔融资使 xAI 今年筹集的总金额达到 110 亿美元。

10月,OpenAI在官网宣布,最新一轮融资中筹集了66亿美元(约460亿人民币),融资后估值达到1570亿美元。本轮由美国风投公司Thrive Capital领投,微软继续参投,英伟达、软银都进行了首次跟投。此外,其他投资方还包括Khosla Ventures、Altimeter Capital、富达、Tiger Global(老虎全球基金)、阿联酋投资公司MGX等。

Meta AI最近发布了 Llama 3.2。这是他们第一次推出可以同时处理文字和图片的多模态模型。这个版本主要关注两个方面:视觉功能:他们现在有了能处理图片的模型,参数量从11亿到90亿不等。轻量级模型:这些模型参数量在1亿到3亿之间,设计得小巧玲珑,可以在手机或者边缘设备上运行,不需要联网。

OpenAI:先驱者的深厚底蕴

一、OpenAI 的技术优势

OpenAI 在技术方面具有显著优势。其机器学习算法速度快,能够在较短时间内完成大量数据分析和模型训练,从而提高机器学习的效率。例如,有资料提到 “OpenAI 的机器学习算法可以在较短的时间内完成大量数据分析和模型训练,从而提高机器学习的效率”。

OpenAI 针对复杂版本开发了一系列复杂的深度学习模型,这些模型可以解决许多复杂的机器学习问题。其最新的版本是 GPT-4,有超过 1000 亿个参数,是目前世界上最大的 AI 模型之一,能够处理各种复杂任务,如写文章、写代码、聊天、回答问题等。

OpenAI 训练出来的模型性能优异,且支持用户自定义准确度、模型大小等参数。用户可以根据自己的需求调整模型,以获得更符合特定场景的结果。

此外,OpenAI 还支持开源社区,用户可以免费使用 OpenAI 提供的工具,帮助他们更好地发掘自然语言处理和机器学习的能力。例如,OpenAI 将 VPT(Video Pre-Training)项目开放给全球开发者,鼓励社区贡献和改进,共同推动视觉模型的发展。

二、OpenAI 的财务结构优势

OpenAI 最初是由一群企业家和科技领袖创立的非营利性组织,后创建 “有限盈利公司” 子公司吸引投资。这种独特的组织形式既保持了对实现人工通用智能这一伟大愿景的追求,又能吸引资金和人才推动公司发展。

OpenAI 目前已筹集约 140 亿美元资金,大部分来自微软。这些资金为 OpenAI 获取数据和计算力提供了强大支持,使其能够不断创建更智能的模型。例如,OpenAI 最新的模型 GPT-4 估计花费了近亿美元来训练,而高额的成本也体现了其在技术研发上的投入。

OpenAI 的财务结构使其在吸引投资方面具有一定优势。虽然关于人工通用智能的定义和意义存在学术争论,但投资者似乎相信,如果 OpenAI 能够继续增长,他们就可以获得风险投资级别的回报。为了保持对投资者的吸引力,OpenAI 也放松了盈利上限的限制,改为基于年化收益率。

然而,OpenAI 的财务结构也存在一些挑战。例如,作为一家追求通用人工智能的公司,OpenAI 需要平衡其长期目标与短期商业利益之间的关系。同时,其特有的产权结构使得融资变得尤为困难,大量以获得投资回报为目的的资本可能不愿进入,因为非营利组织不允许任何主体要求分配利润。此外,OpenAI 在非营利组织和营利性子公司的混合治理结构下,需要确保营利性实体的活动符合非营利组织的宗旨和使命,避免潜在的利益冲突,这也增加了治理的复杂性。

Anthropic:专注安全与创新的挑战者

一、强大的技术实力

Anthropic 在非结构化数据处理方面展现出强大实力,其核心优势在于使用 “Unstructured Generalization” 算法,让 AI 在处理非结构化数据时更加高效。相较于 OpenAI 的 GPT 系列,这一算法使得 Anthropic 在处理复杂多样的非结构化数据时具有明显优势。

Anthropic 的重点研发方向是语言模型的安全性与可解释性。在安全性验证与对抗训练方面,开发出一系列针对语言模型的攻击方法,以测试模型的鲁棒性与对抗性,从而找到模型可能产生不安全或有害回复的规则和情况。在价值对齐及可解释性方法研发上,探索语言模型对人类价值的理解,避免有害回复产生,通过 “内部推理” 判断每一个行为或生成的回复是否安全。同时,在稳定和理解推理方法研发方面,致力于扩展模型在复杂推理与问题解决方面的能力,让模型理解更加稳定和可靠。

二、卓越的产品与服务

Anthropic 的 Claude 大模型系列产品根据不同定位分为多个版本,如 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。其中,Haiku 是成本最优,市场上速度最快、成本效益最高的模型;Sonnet 平衡性能和速度,性价比最高;Opus 是最先进的高性能模型,号称已经超越 GPT-4。这些模型在视觉、逻辑推理、编程、数学等方面表现出色。

例如,从官方披露的测试数据来看,Claude 3.5 Sonnet 在逻辑推理、编程、数学等方面的表现性能均超越 GPT-4o。其不仅是当前最前视觉模型,在标准视觉基准上超越了 Claude 3 Opus,还在视觉数学逻辑推理、科学图解分析、图表分析、文件视觉分析方面表现性能全部优于 GPT-4o。

Anthropic 还推出了 AI 安全解决方案,包括模型审计、隐私保护和对抗性攻击防御等功能。利用在 AI 安全领域的专长,旨在成为 AI 安全系统的重要供应商。

为满足不同用户需求,Anthropic 针对个人和企业推出付费订阅服务。2023 年 9 月推出首个付费版本的 AI 聊天机器人 Claude Pro,在美国每月收费 20 美元,在英国为 18 英镑,用户会获得比免费的 Claude 级别多 5 倍的使用量。2024 年 5 月推出针对企业的新付费计划 “Team”,为企业客户提供 Claude 3 系列模型及更高优先级访问权限,定价为 30 美元 / 用户 / 月。

此外,Anthropic 推出了 iOS 应用,提供对 Claude 3 的访问,包括免费访问以及升级的 Pro 和 Team 访问,并与 Anthropic 的网络客户端同步,利用 Claude 3 的视觉功能为上传和保存的图像提供实时分析。

三、创新的组织与运营

Anthropic 采用 “公益公司 + 长期利益信托基金” 的创新治理方式。该信托是 Anthropic 独特类别股票(称为 “T 类” 股票)的唯一持有者。这些股票不支付股息,也无法交易,因此不可能从中获利。然而,T 类股持有人有权任命和解雇 Anthropic 的五名公司董事中的三名,从而使他们能够长期控制公司的发展方向。

这种独特的公司结构充当了 “终止开关” 机制,如果人工智能技术的发展开始转向危险的方向,董事会就可以进行干预。董事会成员仍会因其服务而获得适度的经济补偿,以确保他们有动力做出符合公司使命和价值观的决策。

Anthropic 的创始团队成员具有深厚学术和技术背景,大多为 OpenAI 的前核心员工。他们曾深度参与过 OpenAI 的 GPT-3、引入人类偏好的强化学习等多项研究。带头出走的是一对兄妹,Dario Amodei 和 Daniela Amodei,他们因想建立一个安全性和可控性更高的模型而辞去 OpenAI 工作,并带走了曾在 OpenAI 领导 GPT-3 模型的工程师 Tom Brown。

四、广泛的资本运作与生态体系

Anthropic 拥有近 60 家投资者,包括亚马逊、谷歌等战略投资者,最新融资估值达 184 亿美元。2023 年,Anthropic 这颗 “金子” 持续发光发热,迎来更多势力雄厚的投资者。谷歌向 Anthropic 投资了约 3 亿美元,以换取该公司 10% 的股份,并提供资金支持和计算资源。亚马逊也对 Anthropic 进行了重金投资,双方在大模型训练领域展开广泛合作。

Anthropic 通过与合作伙伴合作、赋能开发者、参与发起前沿模型论坛等构建强大生态系统。与多家公司和组织合作,扩展技术实力,助力产品推广。一是可以使用战略合作伙伴的云计算等资源,如使用亚马逊计算芯片、大语言模型等。二是与 Notion、Quora 和 DuckDuckGo 等公司合作,将 Claude 集成到他们的产品中。为开发者提供了一系列工具和资源,用于构建使用 Claude 的应用程序,包括开发人员控制台、SDK 及详细 Claude 使用文档等。参与发起前沿模型论坛,扩大其影响力并实现安全可靠的大型语言模型的广泛应用。

xAI:马斯克的 AI 新势力

在人工智能的浪潮汹涌澎湃之际,埃隆·马斯克的身影始终活跃其中。2023 年 3 月,他曾参与签署公开信呼吁暂停生成式人工智能竞赛,然而仅仅 4 个月后,便通过 xAI 公司一头扎进了这片市场。如今,xAI 已成为发展最为迅猛的公司之一。在获得 60 亿美元融资的短短 6 个月后,这家推出聊天机器人 Grok 的初创公司再度融资 50 亿美元,公司估值也随之翻番,高达 500 亿美元。

据美国《华尔街日报》消息,本轮融资吸引了卡塔尔主权基金卡塔尔投资局、美国勇武股权伙伴公司,此前参与上一轮融资的红杉资本公司和安德烈森 - 霍罗威茨公司也继续加注,沙特王子瓦利德·本·塔拉勒同样在本轮融资中现身。值得一提的是,与马斯克的特斯拉和太空探索技术公司等其他企业类似,特朗普赢得总统选举后,投资者对 xAI 公司的兴趣愈发浓厚。

xAI 专注于大语言模型开发,其聊天机器人 Grok 仅向社交平台 X 的付费用户开放。与 OpenAI、微软、谷歌和 Anthropic 等公司推出的模型有所不同,xAI 的模型大力宣扬马斯克的自由主义思想,除色情内容等极少数特殊情况外,几乎未设置防护机制。Grok 不仅能够给出符合市场标准的答案,还具备生成政治人物或受版权保护形象图像的能力,而这是其竞争对手所不被允许的。它会像马斯克一样,以率直、幽默的语气表达观点,这些都得益于在 X 平台接受培训时所积累的数据。马斯克甚至还邀请用户分享医疗数据、X光 片和核磁共振扫描结果,足见其对数据收集的重视与大胆尝试。

为 xAI 提供强大运算支撑的是位于美国田纳西州孟菲斯市的超级计算机 Colossus。它配备了多达 10 万个英伟达 H100 芯片,英伟达公司首席执行官黄仁勋曾称其为“地球上速度最快的超级计算机集群”。这种芯片单价高昂,达数万美元,使得 Colossus 的造价甚至超过了纽约世贸中心一号大楼。令人惊叹的是,该超算的组建仅耗时 122 天,创下了行业纪录。

然而,在一片繁荣景象背后,xAI 也面临着一些挑战。从现有数据来看,情况并不十分乐观。据 Statista 数据平台统计,OpenAI 的 ChatGPT 每周用户数量已突破 2 亿,而 Grok 的 X 付费用户数量仅为 64 万(X 平台活跃用户总数为 2.5 亿),差距较为显著。在美国大选期间,Grok 更是多次登上新闻头条,不过却是负面新闻居多。与其他更为谨慎的人工智能不同,Grok 曾做出大胆预测,甚至在计票尚未结束时就宣称特朗普在某些州获胜,这无疑引发了诸多争议与质疑。但未来情况或许会有所转变,据一位知情人士透露,xAI 正在新西兰进行测试,旨在向 X 免费用户开放 Grok。该人士表示:“在纽约,各类人工智能模型的广告随处可见,所有参与者都在全力抢占市场份额,毕竟在这个领域,赢家往往通吃。”并且明确指出,马斯克的每家公司背后都兼具“社会计划与盈利需求”。

在商业运营方面,为了让巨额投资产生回报,xAI 与其他竞争对手一样,需要借助其他企业的力量拓展业务。例如,xAI 将 Grok - 1 模型放置到抱抱脸公司平台上,但结果并未如预期般引发用户热潮。抱抱脸公司平台的一位发言人表示:“应用程序接口仅被下载了 3000 次,几乎可以忽略不计。Grok 模型过大,对一些公司而言安装成本过高,这是导致下载量少的主要原因。”

在这场激烈的人工智能竞赛中,马斯克也毫不手软地对竞争对手施加影响。OpenAI 改为营利性公司后,马斯克便将其告上法庭。凭借雄厚的资金实力,马斯克计划从英伟达再购入 10 万个新处理器,进一步提升自家模型性能,力求在竞争中脱颖而出。据英国《金融时报》报道,英伟达还有可能参与 xAI 正在筹备中的下一轮融资,这无疑将为 xAI 的未来发展增添更多变数与想象空间。xAI 在马斯克的带领下,究竟会在人工智能的赛道上书写怎样的传奇,又将如何应对诸多挑战,让我们拭目以待。

Meta 的 Llama:开源力量的崛起

一、发展轨迹

Meta 在 AI 大模型领域的布局有条不紊地推进。2023 年 2 月 24 日,Llama 首次亮相,涵盖 7B、13B、33B 和 65B 四种参数规模的模型,开启了其在大模型领域的征程。随后在 2023 年 7 月 18 日,与微软合作推出 Llama 2,对模型进行了进一步优化和拓展,包括 7B、13B 和 70B 三种参数规模,并创新性地同时发布基础模型和经过指令微调的对话模型。到了 2024 年 4 月 18 日,开源推出新一代大型语言模型 Llama 3,包含 8B 和 70B 两种参数规模,展现出 Meta 在模型迭代方面的快速节奏。而 2024 年 7 月 23 日发布的 Llama 3.1 则进一步巩固了其在开源大模型领域的地位。

二、技术亮点

模型架构优化:Llama 采用标准的 decoder - only transformer 架构,并在此基础上进行了一系列的改进与优化。例如,使用 swiglu 激活函数替代传统的 relu 函数,有效提升了模型的表达能力和学习效率;采用旋转位置 embeddings 替代绝对位置 embeddings,使得模型在处理序列数据时能够更好地捕捉位置信息;引入分组注意力(GQA)机制,在不显著降低模型性能的前提下,大大改善了模型的推理效率,使其能够在资源有限的环境下也能高效运行;将词表扩展至 128k,显著提高了编码效率,并且支持 8192token 的超长序列,这使得 Llama 在处理长文本任务时具有独特的优势。预训练数据扩充与优化:Llama 3 基于 15 万亿 token 进行预训练,这一数据量是 Llama 2 的 7 倍之多,其中代码数据更是达到了 4 倍。如此大规模的预训练数据为模型提供了更丰富的知识储备和语义理解能力。同时,Meta 还开发了一系列严格的数据清洗流程,对预训练数据进行精心筛选和处理,确保数据的质量和准确性,从而有效提升了模型的训练效果和性能表现。训练优化策略:在训练过程中,Llama 使用 adamw 优化器,并结合余弦学习率等一系列精心设置的超参数,这些优化措施能够使模型在训练过程中更加稳定、高效地收敛。此外,通过因果多头注意力机制等先进技术的应用,不仅提升了训练速度,还减少了内存使用和运行时间,使得 Llama 能够在资源利用方面更加高效,降低了训练成本和对硬件资源的依赖。指令微调创新:Meta 在 Llama 的指令微调方面进行了大胆创新,将监督微调(SFT)、拒绝采样、近端策略优化(PPO)、直接策略优化(DPO)等多种技术有机结合。这种创新的指令微调方式取得了显著的效果,大幅降低了模型的错误拒答率,使得模型在与用户交互过程中能够更加准确地理解用户意图并提供合适的回答;同时,有效改善了模型与人类价值观的对齐性,使其输出的内容更加符合人类的道德和伦理标准;还增加了输出的多样性,避免了模型回答的单一性和模式化,从而显著提高了模型在推理、编程、指令理解等关键能力上的表现,使其能够更好地应对各种复杂的实际应用场景。

三、性能卓越

从性能表现来看,Llama 系列模型不断取得突破。Llama 1 的 13B 参数模型在多个数据集上就已经展现出了超越 175B 的 GPT - 3 的实力,这一成绩让业界对 Llama 系列模型刮目相看。而 Llama 3 的 8B 和 70B 参数模型较 Llama 2 又实现了极大的性能提升,在同等规模的模型竞争中脱颖而出,树立了新的性能标杆。例如,其 70B 指令微调模型在咨询建议、头脑风暴、分类、问答、编程等 12 个关键场景的评估中,明显优于同等规模的竞品模型,无论是在回答的准确性、完整性还是灵活性方面都表现出色,为用户提供了更加高质量的语言交互服务。

四、开源与生态

开源策略与开发者支持:Meta 选择将 Llama 的代码和权重全开源,这一举措在 AI 大模型领域引起了广泛关注和积极响应。开源策略使得全球范围内的开发者都能够自由地访问和使用 Llama 模型,为他们进行更深入的研究和应用开发提供了极大的便利。开发者们可以基于 Llama 模型进行定制化开发,根据自己的需求和创意构建各种独特的 AI 应用,从而促进了 AI 技术在各个领域的创新应用和普及。同时,Llama 3 与 PyTorch 生态无缝集成,借助 executorch,能够在各类移动和边缘设备上高效推理,这进一步拓展了 Llama 的应用范围,使得 AI 技术能够深入到更多的终端设备和场景中,如智能手机、物联网设备等,为构建万物互联的智能世界奠定了基础。安全与合规工具:为了助力开发者安全、可控地使用 Llama 3,Meta 提供了一系列实用的工具。例如,LlamaGuard 2 能够对模型的输出进行安全过滤和监控,防止模型生成有害、不适当或违反道德规范的内容;CodeShield 则专注于代码安全,在模型辅助编程过程中,对代码生成进行安全检查和漏洞检测,确保生成的代码质量和安全性;CyberSecEval 2 主要用于网络安全评估,帮助开发者评估模型在网络安全场景下的性能和潜在风险,保障模型在网络环境中的安全运行。此外,Meta 还更新了《负责任使用指南》,为基于 Llama 模型进行负责任开发提供了全面、详细的指引,涵盖了数据使用、模型应用场景、隐私保护等多个方面的最佳实践,引导开发者在合法、合规、符合道德伦理的框架内开展 AI 开发活动。云平台与硬件支持:Llama 3 即将在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM Watsonx、Microsoft Azure、NVIDIA NGC 和 Snowflake 等众多知名云平台上线,这将为企业和开发者提供更加便捷、灵活的模型使用方式。他们可以根据自己的需求选择合适的云平台,利用云平台的强大计算资源和服务来运行 Llama 3 模型。同时,Llama 3 还获得了 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 等硬件平台的支持,这意味着 Llama 3 能够在不同的硬件架构上实现良好的性能表现,无论是在高性能服务器、个人电脑还是移动设备上,都能够充分发挥其优势,为构建多元化、全方位的 AI 应用生态提供了坚实的硬件基础。

五、应用场景拓展

军事与国家安全领域:随着 Meta 将 Llama 提供给美国等国家的政府机构和国防承包商,其在军事和国家安全领域的应用逐渐崭露头角。在这个领域,Llama 可以帮助完成各种复杂的任务,如数据分析,能够快速处理海量的情报数据,挖掘其中的关键信息和潜在威胁;合成文件,根据给定的要求生成各种报告、文档等,提高工作效率;还可以用于追踪恐怖主义融资,通过对金融交易数据的分析,发现可疑的资金流动和关联;加强网络防御,利用其强大的语言理解和分析能力,识别网络攻击中的恶意代码和异常行为,及时采取防御措施,保障国家网络安全。民用领域创新应用:在民用领域,Llama 同样有着广泛的应用前景。在聊天机器人领域,它可以为用户提供更加智能、自然的对话体验,无论是解答用户的日常问题、提供娱乐资讯还是进行情感陪伴,都能表现出色;在文本生成方面,能够根据用户的需求生成高质量的文章、故事、诗歌等各种文本内容,为内容创作者提供灵感和创作辅助;在智能客服应用中,能够快速理解客户的问题并提供准确、高效的解决方案,提升客户服务质量和效率;在教育领域,可以作为智能辅导工具,帮助学生解答学习过程中的问题,提供个性化的学习建议和辅导材料,促进教育公平和个性化教育的发展。

竞争态势与格局演变

一、技术竞赛

在技术研发领域,这四家公司之间的竞争可谓异常激烈。OpenAI 凭借其先发优势和深厚的技术积累,不断对 GPT 系列模型进行迭代升级,试图在语言理解与生成的准确性、逻辑性以及对复杂任务的处理能力上保持领先地位。Anthropic 则聚焦于安全与可解释性这一前沿领域,通过独特的技术研发路径,努力打造出更加可靠、透明的 AI 大模型,在非结构化数据处理和模型安全方面逐渐形成自己的技术壁垒。xAI 虽然是新进入者,但凭借马斯克的影响力和雄厚的资金支持,积极探索创新技术路径,利用其聊天机器人 Grok 的社交媒体数据优势,在个性化交互和对现实世界数据的理解上寻求突破。Meta 的 Llama 则以开源为武器,通过不断优化模型架构、扩充预训练数据和创新指令微调方法,在模型性能、开发灵活性以及生态构建方面与其他三家展开竞争,尤其是在移动和边缘设备应用以及开发者社区支持方面独具优势。例如,在模型参数规模相同的情况下,Llama 3 的 70B 指令微调模型在多个关键场景评估中超越了其他竞品,这促使其他公司加快技术研发步伐,以应对 Llama 的挑战;而 Anthropic 的 Claude 3.5 Sonnet 在视觉、逻辑推理等特定领域的性能提升,也迫使其他竞争对手重新审视自己的技术路线并进行针对性的优化。

二、商业争夺

付费订阅与市场拓展:在商业运营方面,付费订阅服务成为了竞争的重要战场。OpenAI 部分功能需要用户订阅付费,通过提供不同等级的订阅套餐,为企业和专业用户提供更高级别的服务,如更高的使用配额、优先的技术支持等,以获取商业收益并维持其技术研发投入。Anthropic 推出的付费订阅服务则侧重于为个人和企业用户提供更安全、更个性化的模型使用体验,其 iOS 应用的推出进一步拓展了个人用户市场,增加了用户粘性。Meta 的 Llama 虽然开源,但也在探索商业合作模式,例如与云平台和硬件厂商的合作,通过在云服务中提供增值服务或与硬件产品捆绑销售等方式,实现商业价值的转化。xAI 则有望利用其融资优势和数据优势,在未来推出具有竞争力的付费服务,吸引用户并构建自己的商业生态。巨头合作与资源整合:与科技巨头的合作也是竞争的。

来源:商界AI

相关推荐