云计算大厂揭秘组合拳:自研大模型只是开胃菜

B站影视 2024-12-16 18:47 2

摘要:在生成式AI竞赛中,亚马逊云科技(AWS)多少有些“另类”。它不像其他云大厂那样强调自研模型的顶尖性能,而是早早推出一个大模型货架,集邮般摆上了各家头部大模型,供客户挑选。

作者 | ZeR0
编辑 | 漠影

在生成式AI竞赛中,亚马逊云科技(AWS)多少有些“另类”。它不像其他云大厂那样强调自研模型的顶尖性能,而是早早推出一个大模型货架,集邮般摆上了各家头部大模型,供客户挑选。

没有一个模型能包办一切”,这个被亚马逊频繁强调的理念,已经逐渐深入人心。而在今年的年度云计算产业盛会re:Invent上,亚马逊云科技却又意外地发布全新大模型系列Nova的6款前沿模型,而且剧透了明年将发布的两款特别模型——语音到语音、任意到任意(Any-to-Any)。

这意味着亚马逊云科技在重押美国大模型独角兽Anthropic的同时,对自研模型也并未松懈。

在re:Invent期间,亚马逊云科技生成式AI全球副总裁兼总经理Vasi Philomin与智东西等少数媒体就这些问题进行了深入交流。他谈到当前文本模型需求最大,语音到语音也非常流行(如实时同传翻译),任意到任意则是更远的未来。

任意到任意模型属于多模态到多模态,用户可以输入文本、语音、图像或视频等多种形式的内容,并相应地输出文本、语音、图像或视频。

Vasi Philomin向我们解释说,任意到任意模型适用于变化很多的情况,比如不能确定是图像还是视频类型。“你不能把任意到任意模型用作文本到文本的模型,”他强调道,“它可能成本挺高,但效果反而不好。”

最强未必是最优解,好用才是硬道理。

整场re:Invent大会都在源源不断地传递一个信号——亚马逊云科技的生成式AI竞争力胜在全面,有琳琅满目的大模型品类,还有加速从训练到推理的各种工具“套餐”,以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的,即让云客户更快更方便地用生成式AI产生价值。

在沙利文大中华区总监李庆看来,本届re:Invent大会上的新发布更加侧重于产品的实际应用和工具优化,这表明过去一年中,全球用户正在积极使用亚马逊云科技进行生成式AI应用的探索和创新。

有两个方面令他印象深刻:一是随着全球企业对生成式AI的深入应用,数据不仅实现跨区域的传输与协同,更实现跨地域、跨区域的深度连接;二是亚马逊云科技进一步优化生成式AI的应用,从数据存储、治理到管理的全流程提升,旨在简化AI对数据的使用,同时强化模型功能、增加AI Agent管理和应对模型幻觉的功能。此外,新发布的Amazon Nova大模型家族备受期待,这一系列的模型和亚马逊云科技的开放选择理念将为用户带来更多创新机会,进一步推动AI的发展。

新发布的Nova基础模型包括MicroLiteProPremier模型,Micro是纯文本模型,后三者都是多模态模型,还有文生图模型Canvas和文生视频模型Reel。这些模型都支持微调和蒸馏,还与Amazon Bedrock的知识库深度集成,可用于检索增强生成(RAG)。

Vasi Philomin告诉智东西,亚马逊云科技的每个新模型、新服务在面世前都会经过内部讨论流程,Bedrock寓意“基石”,Nova寓意“新”。他说亚马逊云科技不会公布模型参数的情况,怎么选择取决于客户想要拥有怎样的灵活度。

“我们对所有的模型都一视同仁。”作为Amazon Bedrock的负责人,Vasi Philomin称自己的团队非常中立,不会在模型间厚此薄彼。

定价由模型提供商设置,不同情况下有很多不同的考量。亚马逊云科技没有去绑定某一个特定的模型,始终向客户提供选择的空间。

大模型只是生成式AI应用创新的一部分。亚马逊云科技的全托管AI平台Amazon Bedrock除了提供了各种大模型外,还有专门的试用服务。客户可以在尝试后根据效果和价位进行综合考虑。

此外,亚马逊云科技提供有模型版本政策,在模型生命周期结束的时候(即新产品不再使用时),会再给客户6个月的时间。在Vasi Philomin看来,一些新老版本替代会占用计算资源,从成本、效率的角度不见得划算,换个新的可能更省钱。

亚马逊云科技对Nova模型性价比很有信心,称它们比Amazon Bedrock中的其他领先模型大约便宜75%

在re:Invent大会上,亚马逊CEO Andy Jassy分享了亚马逊内部构建近1000个生成式AI应用所积累的三条经验:

1、当生成式AI应用达到一定规模,计算成本的重要性就凸显出来。客户普遍希望获得更高性价比。

2、打造一个真正优质的生成式AI应用程序颇具难度,除了有好模型,还要设置恰当的“护栏”,保证消息传递流畅,拥有合适的用户界面,让用户用起来不卡顿,而且要具备合理的成本结构。

3、不会出现一种工具一统天下的情况。开发者并没有一窝蜂地选用性能最顶尖的模型,会采用不同模型,也会采用一些自研模型。

亚马逊云科技在2023年9月推出的全托管AI平台Amazon Bedrock则做到了上述能力的集合。据Vasi Philomin分享,该平台已发展成亚马逊云科技目前增长速度最快的服务。

亚马逊云科技CEO Matt Garman称Amazon Bedrock是目前构建和扩展生成式AI应用最简便的方式,尤其擅长为客户提供将生成式AI集成到生产应用程序中所需的一切要素。

Amazon Bedrock的定位是帮助用户更好地试用模型,主要有五大功能:1)选模型;2)找到成本性能和准确性的一个平衡;3)集成业务数据;4)要集成业务的安全性;5)构建Agent。

该平台的多项发布和创新,也围绕这五大功能展开。

首先在选模型上,除了亚马逊云科技新发布的自研大模型Nova系列以及来自全球9家领先AI公司的高性能基础模型外,这家云计算大厂还推出了Amazon Bedrock Marketplace,提供来自100多个新兴和专业基础模型,支持客户用统一API来调用并利用Amazon Bedrock中的能力来构建应用。

为了让挑模型更省事,Amazon Bedrock智能提示词路由功能可以动态地将请求路由到最有可能以最低成本出最佳响应的模型,在不影响准确性的情况下能将成本降低30%。这样开发人员就不用花大量时间来试验和找到最适合每个用例的模型。

其次在寻求业务需求、专业知识、预算与模型精度、成本、延时的平衡方面,模型蒸馏很有用。

模型蒸馏将特定知识从一个大而准确的教师模型蒸馏出一个更小但在特定场景中非常高效的定制模型。使用新推出的Amazon Bedrock模型蒸馏,蒸馏过的模型相比被蒸馏的模型,运行速度能够快500%,成本降低75%,而且Amazon Bedrock会帮助搞定所有相关工作。

Amazon Bedrock新发布的延迟优化推理选项提示词缓存功能也能进一步降低延迟,大幅缩减成本。

获得合适模型后,下一步是将企业数据与智能模型相结合。

将数据添加到模型中并进行整合的一种热门方法叫检索增强生成(RAG),有助于模型基于企业数据提供更相关、更准确且更具定制化的回应。

亚马逊云科技在今年早些时候推出了Amazon Bedrock知识库功能,它属于托管的RAG索引,能将所有的数据摄取、检索及增强工作流实现自动化,无需用户自行对这些环节进行全面管理。

客户只需将知识库指向自己的数据源,它就会自动将其转换为文本嵌入,然后存储到一个向量数据库中。这样客户就能随时进行自动检索了,并且所有的检索结果都会自动包含引用信息,方便用户知晓信息来源、提升理解程度。

知识库已经是Amazon Bedrock中最受欢迎的功能之一,并在持续添加新功能,比如新增对向量数据库结构化数据检索GraphRAG的支持。

Amazon Kendra GenAI Index则能为知识库提供语义准确性高的托管检索方案,内置超过40多个企业数据源。

Amazon Bedrock知识库支持结构化数据检索、GraphRAG,可查询各种来源的所有结构化数据,自动生成知识图谱。新发布的Amazon Bedrock Data Automation功能则可以自动将非结构化的多模态内容转换为结构化数据,无需写代码,让将多模态内容用于生成式AI的过程变得更容易。

导入自己的企业数据后,需要考虑安全性和设定AI应用程序的功能边界。

对此亚马逊云科技推出了Amazon Bedrock Guardrails护栏功能,用于轻松定义应用程序的安全性,并实施负责任的AI检查。使用这个功能,你可以限制AI应用只在特定领域回答问题。

针对模型幻觉问题,可行技术之一是自动推理,亚马逊云科技在诸多幕后服务中都运用了该技术。这是一种能够从数学角度证明某事正确的AI形式,通常被用于验证系统是否按照既定要求运行,尤其适用于系统覆盖面大到无法人工逐一查看,且有关于系统运行方式的知识库的场景。

最新推出的是Amazon Bedrock自动推理检查功能,可以对模型所做出的陈述进行准确性检查,防止因模型幻觉而导致错误。

亚马逊云科技还发布了Amazon Bedrock Guardrails多模态毒性检测功能,能够筛查非结构化数据中可能包含的潜在有害内容。

最后涉及到怎么利用优质数据采取行动。

亚马逊云科技此前推出了Amazon Bedrock Agent功能,让构建智能体变得更容易。客户只需用自然语言描述想要Agent完成的任务,它就能快速构建出来。被构建出的Agent可以处理销售订单、编制财务报告、分析客户留存情况等任务。背后用到的模型推理技术使Agent能分解工作流程,调用正确的API来执行操作。

在此基础上,针对多智能体并行操作的任务,亚马逊云科技又推出了Amazon Bedrock多Agents协作功能,能够构建、部署和编排多个Agents,协同处理复杂的多步骤任务。

跟前面的做法差不多,客户可以创建一个专为特定个性化任务设计的Agent,再创建一个监督Agent,它就好比复杂工作流程的“大脑”,负责协调分配、确保多Agent之间能够有效协作,并能设定哪些Agent能访问机密信息,把原本难以协调的工程任务变得简单易行。

总体来说,Amazon Bedrock的功能不止是为了方便客户获取业界先进模型,而是内置了很多配套工具和工程化能力,可以让实际业务与生成式AI结合的操作过程更方便、结果更奏效。

三、下一代Amazon SageMaker:数据分析和AI需求的统一访问中心

生成式AI应用创新要取得成功,需要有AI ready的数据。因此,亚马逊云科技发布了新一代Amazon SageMaker,从产品及品牌方面将其重新定位为“所有数据、分析和人工智能需求的中心”。

很多云客户在数据的治理、发现、处理、分析以及生成式AI应用创新方面的需求越来越融合。对此,亚马逊云科技发布了Amazon SageMaker Unified Studio。这是一个单一的数据和AI开发环境,整合了在亚马逊云科技中分析师和数据科学家所使用的各种服务、查询编辑器、可视化工具,以便客户访问组织中的所有数据,并使用最适合的工具对其进行操作。

亚马逊云科技还推出了面向应用程序的Zero-ETL,帮客户无需构建和管理数据管道,即可分析存储在许多最受欢迎的第三方SaaS应用程序中的数据。

另一个新发布的Amazon SageMaker Lake House兼容Apache Iceberg,针对所有结构化和非结构化数据源提供单一界面,跨不同数据源提供简单统一的数据接入与访问控制。客户可以在Unified Studio中轻松处理所有数据,也可以直接从任何支持Apache Iceberg的第三方AI或分析工具或查询引擎访问该功能。

为了一站式解决生成式AI全生命周期的问题,Amazon SageMaker AI将大数据分析、机器学习、模型开发和生成式AI方面的经验融合到一个统一平台中,统一了数据、分析和AI工作流,从而帮助消除机器学习和分析生命周期中的重复劳动。

针对大规模参数带来的模型训练和推理挑战,亚马逊云科技推出Amazon SageMaker HyperPod灵活训练计划任务治理功能,以优化计算资源管理。

灵活训练计划基于Amazon EC2容量块,根据时间线和预算创建最佳训练计划,自动预留容量,设置集群,创建模型训练作业,能够为数据科学团队节省数周训练时间,最大化计算资源利用率,可节省多达40%的成本。

任务治理功能针对管理跨团队的和项目的计算资源的挑战,通过自动化生成式AI任务的优先级排序和管理,确保分配给最高优先级任务并按时完成,从而进一步提高开发效率并降低成本。

这两个功能能够大幅提高训练和推理工作负载部署的灵活性和对底层硬件资源的使用,让底层硬件资源发挥出更好效能。

此外,亚马逊云科技宣布合作伙伴的AI应用已在Amazon SageMaker上可用。客户无需预配或管理基础设施,可加速模型开发生命周期,并有数据安全和隐私保障。

接下来一年,亚马逊云科技还将为新的Amazon SageMaker添加大量新功能,如AutoML、低代码体验、专业化AI服务集成、流处理和搜索,以及Zero-ETL的更多服务和数据访问。

Amazon Q是在Bedrock上搭建起来的一个生成式AI助手应用。即使你没有写过一行Python代码,你也可以用自然语言简单陈述业务问题,它会指导你完成构建机器学习模型的过程。

其中Amazon Q Developer是软件开发方面的生成式AI助手,最新推出了3款全新自主Agent,能帮助开发人员生成单元测试、文档、代码审查

针对从Windows、VMware进行现代化改造的情况,亚马逊云科技提供了现代化Windows.NET应用加速VMware工作负载主机迁移的功能,以及首个支持IBM z/OS的主机迁移解决方案,可以大幅缩短迁移时间和成本,并显著降低风险。

在运营环节,亚马逊云科技通过提供Amazon Q Developer Investigate issues across your Amazon environment in a fraction of the time功能,来帮助更轻松地排查问题。

企业级生成式AI助手Amazon Q Business可连接不同的业务系统、企业数据源,支持跨越各种数据库与所有企业数据进行对话。Q Business为企业数据创建了一个索引,可以从Adobe、Microsoft Office、SharePoint、Gmail、Salesforce、ServiceNow等源中去索引过去一年的数据,并对所有数据保持高度安全、控制用户权限。

最新发布的功能是将Amazon QuickSight和Amazon Q Business的数据结合,以一种视图呈现,通过自然语言与Q系统对话,快速生成商业报告和数据分析,协助客户做出更好的决策并提升业务效率。目前绝大多数信息都是通过商业智能系统来访问的,已有超过10万的客户在使用Amazon QuickSight来满足分析需求。

亚马逊云科技提供了一套全新的Q Business API,以便独立软件供应商访问在自有软件中集成Amazon Q Index。

针对一些涉及多个应用程序、审批环节和手动输入的复杂工作流,亚马逊云科技新发布的Amazon Q Business Automate能够帮助创建跨团队和应用程序的自动任务,通过使用一系列高级Agent来创建、编辑、维护工作流程。在启动工作流后,还会有一个Q Agent持续对其进行监控,确保能够自动调整并及时修复。以往完成这些工作可能需要花费数周或数月,而现在仅需几分钟。

正如计算机科学先驱Alan Kay曾经说过的,最好的软件工程师自己会构建硬件。新的云计算、生成式AI浪潮会推动在底层的持续创新,底层创新反之又会加速数据及AI的进一步发展。和传统IT一样,生成式AI需要计算、网络、存储基础设施的托载,而这些恰恰是亚马逊云科技长期积累的优势所在。

将业务和生成式AI结合需要很多工程化能力。在生成式AI发展的早期阶段,亚马逊云科技将其服务重心放在提供“最优组合”上,将技术能力分解为独立的构建单元(building blocks),以高性价比组件的形式提供给客户,让客户可以按照自己期望的任意组合去尝试和调整,从而节省开发时间,加速探索生成式AI落地。

总体来看,亚马逊云科技通过提供丰富的自研及第三方大模型货架来满足云客户差异化需求,通过Amazon Bedrock解决大模型落地效率问题,通过Amazon SageMaker提高资源利用和数据分析的速度,通过Amazon Q让人人都能简便快捷地用上生成式AI生产工具,通过底层基础设施的升级进一步降本增效。

这些投入在为广泛客户带来更大商业回报的同时,也持续巩固着这家云计算巨头在生成式AI云服务市场的领导者地位和核心竞争力。

来源:智东西

相关推荐