摘要:12月初,亚马逊云科技一年一度的re:Invent大会在美国拉斯维加斯召开,吸引了6万人参会,40万人线上观看。每年的re:Invent都会给外界带来耳目一新的技术体验,不仅是秀肌肉,也是在传递一种技术信仰。
12月初,亚马逊云科技一年一度的re:Invent大会在美国拉斯维加斯召开,吸引了6万人参会,40万人线上观看。每年的re:Invent都会给外界带来耳目一新的技术体验,不仅是秀肌肉,也是在传递一种技术信仰。
Practical AI,即注重实用效果而非仅关注技术本身,是亚马逊云科技在生成式AI和大数据时代强调的核心重点。围绕这一点展开,亚马逊云科技对大模型应用的产品创新和工具优化,在本届re:Invent上实现了集中释放。
技术的进化要跟上客户的新形态才能保证不掉队,云架构上具备领先的技术,才有可能突围大模型的同质化竞争。亚马逊云科技在不断提升对外云服务能力的同时,还能保持内部全栈创新的灵活性,而事实上,从应用到芯片层面的全栈创新,只有在云环境下才能满足。
为此,亚马逊云科技不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。
同时,亚马逊自身也在基于云计算环境使用,能够了解到使用最多的应用及其资源消耗模式,以此挑选对用户而言收益最高的技术点来做针对性优化,包括快速改进软件和硬件堆栈,甚至芯片设计。
从推出Amazon Nova系列基础模型,到强化Amazon Bedrock和Amazon Q等核心服务,以及围绕Amazon SageMaker构建的新一代数据科学平台,再到推出搭载Trainium2芯片的新型计算实例,为万亿参数模型提供实时推理的EC2 Trn2 UltraServers服务器等。值得一提的是,采用3纳米工艺的下一代Trainium3芯片预计将在2025年末上线。
这些全栈服务能力上的增强和创新,带动了亚马逊云科技客户需求的突飞猛进。
对于亚马逊云科技大中华区解决方案架构总经理代闻而言,他更关注开发人员、运维在内的所有技术人在拥抱生成式AI技术变化时所面临的技术挑战和业务侵袭。
近日,在与钛媒体集团联合创始人、联席CEO刘湘明的对话中,代闻指出,不同的开发者和用户因背景和需求不同,关注的重点也会有所不同。例如,应用程序开发者可能更关注如何提高开发效率,而平台运维人员则更关注硬件性能和基础设施的优化。即便是企业领导,也应关注技术革新对企业运营的实际影响。
在代闻看来,全栈能力的拓展十分重要,应将生成式AI理解为一种智能的赋能,将智能能力融入开发流程。他建议建议开发者,应能结合自身工作的层次,基于开发堆栈,做一定的全栈拓展。这一点非常有利于个人技能的进化,以及理解整个技术生态的演变趋势。同时,还应持续学习最新的技术进展,将理论应用于实际生产环境中,以评估其真实效果。
精彩观点:
1.越是在这种变化剧烈的时期,越是需要有全栈的知识。
2.这一次生成式AI进程中,反而是企业里面的一把手,对于很多细节是非常关心的。
3.现在是需要每一类的角色都做一定的全栈能力的拓展。
4.在亚马逊内部我们所践行的实践叫practical AI,国内讲不看广告要看疗效。
5.其实很多所谓的技术更新,其底层逻辑都是非常朴实的。
6.我们不用聚焦在一个工具上,我们应该聚焦在人的需求上,这是一个最大的变化。
大家都在关心什么刘湘明:最近re:Invent其实引起了很多的关注,大会三天发布了30多款产品,数量很多也非常惊艳,能不能再帮我们把大会再做一次梳理,主线是什么?
代闻:其实这回发布主线还是非常明确的,我们可以看两个方向:
一是全栈的发布,以生成式AI和数据为大主题,无论是开箱即用的服务,还是平台类服务,以及底层的硬件,都做了全栈的创新发布,这是最值得关注和关心的。
二是从横向来看,是一个全面开发的:在芯片,网络方面都有很多重大更新。此外,AmazonBedrock,AmazonSageMaker都有很多新的发布。开箱即用的解决方案,比方说AmazonQ,同样迎来新的发布。从纵向来讲,以生成式AI和数据为核心,实现了全栈的创新,因此,无论是纵向深入还是横向扩展,我们都提供了丰富多样的服务。
刘湘明:发布了这么多新的技术和产品,你觉得对整个亚马逊云科技在国内的用户来说,从他们实际的开发的技术应用场景上,会带来什么改变?
代闻:其实并不是所有的开发者或者用户都需要把所有的服务用起来,因为其实亚马逊云科技发展到现在可以提供200多大类的云服务和云解决方案。
如果是在2006年,只有存储和计算,可能所有人都用这两个服务就行了,但现在,不一样的用户,不一样的Profile,不一样的业务领域,其实关心的新发布也是不同的。
如果你是一个应用程序开发人员,首先非常关心的是开箱即用的服务,比如AmazonQ怎么样能够提升开发效率。此次AmazonQ发布了将.NET应用从Windows到Linux平台的迁移,包括怎么样能够生成文档,不仅涵盖了迁移的整个生命周期,使得整个过程更加顺畅和高效。
对于第二类开发人员,他们希望直接将模型能力集成到其应用中,因此会采取面向模型的开发方式。此时,SageMaker Unified Studio以及Bedrock新发布的模型能力对他们来说至关重要。从数据获取处理,到模型训练,甚至包括模型的微调,再到模型的使用,整个链条的每一个环节都是他们所关心的。
相比于第一类开发人员,第二类开发人员会更加深入地参与到数据到模型整个的开发链条中去,他们其实会通过此次发布学到更多。
第三类用户其实还有平台的运维人员,他们更为关注的是硬件级别的能力提升、性能与能耗的优化,以及新硬件推出后相关基础设施的迭代需求。例如,当Trainium2 UltraServer发布时,运维人员需要了解UltraServer配套的系统更新,如SageMaker的任务调度功能,与Trainium2硬件服务器相关联的网络更新等。他们还会考虑如何将新的硬件能力融入现有系统,包括在程序部署时是否需要针对新硬件进行重新编译等问题。系统的运维人员会更加聚焦于我们发布的硬件及其紧密结合的平台能力。
因此,不同的开发者的背景其实关心的领域是不太一样的。
刘湘明:刚才其实谈到都是一线的工作人员,包括开发者,其实现在很多企业的老板也很关注AI,但可能没有太多技术背景,你觉得他们应该去关注re:Invent?还是就完全pass掉?
代闻:越是在这种变化剧烈的时期,越是需要有全栈的知识,作为企业的一把手,其实是需要了解清楚整个行业的动向,很多所谓的技术更新,其底层逻辑都是非常朴实的。
近两年,生成式AI的兴起到现在,反倒是企业的一把手对很多细节是非常关注的。这跟以前不一样。以前没有这种大的技术变革时,大家的分工是比较明确的,但现在,生成式AI对业务的降本增效影响显著,因此反倒这一次企业把手会更加关心。
那么回到re:Invent,企业一把手其实会更加关心,某个产品发布或更新后,对业务结果的影响。例如,大模型Nova在纯文本交互方面的极致性价比,使高成本客服机器人能以低成本实现;Nova的新功能,如计算机图像识别准确率的提升,为自动化体系或Agent体系创造了有利条件。这些都是业务人员需关注的,即技术创新如何影响并优化业务结果。
注重实效的企业级大模型刘湘明:Nova其实也是re:Invent一个大的发布亮点了,亚马逊云科技第一次推出自己的大模型,你觉得对于其他大模型,Nova有什么不同之处?
代闻:首先来讲,Nova是一个面向企业的,更加注重实效的大模型。
正如安迪·贾西在发布时提到的,其实在亚马逊内部我们所践行的实践叫practical AI,国内讲“不看广告要看疗效”。例如,在客服领域,文本交互占据绝大多数场景,因此我们专注于提供高性价比的文本交互解决方案,以确保企业能在这些场景中选用最经济高效的模型来实现业务目标。
比方说刚才我讲到的,如果你是做一个客服,其实绝大多数场景底下你就是一个文本交互,那么我们就把文本交互这件事情做的是非常有性价比,这样的话你可以在文本交互这样的一些客服场景或者是类似的场景,就选择一个特别性价比特别好的模型来实现,实现你的业务目的。
此外,我们还提供了包括生成图片、生成视频等模型能力,旨在满足不同场景下客户的特定需求。纵观整个Bedrock Market,Nova在各个方面都表现出色。
我们的宗旨是:首先追求实际效果,其次在特定领域要有明确的定位。我们并不认为Nova要一统天下,而是在不同的场景和Agent中,客户可以根据需求选择Nova或其他解决方案。我们只是希望,在客户的众多选择中,Nova能够成为他们信赖的伙伴,为他们提供优质的服务。
刘湘明:你刚才谈到了AmazonQ的开箱即用,是不是意味着一些可能真正的一线的业务人员也能够用,比如说用AmazonQ Business这样的工具,直接去做一些AI等方面的应用?
代闻:是的,现在每一类角色都要做一定全栈能力的拓展,你如果是一个平台开发人员,你可能需要了解平台,也需要了解一定的应用。作为运维来讲,需要了解硬件,也需要对平台有所了解。
几年前,大家不是讲所有业务人员都应掌握Python。其实现在不用如此了,AI使得开发人员用自然语言即可生成一段代码。
例如,新发布的Q for business具备多项功能,包括与SageMaker Covas的集成,业务人员可通过自然语言逐步部署模型。这实质上是为业务人员提供了一个与平台技术能力交互的更佳接口。
从AmazonQ作为自然语言接口与数据交互,到获取和部署模型能力,再到AmazonQ与生产力工具的集成,这些措施均旨在从多个角度大幅降低业务人员使用技术能力的门槛。
刘湘明:所有人其实都需要一些全栈的知识,那么背后的一个背景是什么?其实AI时代来了后,我们所有人的Mindset其实都需要更新一下。
代闻:确实如此,像亚马逊云科技发布这些新技术,能够极大地降低技术使用的门槛。这正如以前开车需要依赖专业的车队和司机,而现在几乎人人都能驾驶汽车一样,核心理念在哲学上是相通的。
API的重构刘湘明:回到刚才咱们谈到的话题,我们从信息化时代、数字化时代,到如今探讨云计算与人工智能,一个显著的变化是工具的极大丰富。过去,要进行信息化建设,可用的工具非常有限,常常需要从最底层的代码开始构建。然而,在最近的re:Invent大会上,我注意到工具无处不在,所以我也想请教一下,你觉得为什么到了这个时代,大家这么看重工具?
代闻:是的。当硬件和软件资源比较贫瘠的时候,我们创造工具,首要考虑的是如何让这些工具承担更多的任务。云计算给大家带来一个特别大的好处,将强大的基础设施和软件能力以极低的成本赋予每一位开发者,使我们不再局限于单一工具,而是能聚焦在满足人的需求上。
当聚焦于人的需求时,就变成了选择最适合的工具来完成特定任务。这是云计算时代与以往相比的一个最大变化。我们常提到的“purpose-built”(为特定目的而建造),正是这一时代基本哲学差异的体现。
刘湘明:给我很大启发,你看软件中有一个特别重要的词叫“封装”,其实就是这就这么迭代起来,其实一直在把底层的能力不断抽象封装成一个产品,其实就走到后来就是一个工具化的过程。这次我在re:Invent其实还有一个很大的感觉,生态很非常丰富,反过来讲工具化,对生态提出了要求。我认为生态的丰富,其实跟工具的丰富是相辅相成的。
代闻:观察非常敏锐,在生成式AI的蓬勃发展之前,云和SaaS(软件即服务)一直是热议话题,关键的一环在于,当基础设施完善后,如何以API的形式将软件能力提供给每位开发者和用户。这样一来,计算资源从唾手可得,变成了软件能力的唾手可得。
大模型若要成功落地,就如同大脑需要连接躯干一样,而驱动躯干则依赖于软件能力的API化。仅有基础设施的API化是不够的,如果基础设施实现了云化,但软件能力仍处于孤立状态,那么大脑将无法调用。因此,在企业内部乃至整个产业界,都需要API的重新构建。这一周期中,新的机会也会产生。
那么,在新时代背景下,SaaS的命题也将被重新提上日程。
刘湘明:提到SaaS,最近湾区硅谷那边也有一个新的说法,原来SaaS叫做Software as a Service,现在他们把它反过来叫Service as Software,这个提法就很有意思,过去我们是先有工具然后寻找适用场景。现在,基于明确的需求,将其软件化并提供服务,你怎么看待这样一个新的说法?
代闻:今天我也是第一次听到这个说法,其实你刚才讲的说Service as Software本质上来讲是把以前一些比较昂贵的Service,通过生成式AI的模型能力,转变为一个边际成本极低的自动化测试。
比方说我们其实服务了很多出海创业者,以在海外开展教辅类项目为例,比如自动判作业。以往,尤其在海外,家庭教师或教育资源相对昂贵。通过大模型技术,可以大幅降低这种服务的边际成本。现在,大模型还提供了一些新的可能性,显著加速了生成式AI能力构建,从人工到半人工,再到全面采用机器学习的进程。这样一来,这些能力就转化为了一个API。
这个API又能进一步接入到其他的Agent中,形成一个正向循环的飞轮效应。模型能力转化为基础能力,而这些基础能力又能再对接到其他模型中去。
这一过程其实就非常有趣,从“Service as Software”转变为“Software as a Service”,再连接到另一个“Software as a Service”。
今年,我们还深入观察到了在医药研发领域的案例,特别是医疗文献处理方面。去年此时,某些看似难以处理的案例,今年随着模型能力的提升和RAG工程方面成熟,医疗文献的理解、撰写和校正等方面的应用案例已变得非常丰富。这主要得益于两个因素:一是模型基础能力的提升,二是工程化落地的日益成熟。
企业开发新范式刘湘明:其实我们今天都在谈整个范式的变化,范式变化中其实就离不开人,从你的角度来看,怎样成为在AI时代中最牛的开发者和架构师,我相信要求和标准都跟原来完全不一样了。
代闻:其实我们也非常希望在生成式AI领域确立一种新范式,目前我们也在不断总结。首先一点是,我认为所有的开发者,都能结合自身工作的层次,基于开发堆栈,做一定的全栈拓展。这一点非常有利于个人技能的进化,以及理解整个技术生态的演变趋势。
核心来讲,我们现在整个技术栈是在剧烈变化的。在这样的背景下,只要能掌握更多的技能,在震荡过程中适应的空间就会更广。因此,全栈拓展作为新范式的关键,值得大家深思并付诸行动,以应对不断变化的环境。
其次,生成式AI不仅仅是一种工具,而更应视作一种智能的赋能。这种智能的赋能,对软件能力的提升,与以往的工具级智能化和数字化相比,具有截然不同的效能。这一点讲了很多年,但随着生成式AI的出现,其带来的影响是显著的。因此,一定要将最新的智能能力与生产能力融入到开发流程中。
最后,应更加积极地看待这些能力对软件开发全生命周期的改造。这一点其实是相对与内部开发流程的全面优化,从编码、集成、文档撰写到排错,整个生命周期都能因此得到提升。
这三点,对于现在的开发者而言,特别是在参加re:Invent之后,都是特别需要关注的方面。
刘湘明:刚才你也谈到了对模型的不断学习,有没有一些诀窍跟大家分享一下,比如说我们怎么能够迅速了解一个模型的长处?
代闻:其实每个模型在介绍时都会强调其独特且差异化的特点。那么,开发者还是要主动学习,这是逃不掉的问题。
我曾经在一个会上讲过,每个人都应该每三个月重新学习一遍市面上最新的进展,这是提升自我的必要步骤。其次,还应该采用“逆向工作法”(working backward),关注技术在实际应用中的时效性和实用性。安迪提到的practical AI,无论是多Agent系统还是新型模型,在理论或原型场景下往往展现出最佳或最理想的一面。
但是,在实际应用中,如客服系统,无论是在金融、医疗、HR领域,其侧重点都会有所不同。这取决于不同的上下文环境和工程能力的差异。因此,更应该看学习到新技术后,将其投入到实际的生产应用中,观察并评估其实际效果,从而做出自己的判断。
在ToC领域,可能由于用户群体广泛,关注点相对较为统一,规模化效应非常强。但在ToB领域,不同行业的关注点则存在显著差异,尽管规模效应不如ToC,但差异性是更为突出的。因此,在ToB领域,将模型学习后应用到实际业务中,并观察其实际结果,是一个更为实际且明智的选择。(本文首发于钛媒体APP,作者 | 杨丽,编辑 | 盖虹达)
来源:钛媒体