微软CEO万字演讲实录|AI 的三大根本性突破

B站影视 韩国电影 2025-04-01 18:42 1

摘要:纳德拉再次介绍了微软正在构建的三大核心平台:Copilot平台、Copilot与AI技术栈、Copilot设备。并指出所有AI的力量,表现为三大根本性的突破。

327日,微软CEO Satya Nadella日本的微软AI巡回活动中发表演讲。

纳德拉再次介绍了微软正在构建的三大核心平台:Copilot平台、Copilot与AI技术栈、Copilot设备。并指出所有AI 的力量,表现为三大根本性的突破。

此外,他还重点展示了AI技术在日本本土的应用和多元化创新,包括I-SEN公司利用Azure AI服务为听障人士开发下载量超百万的应用、日本航空(JAL)如何利用小型语言模型成功实现设备端“离线智能”服务于3万名员工等。

以下是本次演讲实录

经数字开物团队编译整理

早上好,非常高兴能再次来到东京,来到日本。

今天早上我还在想,日本确实一直是微软发展历程中不可或缺的核心部分。下周,4 月 4 日,我们将迎来公司成立 50 周年的庆典。而实际上,微软进入日本市场,已经走过了整整47 年。日本,正是微软在美国本土之外,设立海外分支机构的第一个国家。因此,我想首先借此机会,向所有与我们并肩走过这段非凡旅程的人们——我们尊敬的客户、亲密的合作伙伴,以及数十年来在微软日本辛勤工作的每一位员工——表达最诚挚、最深厚的感谢。

今天,我们非常激动能齐聚一堂,共同探讨一个主题。这个主题,其实和我们47 年前创立公司时的初衷一脉相承。作为一家以平台和合作伙伴为基石的公司,我们始终回归本源思考:我们能够打造什么样的平台,才能让其他开发者、创造者们,在这些平台之上构建出更丰富的技术与应用,进而切实改善所有日本民众的生活,惠及所有客户、所有企业以及公共服务领域。对我而言,这正是我们微软的核心使命,也非常荣幸能在此与大家分享我们的思考。

回望我每一次来到日本的经历,感受总是随着时代发展而不同。我初次来访,是在客户端-服务器架构盛行的时代;随后,是互联网浪潮兴起的时代;再后来,我很幸运,能在云计算 时代拉开序幕之时来到这里;当然,现在,我们已经昂首迈入了人工智能的新纪元。想要洞察当下,立足于那些真正在塑造每一个新平台时代的技术驱动力去深刻理解,总能带来极大的启发。

这一次,我们将这些驱动力概括为Scaling Law。我们称之为“定律”,但它们更准确地说是基于实践的经验性观察结果,这与著名的摩尔定律非常相似,摩尔定律预测计算能力大约每18 个月翻一番。而如今,伴随着深度学习带来的革命性突破,我们开始观察到一系列基础性的预训练 Scaling Law,它们正推动着智能能力大约每六个月实现一次翻倍。

不仅如此,在此基础之上,近期我们又见证了测试时计算领域的 Scaling Law 的出现。技术发展常常呈现这样的规律:一条 S 型增长曲线尚未走完,另一条新的 S 型曲线便已叠加其上,两者相互促进,共同带来指数级的复合增长。这恰恰是我们当前所目睹的景象。事实上,智能能力的翻倍速度可能已经缩短到了大约每三个月一次。

因此,我们看到,“智能”这样一种极具可塑性的资源,正作为一种新兴的“商品”,其“价格”大约每三个月就降低一半,这无疑是令人惊叹的。真正的问题在于,我们如何才能有效地将这种强大的智能,转化为能够持续创造切实价值的成果?这,正是AI 时代赋予我们的巨大机遇。

那么,我常常思考一个衡量标准,无论对一个公司,还是一个国家而言,或许都可以归结为这样一个公式:每一美元投入、每一瓦特能耗,所能获得的 Token 数量是多少。也就是说,当你衡量自身能力时,关键在于如何以最高效的方式去构建和运用智能能力。这不仅关乎你的资金投入效率,更重要的是,关乎你的能源使用效率 (如何利用电力) 。

顺着这个思路思考,这意味着,追求极致的优化变得至关重要。而在优化这条道路上,我们甚至就在最近,也取得了一系列显著的突破。并且,优化的实现,其驱动力既来自于硬件层面的持续进步,但更关键的,往往来自于软件层面的革新。打个比方,如果硬件进步能带来 2 倍的提升,那么软件优化有时甚至能在此基础上,额外带来 10 倍、乃至 100 倍的性能提升或效率改进。

这也就自然引出了另一个值得关注的现象,即人们如今经常讨论的杰文斯悖论。这个悖论的有趣之处在于,每当一种商品的价格显著下降,并且市场对该商品的需求又富有弹性时,其总需求量反而会不成比例地大幅上升。这也基本预示了计算能力和智能这两种“商品”,在未来可能呈现的发展趋势。

现在,所有这些AI 的力量,具体表现为三大根本性的突破,它们正在并将持续重塑整个计算领域的格局与面貌。

第一大突破在于用户界面。随着多模态模型的能力日趋强大,交互方式也变得越来越自然流畅,你将可以直接与 AI 进行对话。它们将能够“看见”我们周遭的世界,并理解、阐释这个世界。它们基本上能够处理文本、图像、视频等各种形式的输入信息,并生成相应的输出内容。这将彻底改变几乎每一个应用程序、每一个浏览器、每一个操作系统以及每一种设备上的交互体验。这,就是即将发生的深刻变革。

第二点,你还将获得在规划和推理方面强大的赋能。这意味着,AI 不再仅仅局限于处理输入和输出信息,你现在可以让它进行长远规划、前瞻性思考以及复杂的逻辑推理。

在此基础上,你甚至可以赋予AI 更为复杂的长期记忆能力和更丰富的上下文信息,从而确保它的回应和行动都有可靠的事实依据。换句话说,就是让AI 能够基于特定的背景知识以及过往的交互历史来进行思考和运作。

因此,我认为,这三项核心能力——自然的交互界面、强大的规划与推理、基于背景和记忆的事实依据将对整个技术栈产生极为深远的影响。这也正驱动着一个丰富多元的Agentic web 的加速构建。正如我们曾经构建了支撑信息流动的网页一样,这一次,我们正在为个人用户、组织与团队、端到端的业务流程乃至跨组织的Agents,构建一个全新的Agentic web。未来,你在上一个时代通过应用程序或网站所能实现的任何功能,现在都可以通过Agents以及Agents之间的协同交互来完成。

当然,这一切的愿景听起来都非常美好。但对于我们微软而言,更重要的是如何运用所有这些技术的力量,来坚定地践行我们的核心使命。这个使命就是:予力全球每一个人、每一组织,成就不凡。这并非仅仅关乎技术本身多么先进,更在于将技术的力量切实地交到人们以及他们所构建的各种机构手中,从而帮助他们释放潜能,取得更大的成就。对我们来说,这才是根本所在。

为了实现这一目标,我们正全力以赴地推动两大领域的深刻转型:一是消费者领域,二是企业领域。例如,在消费者端,我们坚信AI 将彻底重塑几乎所有的日常体验:无论是我们研究和搜索信息的方式,获取新闻资讯的方式,通过游戏等形式进行娱乐的方式,甚至是购物和进行商业交易的方式。如今我们习惯于通过浏览器、网站或手机 App 完成的这一切,未来都将因Agents的力量而发生翻天覆地的变化。

同样地,在企业运营的各个环节,我们过去十年里反复探讨的每一个数字化转型的目标与成果,都将被 AI 重新定义和提升:无论是员工的日常工作体验,我们提供客户服务的方式,还是企业内部端到端的业务流程优化。

而其中最激动人心的,莫过于AI 对我们创新方式的改变(创新的速度和广度)。无论你是一家致力于新药研发的制药公司,还是一家提供专业服务的金融机构——都将因此受到深远影响,并朝着更高效、更广阔的方向发展。所以说,AI 带来的这两大转型效应提升个人效率和加速企业创新,这正是我们真正希望实现的价值。

为了让这一切成为可能,我们微软正集中力量,专注于构建三大核心平台。在今天接下来时间里,我想和大家重点介绍一下这三个平台。

第一个平台就是Copilot。要理解我们希望通过Copilot 实现什么,最形象的方式,就是把它看作是专为 AI 时代设计的用户界面。

我们的目标是将Copilot 无缝整合到用户既有的应用程序、浏览器和操作系统之中,让你能够在日常工作和生活中,自然而然地开始使用它。你可以从简单的对话开始,然后逐渐尝试让它帮你完成更复杂的任务。未来,你还会用到更多能力强大的自主Agents,而这些Agents在执行任务的过程中,会适时地回来向你请示、获取指令或进行必要的通知。正因如此,我们认为,即便在高度自主的Agents广泛应用的时代,AI 的 UI 层依然扮演着至关重要的角色,因为这些Agents终究需要一个界面来与我们沟通,在执行任务的各个环节,接收我们的指令和授权。

目前,我们正在同步推进两方面的工作:一是面向广大消费者的Copilot,二是面向企业应用场景的 Copilots接下来,我想通过一段演示,让大家更直观地感受一下这些多模态能力,看看它们是如何融入并改变我们日常生活的。请看视频。

大家看到了,Copilot 就像你身边的一个智能伙伴,或许就像当年浏览器刚刚出现时那样。你甚至可以把它想象成一种全新的智能浏览器,你会发现自己越来越离不开它。举个我自己的例子,我已经将 Copilot 设置到了我 iPhone 的操作按钮上。这样一来,在通勤路上,我就可以随时和它语音对话。实际上,我现在听播客的方式都变了,我基本上是用Copilot 的语音模式,让它读取播客的文字稿,然后就内容与我进行问答交流。这让我能更快地掌握播客的核心信息。另外,当我在电脑前工作时,我也会用到 Copilot vision 功能,让它帮我识别并解读屏幕上显示的内容。所以,这些新的交互方式,正像当年浏览器普及一样,逐渐成为我们新的日常习惯。

当然,这只是 AI 带来的一种全新交互模式。我们正在做的另一件重要事情,是将 Copilot 的能力,全面注入到你当前所使用的各种应用程序当中。

以 M365 Copilot 为例,我们所做的关键一步,就是将 Copilot 深度集成到了大家常用的 Word、Excel、PowerPoint、Teams、Outlook 等等办公套件中。这样一来,在你日常工作的每一个环节,Copilot 都能如影随形,随时提供智能辅助。

让我举个具体的例子。假设有位医生,正在为一场重要的肿瘤委员会会议做准备。这通常是风险高、责任大的会议,因为讨论必须严格基于详细的病例史来进行。而且,分配给每个病例的讨论时间,也需要根据病例的具体情况来精确安排。

然后,在会议进行中,比如说在 Teams 会议里,医生最希望的是能全身心投入到对病人和病例的讨论中,而不是因为需要做笔记而分心。这时,Copilot 就能在 Teams 里,为你实时生成高度准确的 AI 会议纪要。

那么,设想一下当这位医生结束会议后,她需要整理会议记录。她可以将 AI 生成的纪要直接导入 Word 进行编辑,然后,因为她同时还承担着教学任务,需要给学生授课,她可以接着让 Copilot 帮她快速生成一个 PowerPoint 演示文稿。你看,就是这样一个围绕着肿瘤委员会会议的、非常重要且高要求的工作流程,通过 AI 和 Copilot,就能得到显著的简化和效率提升。

现在,让我们再把视野拓宽一步。伴随着新平台的出现,总会涌现出全新的工作成果形式 和工作流程。对我个人而言,Pages 就是这样一个代表。例如,我现在的工作方式,就是经常借助 AI 来进行思考,并与我的同事们展开协作。这可以说已经成为了我的新常态。我会先在 M365 Copilot 中,利用它强大的信息检索能力,查找所需的资料、图表等。比如,假设我正在撰写一份销售报告或财务分析报告。我可以让 Copilot 从公共网络以及我们组织内部的知识库中,汇集所有相关数据。然后,我会立刻将这些初步成果整理发布到我的 Pages 页面上。在 Copilot 的体系里,聊天和 Pages 之间存在着灵活的多对多关联。在 Pages 里,我可以方便地将内容分享给我的同事。于是,他们就能实时地看到我借助 AI 开展的工作进展,并直接在 Pages 上与我协同编辑、讨论。而且,AI 本身也嵌入在 Pages 中,随时能帮我进一步打磨和完善报告。这就是一种全新的工作流程。就像在过去,你会创建电子表格或文档一样,未来,你将越来越多地使用 AI 来创建这些动态的 Pages,并围绕它们与他人进行高效协作。

当然,我们的创新不止于此。事实上,借助Copilot Studio,现在你自己就可以动手开始构建定制化的Agents这就像过去你使用Word 来撰写文档,使用 Excel 来制作表格一样。我们的愿景是,未来每一位用户,无论是否具备编程背景,都能够利用 Copilot Studio,轻松构建出成千上万个满足特定需求的Agents。整个过程非常简单,就像打开一个工具一样。假设,我想创建一个用于现场服务场景的Agent。我要做的,首先是给它一个明确的指令,告诉它它的角色定位,一个现场服务Agent。然后,我需要为它提供一些相关的知识基础,让它能够“学习”和“理解”这个领域。这些知识可以来源于 SharePoint 文档库,或者,就像在这个例子中,可以直接对接 Dynamics CRM 系统里的数据。完成这些步骤后,你基本上就成功创建了一个功能完备的现场服务Agent。而且值得一提的是,这个你亲手创建的Agent,可以无缝地作为一个工具,集成到你的M365 Copilot 环境中使用。这就是我们所设计的模型的简洁与强大之处。

要让所有这些 AI 能力真正发挥作用,关键在于它们需要基于你自己的数据来运行,需要理解你的特定业务背景。为了实现这一点,我们首先将整个互联网的公开索引整合了进来,当然,是在确保满足企业级合规与安全标准的前提下。这样,你就拥有了广阔的外部知识来源。

然后,更重要的是你企业内部最有价值的数据资产,也就是蕴藏在微软365 平台之下的数据,这包括了员工之间的协作关系、沟通记录,以及他们日常工作中产生的海量文档、项目文件等等。所有这些极其丰富的信息,现在都可以成为 AI 理解你业务的基石。

此外,企业其他的各类业务数据,无论是存储在 Dataverse 里的结构化数据,还是汇聚在 Fabric 平台上的分析数据,所有这些信息都将有效地结合在一起,共同为 M365 Copilot 在你具体工作和业务流程中的应用,提供坚实的数据支撑。

目前,我们已经看到了这些技术所带来的巨大影响力。归根结底,应用微软365 Copilot 的最终目的,是为了实实在在地提升整个组织的生产力。在我们微软内部,我们就观察到了显著的成效。例如,我们解决客户服务问题的效率,实现了两位数的百分比增长;我们的营销活动转化率和销售团队的工作效率,提升了超过20%,得益于 Copilot 的辅助,我们每位销售人员能够完成的业绩也更高了,大约提升了 10%。在 IT 支持和人力资源领域,通过引入 AI 自助服务,我们也看到了多项业务指标实现了强劲的两位数增长。所以,这些都是非常具体、可衡量的投资回报。

并且,这种积极的效应,我们正在广大的客户群体中普遍观察到。事实上,就在日本,我们欣喜地看到,这些AI 产品和服务的采用率正以惊人的速度增长,你知道吗。这可能是这个时代最令人兴奋的特点之一,与以往任何技术变革相比,AI 技术的扩散速度异常之快。举例来说,在构成日经 225 指数 (Nikkei 225) 的顶尖公司中,已经有高达 85% 的企业开始采用微软365 Copilot。就在今天早上,我还有幸与来自 Sumitomo 集团的朋友们进行了深入交流。他们不仅分享了在企业内部通过 Copilot 取得的显著效益,更让我印象深刻的是,他们详细介绍了自己是如何推动这项技术落地生根的,他们积极培养内部的 Copilot 倡导者,大力宣传和推广这些工具的最佳实践和使用方法,目标是让 Sumitomo 的每一位员工,都能真正利用 AI 来赋能自己,成就更多。因此,能够看到这种自下而上的热情和实践,不仅仅是技术工具的普及,更像是一场旨在全面提升生产力边界的深刻变革运动,真是令人倍感振奋。

当然,我们的脚步并未停歇。事实上,就在昨天,我们刚刚发布了一系列我认为极具突破性的新功能和新产品,它们都将成为微软365 Copilot 能力的重要组成部分。

首先,我们推出了一个全新的研究员ResearcherAgent。这基本上是将那些非常复杂的推理模型,直接整合到了M365 Copilot 的体验中。这意味着,现在你的组织里,相当于有了一位可以随时待命的研究员。试想一下,企业里的每一位员工,现在都可以拥有一位专属的 AI 研究助理,能帮你完成各种深入的调研任务。无论是进行市场竞争分析、行业并购研究,还是撰写复杂的财务报告,这个Agent都能胜任。它能够高效地利用公开网络信息,结合企业内部的所有相关数据,甚至可以协同调用多个不同的Agents,最终为你生成一份极为精深、全面的研究报告。

不仅如此,我们还同步推出了一个数据分析师AnalystAgent。同样是基于先进的思维链推理和强化学习技术,我们打造出了这个全新的数据分析师Agent。这带来的效果,就好比是为企业里的每一位员工,都配备了一位顶尖的数据科学家。想象一下,如果组织里的每个人,在日常工作中都能随时得到一位出色数据科学家的支持,那将会激发怎样的洞察力和创造力?你可以把任意两份看似无关的数据交给这个Agent,它就能帮你从中挖掘出潜在的模式、洞见、关联性和相关性。

然后,我们还将这些强大的深度推理模型,直接开放注入到了Copilot 平台本身。这意味着,当你希望像我之前演示的那样,去构建属于你自己的定制化Agents时,比如那个现场服务Agent,现在你可以在你为特定业务流程构建的任何Agent中,灵活地应用同样强大的思维链和基于强化学习的推理能力。

以上这些,都是我们刚刚正式发布的一系列激动人心的新功能。为了让大家更直观地了解其中一部分的实际应用效果,接下来,我想邀请我的同事 Kelly 上台为大家做演示。Kelly,交给你了。

Kelly: 谢谢 Satya。大语言模型 的最新进展将我们带入了一个全新的境界,AI 在此展现出卓越的问题解决和推理能力。我们选用了 OpenAI 最新的 03 Deep Research 模型之一,并针对工作场景进行了深度优化,创造出两个新的 AIAgent:Analyst 和 Researcher。我们先从 Researcher 谈起。

我现在打开的是Copilot 聊天界面,大家可以在右侧看到 Researcher 这个 AIAgent。Researcher 运用 Copilot 先进的编排 能力和深度搜索算法,能够访问并利用你日常工作中的各类数据,比如电子邮件、会议记录、文件和聊天内容等。

假设我负责产品开发,我们正计划进入一个新市场,需要协助制定市场扩张的产品策略(product strategy)。当我输入提示 (prompt) 后,Researcher 就开始工作了。它首先会像一位经验丰富的同事那样,提出一些引导性的问题以澄清需求。在我输入回复后,它会基于这些信息继续进行分析。

大家可以看到,这个AIAgent接收了我的提示,理解了任务,并制定了生成结果的计划。值得注意的是,它是在微软Graph 中你所有数据的基础上进行分析推理,而非仅仅局限于单个文件。在这里,我们可以实时观察到它的“思维链”推理过程。你可以清晰地看到它处理问题的步骤:它逐步理解我的产品线构成,参考我近期的会议记录,甚至从互联网上抓取相关的行业最新动态。这个过程通常需要几分钟,我们现在直接来看结果。

请看这份详尽的回复。其水准堪比我团队研究员提交的专业报告。现在,我可以直接在Pages 里编辑这份文档,并邀请团队成员加入进来,进行协作。我们刚才看到的功能,是建立在你的工作数据以及网络公开数据之上的。不仅如此,Researcher 还可以通过连接器对接第三方数据源,甚至能够调用像 Sales Chat 这样的其他 AIAgent,以利用它们所拥有的丰富数据和独特逻辑能力。

既然我们借助Researcher 共同制定了一份出色的产品开发策略,接下来我们聚焦 Analyst。我们构建 Analyst 的目标,是让它能像一位资深的数据科学家那样思考,从而帮助你在短短几分钟内,就能从原始数据 中提炼出富有价值的深刻洞察 。

我手头恰好有一个非常杂乱且高度复杂的数据集。你可以看到,这里有数千行数据,分布在多个标签页中,记录着客户信息及其月度收入等,但所有这些数据都未经任何清理或上下文关联处理。通常情况下,要理解并利用这些数据,我需要请精通Python 的同事帮忙。但这次,我们来试试 Analyst 这个 AIAgent

我无需耗费大量时间去编写完美的提示就能精确获得我想要的结果。我只需要请求Copilot 给予协助,它就能帮我想出办法,轻松地分析并可视化呈现我的客户数据。大家可以看到,它接收了我的问题,理解了任务,并且和我们之前看到的 Researcher 一样,构建了一个用于达成最终结果的计划。它还会智能地识别出完成这项任务可能需要用到的 Python代码,这正是一位优秀数据分析师的工作方式。它能够有效处理任何复杂的数据集,理解其内在含义,然后执行 Python 代码来解答你针对这些数据提出的各种问题。

如果我想更深入地了解它的思考过程,可以随时点击展开,查看它的“思维链” 推理细节,以及它正在实时运行的 Python 代码。现在,Analyst 已经进行到了最后一步,开始着手创建可视化图表。请看,这就是我想要的答案,并且还生成了一个效果出色的可视化结果,可以直接分享给团队。如今,有了 Researcher 和 Analyst,每一位员工都能按需获得强大的专业分析能力。Satya,现在把时间交还给你。

非常感谢你,Kelly。希望大家能初步体会到,我们所有人都将拥有这种触手可及的强大力量。未来,当我们开始一天的工作时,就能用上 M365 Copilot,这将使得每一位员工都拥有世界一流的研究能力、世界一流的数据科学和数据分析能力。试想一下,这将如何深度赋能 我们每一个人,极大地拓展我们施展能力的边界,进而有力地推动我们组织内部的经济生产力提升。这,就是我们共同期待并正在努力实现的未来图景。

现在,我想介绍下一个关键平台——Copilot AI 技术栈。之所以要特别强调这一点,是因为它不仅仅关乎微软自身正在构建的各类产品,更重要的是,它关乎在座的各位——开发者们——将能够充分利用我们构建 M365 Copilot 或消费者版 Copilot 所使用的几乎整个技术栈,来创造和构建属于你们自己的、功能完备的应用程序。

这一切的起点,是我们致力于将 Azure 打造成“世界计算机”的宏伟愿景。如今,Azure 的基础设施已遍布全球,拥有超过 60 个区域和 300 多个数据中心。就在日本本土,我们在东部和西部各设有两个区域。今天,我非常激动地宣布一项重要投资:我们将对日本的这两个区域进行扩容,为其配备最新的高性能计算和 Nvidia GPU 资源。此举的核心目标,是让日本的每一位开发者、每一个构建应用程序的组织,都能够更方便、更广泛地利用这些顶尖的 AI 能力。

谈及此次扩容,我们秉持的是一种全面的系统方法。这意味着从最底层的数据中心设计,到核心的芯片技术,再到贯穿计算、存储、网络的整个系统软件层面,我们都进行端到端的协同优化,旨在实现性能的最大化。正如我之前所强调的,最终的衡量标准是综合考量性能、成本与功耗的最优组合,而这必须依赖于系统性的整体设计与优化。重要的并非某个单一环节的领先,而是将所有部分紧密整合,形成一个高度优化的技术栈,共同为下一代 AI 工作负载提供强大的支撑。这正是我们在 Azure 上倾力投入的方向。

一旦拥有了强大的基础设施,下一个核心的考量要素就是数据。因为你需要基于自己的数据来训练AI 模型,进行精细的微调,并确保模型的响应和预测能够牢固地扎根于你自身的数据基础之上。这意味着,你所拥有的全部数据,都必须能够便捷地汇聚到你的智能基础设施 附近。我们正通过多种途径来促成这一点:首先,我们持续优化自身的数据资产 (data estate) 产品线,无论是 NoSQL 数据库 Cosmos DB,还是关系型数据库 SQL 和 Postgres,都将它们打造为能够与你的 大语言模型基础设施无缝对接的云原生数据库。同时,我们也积极拥抱并支持像 Databricks 这样的重要合作伙伴平台。实际上,就在昨天,Azure Databricks 刚刚宣布了在其基础设施上引入更多新功能,其中就包括来自 Anthropic 的先进模型。此外,我们还在不断加强与 Oracle、Snowflake 等行业领导者的合作。我们的目标是确保没有任何数据孤岛的存在,将所有相关数据汇集起来,让它们能够紧密地围绕在你的智能层周围,从而使你能够更高效、更便捷地构建各类 AI 应用。

现在,你已经拥有了坚实的基础设施和可用的数据资源,接下来就可以着手构建你的AI 应用程序了。正如过去每一次重大的技术平台演进一样,比如Web 时代的来临,你需要一个核心的平台来承载和加速应用开发,类似于应用服务器的角色。在AI 时代,这基本上就是我们通过 微软Foundry 所要提供的核心能力。借助 Foundry,我们构建了一整套开发和运行 AI 应用所必需的服务,全面覆盖了模型微调、效果评估、AI 安全保障以及系统可观察性等关键环节。我们提供了极其丰富的模型选择库,事实上,其中包含了超过 1800 种不同的模型,既涵盖了主流的开源模型,也包括了领先的闭源模型;既有能力强大的前沿模型,也囊括了适用于特定场景的各种小型语言模型。这样一来,开发者就能够站在效率前沿 上,根据不同的模型权重级别、性能评估指标以及具体的应用领域需求,灵活地选用最适合的模型来构建自己的应用程序。

至此,你拥有了强大的基础设施、整合的数据资源和高效的应用服务器。那么,作为整个AI 技术栈的最后一块关键拼图,你还需要的是世界级的开发工具。众所周知,微软在50 年前正是以一家工具公司起家的,提供卓越的开发者工具始终是我们不变的基因和承诺。我们的目标非常明确:通过 Visual Studio Code和 GitHub 这两大平台,持续打造并提供业界顶尖的开发工具。当然,在今天这个 AI 时代,借助 GitHub Copilot,我们将强大的 AI 能力深度集成到了这些开发工具之中,极大地赋能每一位开发者,帮助他们在各自的项目中更快速、更高效地取得成功。

有了像 GitHub Copilot 这样的 AI 辅助工具,我们可以有效地降低软件开发的门槛,赋能越来越多的人转变为软件开发者,从而共同将整个应用程序创新前沿推向新的高度。

其中,Project Padawan 是一个让我个人倍感兴奋的未来项目。目前,GitHub Copilot 已经能够出色地完成代码补全、通过聊天交互提供编程建议、进行跨文件的代码编辑等任务,甚至已经演化出了具备一定自主性的 AIAgent形态。而Project Padawan 则代表了更进一步的设想:让 AI 能够主动承担起处理一个完整的 拉取请求生命周期中的诸多任务。你可以将一个开发任务或者一个 PR 直接指派给 Copilot,然后这个 AIAgent将会自主地去理解需求、创建技术规格文档、制定详细的开发计划,并实际执行编码工作,最后生成相应的代码变更,提交给你进行最终的审核与批准。这清晰地勾勒出了未来软件工程领域中,AIAgent(SWEAgents) 将扮演何种角色的发展方向。

目前,在日本,我们所有这些 AI 技术都展现出了强劲的应用和发展势头。大家可以从屏幕上展示的这些来自各行各业的客户标志中略窥一二。今天早上,我有幸与其中许多优秀的开发者进行了面对面的交流。其中,最令我深受鼓舞的一个案例,来自于 I-SEN 公司。他们利用 Azure AI 服务,为听障人士开发了一款极具价值的应用程序,目前的下载量已经突破了一百万次。我还有幸与其中一位实际使用者进行了交流,她对于这项技术给她的生活所带来的积极改变和便利,表达了由衷的感激之情。能够亲眼看到技术产生如此深远的积极影响,这真是令人鼓舞。

我还有机会见到了一群来自某所中学的学生们,他们是东京都教育委员会主办的编程马拉松活动的优胜者。我非常高兴能亲耳听到他们热情洋溢地介绍自己是如何利用微软Power Apps 这个低代码平台,在学习的过程中动手创造出各种有趣的应用程序和游戏。

我还拜访了一家名为 Turing 的日本初创公司。他们采取了一种非常专注且目标明确的 策略,致力于自主研发全栈式的 L5 级别自动驾驶应用与核心模型,并且已经和日本数家领先的汽车制造商建立了紧密的合作关系。他们设定了一个宏伟的目标:要在这个十年结束之前,在日本本土实现世界一流水平的 L5 自动驾驶能力。能够与他们进行深入的交流,了解他们的技术实力和发展路线图,这段经历令人印象深刻。

此外,我还会见了来自日本航空的团队。他们向我演示了一款正在其内部广泛推广的应用程序,目前已经有大约 3 万名 JAL 员工在日常工作中使用。这项应用的突出亮点在于,他们将小型语言模型领域的最新技术进展,成功地应用到了设备端计算的场景中。这意味着,即使用户处于没有 Wi-Fi 或互联网连接的离线状态下,依然可以享受到由 AI 提供的智能服务,即所谓的离线智能 。这无疑是一项了不起的工程创新。接下来,就让我们通过一段视频,来直观地感受一下 JAL 的实践成果。

看到这一切真是令人由衷地感到欣喜。我们很高兴看到如此多的创新在日本这片土地上涌现,同时也深感欣慰的是,我们的技术平台正变得越来越易于被各种类型的组织所采用和触及 。这使得它们能够更有信心地去自主规划并实施那些通常被认为充满挑战、极具雄心的 AI 工作负载和创新项目。

接下来,我想谈谈我们正在构建的第三个关键平台:Copilot 设备。在此之前,我主要聚焦于云端的创新——那些依赖于复杂且强大的云基础设施来运行的大规模 AI 模型。但与此同时,计算领域的另一个重要战场——边缘计算——也正经历着一场深刻的变革。得益于 Copilot 设备以及其内置的 NPU等专用 AI 芯片的强大硬件能力,我们现在能够在设备端为用户提供高达约 40 TOPS 的 AI 算力。刚才日本航空运行本地模型 (local model) 的案例就是对此趋势的绝佳证明,并且可以预见的是,未来端侧 AI 的能力只会变得越来越强大。这正是 Copilot 设备所要赋能的核心价值所在。

这意味着一个全新的应用程序类别即将崛起。这些新应用将带来一系列新颖的交互范式,例如基于 AI 的“生成式填充”、一键完成复杂任务的“点击执行”、以及提升图像或视频质量的“超分辨率”等等——我喜欢将这些新型交互称之为 AI 时代的新“动词”。这些功能将逐渐渗透到我们日常使用的各种软件中,成为你所期待的、在操作系统、浏览器乃至每一个应用程序中都应具备的标准体验。而这,正是我们通过 Copilot PC 这一产品形态努力去实现的目标。为了让大家更生动地了解 Copilot PC 上正在发生的各项创新,我们一起来观看下一段演示视频。

以上,就是我们正在倾力打造的三大核心平台M365 CopilotCopilot AI 技术栈,以及 Copilot 设备。我认为,真正的机遇并不仅仅在于这些平台本身,更在于在座的各位能够利用这些平台所激发的无限创新潜力,去创造、去构建、去实现。这,是在座每一位的历史性机遇。

当然,所有这些强大的技术平台要想真正发挥价值并被广泛接受,都离不开一个至关重要的基石——那就是信任。随着 AI 技术在我们生活和工作中扮演的角色日益重要和普及 ,从设计之初就将信任和安全融入其中变得前所未有的关键和紧迫。这正是我们通过“安全未来倡议”等一系列举措,始终秉持负责任、有原则的方法来发展 AI 的核心原因。将对用户隐私的尊重与保护、对 AI 安全风险的审慎考量等原则,深度融入到产品的设计、开发与部署全流程之中,是我们的重中之重。这里的关键在于,必须将这些原则切实地内化并贯彻到构建每一个 AI 工作负载或应用程序的具体工程实践 当中去。

为此,我们正在积极构建并提供一系列关键的技术能力来支撑这一目标:例如,通过机密计算技术来保障数据在处理过程中的机密性和安全性;在 Foundry 平台中提供专门的 grounding API,用以帮助检测和缓解 AI 模型可能出现的“幻觉”问题,确保输出结果的可靠性。我个人非常欣赏 grounding API 的设计理念,因为它巧妙地利用了 AI 自身的能力来核查 AI 输出的内容是否基于真实、可靠的依据,从而显著提升最终应用程序的可信度。这些都是我们在现实世界中为开发者提供的、用以构建出更健壮、更值得信赖 的 AI 应用程序的创新技术、服务和实用工具。

就在昨天,我们还非常激动地宣布推出了专门用于网络安全防御领域的AIAgent。在当前网络攻击持续不断、日益复杂的严峻形势下,这些AIAgent旨在切实帮助我们更好地守护我们的数字资产和网络疆域。网络安全无疑是我们当下面临的最严峻挑战之一。现在,我们可以有效地借助AI 的力量来显著加强防御能力。例如,这些 AIAgent能够自动地对海量的网络钓鱼邮件进行精准分类,及时发出关键的威胁情报警报,并能主动验证和确保企业设定的条件访问策略得到严格且有效的执行。值得强调的是,这不仅仅是微软自身在构建AIAgent,我们也正积极地将来自我们众多合作伙伴的Agent能力整合进来。这再次体现了我们作为平台公司与生态伙伴协同作战、共同应对挑战的理念。因为归根结底,尤其是在网络安全这个领域,没有任何一家公司能够单打独斗,它天然需要广泛的协作和信息共享,本质上是一项团队运动。我们对于在网络安全AI 领域所取得的各项进展感到非常兴奋和期待。

在结束今天的演讲之前,我想和大家一起展望一下更长远的未来。让我们思考一下,所有这些强大的 AI 能力,最终将帮助我们达成什么?从某种意义上来说,当科学家们致力于发现一种新药物、一种新化学物质或是一种新材料时,AI 能够通过其强大的模式识别和预测能力,极大地缩减需要进行实验探索的可能性空间,从而加速发现的进程。可以说,在推动基础科学前沿突破方面,AI 正扮演着一种前所未有的、“自然的模拟器”的角色。

然而,要获得一个能够真正、完全模拟自然复杂性的终极工具——一个真正意义上的“自然模拟器”,其中一条最被寄予厚望的关键路径,就是实现通用、容错的量子计算机 。这正是 微软过去二十年来一直不懈追求的科学梦想:我们投入巨资,深入研究如何构建一台能够解决实际问题的、实用规模的量子计算机。这首先需要在基础物理学上取得重大突破,特别是要找到方法来制造出足够稳定、并且具备内建量子纠错能力的量子比特。这正是我们长期以来聚焦于探索Majorana zero modes这一独特物理现象的核心驱动力。当然,从基础物理的发现到最终制造出可靠的量子芯片,还有很长的路要走。我们基于这一原理已经研发出了Majorana 1芯片原型。要让量子计算机真正从实验室走向实用化,前方依然有诸多严峻的技术挑战需要我们逐一克服。

但与此同时,我们并未将所有希望都寄托于硬件的终极突破。我们也在同步地、积极地构建量子计算的软件层,并将其全面部署在Azure 云平台上。这个软件层不仅提供了像专用量子编程语言,还集成了先进的逻辑纠错技术。更重要的是,它被设计成能够兼容当前各种不同技术路径、虽然仍带有噪声但已可用的量子计算硬件,无论是基于离子阱技术的计算机 (ion trap computers) 还是所谓的 NISQ (含噪声中等规模量子) 计算机 (NISQ computers)。通过这种方式,开发者们现在就可以开始在熟悉的 Azure 环境中,利用这些工具和资源,探索和使用量子计算的能力,为未来的量子时代做好准备。我们坚信,量子计算将是继当前这波 AI 浪潮之后的、下一次足以改变整个计算范式的重大系统性革命。为了让大家对我们在这方面的进展有一个更直观的感受,请观看最后这段关于 微软量子计算的视频。

那么,请允许我以今天演讲开篇时所分享的那句话来作为结束语。对微软而言,我们的使命始终如一,并且无比清晰:在这个日新月异的AI 时代,我们要坚定不移地赋能日本的每一个人和每一个组织,帮助他们取得更多、更大的成就。回望过去 47 年,我们有幸将一代又一代的创新技术平台引入日本,并亲眼见证了这片充满活力的土地上创新生态的蓬勃发展与繁荣。我们的这份承诺从未改变。我们满怀希望与期待,在当前这一波由 AI 引领的技术浪潮中,我们能够立足于过往坚实的合作基础之上,与日本各界的伙伴们更加紧密地携手并肩,共同去创造一个更加辉煌、更加智能的未来。衷心感谢今天到场的每一位!祝愿大家在后续的会议议程中收获满满,交流愉快。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料欢迎扫描二维码或访问进入。

截止到2月28日 ”未来知识库”精选的100部前沿科技趋势报告

《核聚变,确保 21 世纪美国的主导地位的关键技术》

《世界知识产权组织:2025WIPO 技术趋势报告:交通运输的未来(145 页)》

《世界知识产权组织(WIPO):2024 年世界知识产权指标报告(194 页)》

《联合国环境规划署:2024 年保护地球报告(81 页)》

《联合国工发组织:2024 清洁技术创新能力建设框架研究报告(51 页)》

《凯捷:Applying TechnoVision 2025:未来科技趋势及应用愿景(17 页)》

《谷歌:2025 年 AI Agent 白皮书:AI 智能体时代来临(42 页)》

《富而德律师事务所:2024 年国际仲裁趋势年度回顾报告(41 页)》

《邓白氏:2024 年全球企业破产报告(27 页)》

《LLM 时代小模型的应用潜力与挑战 》(50 页)

《斯坦福 2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告》(英文版 191 页)

《英伟达:2025NVIDIA 自动驾驶安全报告(26 页)》

《微软 MICROSOFT (MSFT) 2024 年影响力摘要报告(23 页)》

《高德地图:2024 年中国主要城市交通分析报告(29 页)》

《德勤 & CAS:2025 锂离子电池回收行业报告 - 面向绿色未来的市场及创新趋势(36 页)》

《ABI Research:2025 生成式人工智能在语义和实时通信中的应用研究报告(20 页)》

《2025 年 3D 打印技术发展趋势、产业链及相关标的分析报告(45 页)》

《生成式基础模型的可信度 —— 指南、评估与展望》(231 页)

《量子信息科学与技术对国家安全的影响》(118 页)

《中国科学技术信息研究所:2024 科技期刊世界影响力指数(WJCI)报告(68 页)》

《思略特(Strategy&):2025 汽车行业的人工智能(AI)机遇研究报告(12 页)》

《赛默飞:2024 年中国生物科技行业调研报告:资本寒冬中生物科技企业的生产之道(18 页)》

《清华大学:2025 年 DeepSeek 与 AI 幻觉报告(38 页)》

《美国企业研究所(AEI):2025 创新未来电力系统研究报告:从愿景迈向行动(71 页)》

《超材料的智能设计研究进展》

《Ember:2030 年全球可再生能源装机容量目标研究报告(29 页)》

《量子信息科学与技术对国家安全的影响》

《英国人工智能安全研究所:2025 年国际人工智能安全报告 - 执行摘要(22 页)》

《世界海事大学:2024 海事数字化与脱碳研究报告:可持续未来(250 页)》

《艾睿铂(AlixPartners):2024 回溯过往锚定未来:大型科技公司如何推进人工智能愿景研究报告(18 页)》

《Wavestone :2025 数据与 AI 雷达:掌握数据与人工智能转型的 10 大挑战研究报告(30 页)》

《CSIS:2024 中美学术的再联结研究报告:在激烈竞争的时代增进相互理解(120 页)》

《MSC:2025 全球国防创新就绪度差距系列报告:突破制约国防创新的六大隐性障碍(第四版)(32 页)》

《2025 年 AI 编程发展前景及国内外 AI 编程应用发展现状分析报告(22 页)》

《中国核电 - 公司深度报告:世界核电看中国 - 250218(22 页)》

《医药生物行业:医疗器械行业全景图发展趋势及投资机会展望 - 250216(28 页)》

《皮尤研究中心:2024 美国社交媒体使用情况研究报告(英文版)(30 页)》

《科睿唯安:2025 基因编辑领域的领先创新者洞察报告 - 改变药物发现和开发范式的八大创新者(47 页)》

《经合组织(OECD):2025 年全球脆弱性报告(218 页)》

《计算机行业年度策略:AI 应用元年看好 Agent、豆包链及推理算力三大主线 - 250218(38 页)》

《国金证券研究所:从理想走向现实,全球人型机器人研究报告》

《深度解读 DeepSeek 原理与效应(附 PPT 下载)》

《兰德公司(RAND):2025 借鉴危机经验构建城市水安全韧性研究报告:五城案例分析(62 页)》

《凯捷(Capgemini):2025 行业创新洞察:电气化飞机推进系统研究报告(27 页)》

《国际能源署(IEA):2025 全球电力市场报告:至 2027 年的分析与预测(200 页)》

《Zenith:2025 年国际消费电子展(CES)趋势报告:AI 对消费科技、消费行为及传媒营销的变革性影响(17 页)》

《RBC 财富管理:全球透视 2025 年展望报告(33 页)》

《美国国防部和国家安全领域的十大新兴技术》(96 页)

《代理型人工智能全面指南》(45 页 ppt)

《麦肯锡 2025 人类工作中的超级代理。赋能人类解锁 AI 的全部潜力》(英文版 47 页)

《仲量联行(JLL):2025 美国制造业的复兴全面分析报告:未来制造业增长及工业需求前瞻(26 页)》

《未来的太空领域:影响美国战略优势的领域》

《Luminate:2024 年年终美国影视行业报告:数据及趋势洞察(40 页)》

《Anthropic:2025 年 AI 经济影响报告:AI 如何融入现代经济的各类实际任务(38 页)》

【ICLR2025】《LLMS 能否识别您的偏好?评估 LLMS 中的个性化偏好遵循能力》

《改进单智能体和多智能体深度强化学习方法》(219 页)

《美国安全与新兴技术中心:2025 中国学界对大语言模型的批判性思考通用人工智能 AGI 的多元路径探索研究报告》(英文版 29 页)

《世界经济论坛 & 麦肯锡:2025 以人才为核心:制造业持续变革的当务之急研究报告(40 页)》

《超越 ChatGPT 的 AI 智能体》(82 页 ppt)

《Harris Poll:2024 年汽车技术预测报告:消费者对先进汽车技术与功能的洞察(14 页)》

【新书】《人工智能智能体的应用》(527 页)

《哥伦比亚大学:超越 Chatgpt 的 AI agent 综述》

《欧盟标准组织 - 体验式网络智能(ENI)- 基于人工智能代理的下一代网络切片研究》

《中国科学院:2024 开放地球引擎(OGE)研究进展与应用报告(55 页)》

《中国工程院:2024 农业机器人现状与展望报告(70 页)》

《美国安全与新兴技术中心:2025 中国学界对大语言模型的批判性思考:通用人工智能 (AGI) 的多元路径探索研究报告(29 页)》

《罗兰贝格:2050 年全球趋势纲要报告之趋势五:技术与创新(2025 年版)(72 页)》

《理特咨询(ADL):2025 解锁聚变能源:驾驭聚变能商业化的机遇与挑战研究报告(20 页)》

《埃森哲:技术展望 2025—AI 自主宣言:可能无限信任惟先 - 摘要(12 页)》

《怡安(AON):2025 年气候和自然灾难洞察报告(109 页)》

《美国安全与新兴技术中心:2025 AI 翻车事故(AI incident):强制性报告制度的关键要素研究报告(32 页)》

《牛津经济研究院 2025 确保英国充分释放量子计算的经济潜力研究报告 》(英文版 64 页)

《欧洲创新委员会(EIC):2024 年科技报告(65 页)》

《大模型基础 完整版》

《国际人工智能安全报告》(300 页)

《怡安(AON):2025 年全球医疗趋势报告(19 页)》

《前瞻:2025 年脑机接口产业蓝皮书 —— 未来将至打造人机交互新范式(57 页)》

《联合国(United Nations):2024 技术与统计报告:从业者投资法指南(67 页)》

《经济学人智库(EIU):2025 全球展望报告:特朗普再次当选美国总统的全球影响(16 页)》

《大规模视觉 - 语言模型的基准、评估、应用与挑战》

《大规模安全:大模型安全的全面综述》

《Emplifi:2024 年 Q4 全球电商行业基准报告 - 社交媒体趋势洞察(37 页)》

《DeepMind:2025 生成式魂灵:预测人工智能来世的益处和风险研究报告(23 页)》

【AI4Science】《利用大型语言模型变革科学:关于人工智能辅助科学发现、实验、内容生成与评估的调研》

《世界银行:2025 极端天气高昂代价:气候变化背景下的马拉维金融韧性构建研究报告(76 页)》

《北京理工大学:2025 年中国能源经济指数研究及展望报告》

《Space Capital:2024 年第四季度太空投资报告(22 页)》

《NetDocuments:2025 年法律科技趋势报告(32 页)》

《CB Insights:2024 年度全球企业风险投资(CVC)状况报告:私募市场交易、投融资数据及分析(130 页)》

《Artlist:2025 年全球内容与创意趋势报告(59 页)》

《IBM 商业价值研究院:2024 投资人工智能伦理和治理必要性研究报告:AI 伦理前线五位高管的真实故事(24 页)》

《世界基准联盟(WBA):2025 塑造未来:对可持续发展目标(SDGs)影响最大的 2000 家公司研究报告(46 页)》

《清华大学:2025 年 DeepSeek 从入门到精通(104 页)》

《麦肯锡:2025 工作场所中的超级代理 (Superagency):赋能人类解锁人工智能的全部潜力(47 页)》

《凯捷(Capgemini):科技愿景 2025:关键新兴科技趋势探索(54 页)》

《硅谷银行(SVB):2025 年上半年全球创新经济展望报告(39 页)》

《BCG:2025 工业运营前沿技术:AI 智能体 (AI Agents) 的崛起白皮书(26 页)》

《DrakeStar:2024 年全球游戏与电竞行业报告(26 页)》

《理特咨询(ADL):2025 人工智能驱动的研究、开发与创新突破的新时代研究报告(80 页)》

《互联网安全中心(CIS):2024 年网络安全冬季报告:回顾与展望(30 页)》

《方舟投资(ARK Invest):Big Ideas 2025 - 年度投研报告(148 页)》

《DeepSeek:2024 年 DeepSeek-V2 模型技术报告:经济、高效的混合专家语言模型(52 页)》

《CB Insights:2024 年度全球风险投资状况回顾报告:私募市场交易、投融资和退出数据及分析(273 页)》

《全国智标委:2025 城市生命线数字化标准体系研究报告(105 页)》

《经合组织(OECD):2024 年全球政府创新趋势报告:促进以人为本的公共服务(46 页)》

《DeepSeek_R1 技术报告》

《摩根斯坦利报告 —DeepSeek 对于科技和更广义经济的含义是什么?》

《李飞飞最新 S1 模型的论文:s1 Simple test-time scaling》

《世界经济论坛 -《全球经济未来:2030 年的生产力》报告》

《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》

《百页大语言模型新书》(209 页 pdf)

《量子技术和网络安全:技术、治理和政策挑战》(107 页)

《大语言模型中的对齐伪造》(137 页)

《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》(美陆军 232 页)

《美国防部 CDAO:人工智能模型的测试与评估》(66 页 slides)

《自动驾驶的世界模型综述》

《Questel2024 深度学习领域专利全景报告》(英文版 34 页)

《深度解析 Palantir》(20250122_204934.pdf)

上下滑动查看更多

来源:人工智能学家

相关推荐