谷歌(GOOGL.US)AI杀入“分“时代,Gemini三箭齐发对决OpenAI

B站影视 2025-02-06 09:03 1

摘要:谷歌(GOOGL.US)于周三正式向所有人发布了其“最强大”的人工智能模型套件——Gemini 2.0。这一全面发布的模型套件包括三个核心版本:2.0 Flash、2.0 Pro Experimental 和 2.0 Flash-Lite。其中,2.0 Fla

智通财经APP获悉,谷歌(GOOGL.US)于周三正式向所有人发布了其“最强大”的人工智能模型套件——Gemini 2.0。这一全面发布的模型套件包括三个核心版本:2.0 Flash、2.0 Pro Experimental 和 2.0 Flash-Lite。其中,2.0 Flash 是“主力模型”,适用于大规模高容量、高频率任务;2.0 Pro Experimental 专注于提升编程性能,支持200万tokens的输入容量;而2.0 Flash-Lite 则是谷歌称作“迄今为止最具成本效益的模型”,每百万tokens处理成本仅为0.75美分,相比2.0 Flash 的10美分更具性价比。

此次发布是谷歌在人工智能代理领域的重要布局。人工智能代理能够代表用户自动完成复杂的多步骤任务,而无需用户逐步指导。谷歌在去年12月的博客文章中提到,Gemini 2.0 在多模态能力方面取得了新进展,支持文本、图像和音频等多种数据类型,并具备原生工具调用能力。这些特性使该模型系列更接近“通用型数字助手”的愿景。

与此同时,科技巨头和初创公司之间的人工智能军备竞赛正在加剧。Meta(META.US)、亚马逊(AMZN.US)、微软(MFT.US)、OpenAI 和 Anthropic 等公司都在加速开发类似的人工智能代理系统。

例如,Anthropic 在去年10月宣布其智能体能够像人类一样使用计算机完成复杂任务。据了解,Anthropic 是一家由前 OpenAI 研究主管创立的人工智能初创公司,得到了亚马逊的支持,已成为开发人工智能代理领域的重要竞争力量。

这家初创公司表示,Anthropic 的技术通过其强大的计算机使用能力,能够解释计算机屏幕上的内容、选择按钮、输入文本、浏览网站,并通过任何软件和实时互联网执行复杂任务。

Anthropic 首席科学官贾里德·卡普兰(Jared Kaplan)在接受采访时表示,该工具“基本上能够像人类一样使用计算机”,并强调它可以完成涉及“数十甚至数百个步骤”的复杂任务。

与此同时,OpenAI 最近推出了一项名为 Operator 的功能,该功能能够自动执行一系列复杂任务,例如计划假期、填写表格、预订餐厅以及订购杂货。这家由微软支持的初创公司将 Operator 描述为“一个能够上网为您执行任务的智能代理”。

本周早些时候,OpenAI 进一步拓展了其技术边界,推出了 Deep Research。这项新功能允许 AI 代理编写复杂的研究报告,并分析用户选择的问题和主题。值得注意的是,谷歌在去年 12 月也推出了一款同名的工具——Deep Research,它被设计为一个“研究助手”,能够探索复杂主题并代表用户编写报告。

谷歌计划在2025年初推出更多人工智能功能,其首席执行官桑达尔·皮查伊 (Sundar Pichai) 在当时的战略会议上表示:“从历史上看,你并不一定总是第一个进入市场,但关键在于执行力——真正成为同类产品中最好的。我认为,这正是 2025 年对我们而言最重要的意义所在。”

来源:智通财经APP

相关推荐