摘要:在人工智能与机器人技术快速融合的背景下,机器人领域有望涌现出这样的模型。Anthropic联合创始人兼政策主管Jack Clark表示,机器人行业即将迎来类似生成式AI模型的早期发展时期(GPT - 2时代),各家机器人基座大模型将积极争夺机器人“大脑”的主导
一、下一个“DeepSeek”已经在路上
从当前人工智能的发展趋势来看,很可能会有下一个像DeepSeek - R1这样具有影响力的模型出现。
在人工智能与机器人技术快速融合的背景下,机器人领域有望涌现出这样的模型。Anthropic联合创始人兼政策主管Jack Clark表示,机器人行业即将迎来类似生成式AI模型的早期发展时期(GPT - 2时代),各家机器人基座大模型将积极争夺机器人“大脑”的主导权,这或将推动下一个“DeepSeek时刻”的到来。
近期已有相关模型推出,例如Google DeepMind推出用于机器人技术的人工智能模型Gemini Robotics和Gemini Robotics - ER,能提升通用机器人实用性,帮助机器人适应复杂环境完成复杂任务;华为天才少年稚晖君创立的智元机器人发布全球首个通用具身基座模型——智元启元大模型(Genie Operator - 1,简称GO - 1),使机器人学习能力实现革命性提升,推动具身智能进入新的发展阶段。
除此之外,2025年还有其他一些备受关注的新兴人工智能模型,如xAI公司的Grok3、法国米斯特拉尔人工智能公司的LeChat、谷歌的“双子座2.0”系列模型、OpenAI的o3mini等。这些模型在推理能力、计算性能、处理速度、应用场景等方面各有突破,这也反映出人工智能领域持续创新的活力,未来大概率会有更多具有创新性和影响力的模型诞生。
二、Gemini Robotics和Gemini Robotics - ER与DeepSeek相比有哪些优势和劣势?
Gemini Robotics和Gemini Robotics - ER与DeepSeek属于不同应用领域的模型,它们的优势和劣势会因应用场景的不同而有所差异。下面为你分别对比分析:
优势
● Gemini Robotics和Gemini Robotics - ER
○ 具身智能应用优势:这两款模型是先进的视觉语言动作(VLA)模型,属于端到端模型架构,直接通过原始传感器数据映射到机器人的连续动作输出,能实现机器人从感知环境到执行动作的全流程整合。它们可适应不同情况、理解多种语言指令并快速响应、完成复杂精细任务,还能适应不同机器人类型,适用于具身智能领域,如控制人形机器人执行现实世界任务。而DeepSeek目前主要应用于医疗领域,在机器人控制和具身智能方面没有相关能力。
○ 空间推理和即时创新能力:Gemini Robotics - ER在具身推理方面有极大增强,聚焦于空间推理,提升了对世界的理解,还能结合空间推理和编码能力即时产生全新的功能,有助于机器人在复杂环境中更好地执行任务。
● DeepSeek
○ 推理能力突出:DeepSeek是推理型大模型,更像经验丰富的资深员工,只需提供一个目标,它就能自主思考、分析,并产出逻辑清晰、内容丰富的结果,在需要深度思考和逻辑推理的任务中表现出色。而Gemini Robotics和Gemini Robotics - ER主要侧重于机器人控制和交互,在纯推理方面没有明显优势。
○ 训练效率与成本优势:相对于其他大模型,DeepSeek在训练效率与成本方面表现更为出色,显著降低了医院等终端客户对于算力和服务器的需求,适合对成本较为敏感的应用场景。
劣势
● Gemini Robotics和Gemini Robotics - ER
○ 缺乏专业领域深度应用:主要聚焦于具身智能和机器人控制领域,在医疗等特定专业领域没有像DeepSeek那样的针对性应用和专业知识储备,难以直接应用于医疗场景中的体检报告解读、文书撰写、药物咨询等任务。
● DeepSeek
○ 不具备机器人控制能力:由于其定位和设计并非针对机器人领域,所以无法像Gemini Robotics和Gemini Robotics - ER那样实现对机器人的端到端控制,不能理解视觉信息和执行复杂的物理动作,难以在机器人应用场景中发挥作用。
来源:路人行人路人甲1