AI第二波浪潮袭来,“工作的未来”将被重新定义

B站影视 港台电影 2025-03-20 16:38 2

摘要:最近,一款名为Manus的AI代理人产品引发关注,号称“全球首款通用型智能体”。它能自主执行复杂任务,如筛选简历、规划旅游、分析股票、寻找供应商等,像人一样思考和行动。虽尚处内测且存争议,但似乎昭示着,AI应用范式的变革正山雨欲来。

最近,一款名为Manus的AI代理人产品引发关注,号称“全球首款通用型智能体”。它能自主执行复杂任务,如筛选简历、规划旅游、分析股票、寻找供应商等,像人一样思考和行动。虽尚处内测且存争议,但似乎昭示着,AI应用范式的变革正山雨欲来。

如果说,生成式人工智能(generative AI)是2022年以来卷起的AI浪潮的第一波,那么,代理式人工智能(agentic AI)则毫无疑问是第二波。

生成式AI擅长于创造力和自动化,而代理式AI更像是数字帮手,能够处理工作流、解决问题,并在各个领域(如人力资源、软件工程、数字营销和客户服务等)中提供实时支持。

在CES 2025上像明星一样受到追捧的黄仁勋在演讲中表示,我们正式进入了代理式AI的时代。他通过展示不同装扮的动画版“自己”,演示了这些AI代理如何胜任客服、编程和研究助理等角色。他认为,“AI代理是新的数字劳动力”,“未来,每家公司的IT部门都将成为AI代理的人力资源部门”。人工智能代理产业将是一个“万亿美元级的机会”。

在CES 2025期间,黄仁勋和英伟达首席财务官科莱特·克莱斯(Colette Kress)主持了一场金融分析师问答,代理式AI是热门话题之一。黄仁勋在谈到这项技术的工作原理时说:

“它必须进行推理,一步一步地分解。人工智能会检索和读取信息,理解信息,将其纳入上下文,最终生成一些答案。代理式人工智能可以对事物进行数千次推理。”

对于大多数普通用户来说,弄清背后的原理并不重要,更重要的是代理式AI能为我们实际做什么。一些基本的代理式AI用例包括:

通过筛选选项和尺寸来订购零售商品,并无缝地下单购买;

个性化的健康护理指南,能够安排预约和药物处方;

一个能够处理客户问题和疑虑的AI代理,人人都对现有的客服机器人不满,但一个好的AI代理可以执行这些功能,并迅速、轻松地将我们引导到人工客服;

教育领域也是一个应用场景,能够帮助学生理解不明白的内容并提供帮助,大大改善学习效果。

▲ 图源Pixabay

2025年预计将成为企业充分利用AI代理的一年。根据ChatGPT的说法,“在许多情况下,AI将接管常规或重复性的任务,从而解放人类员工,让他们专注于战略性和创造性的活动”。ChatGPT自身就处于迈向个人代理的过程中。

2025年一开年,山姆·阿尔特曼(Sam Altman)在一篇博客日志中称:

“在2025年,我们可能会看到首批AI代理加入劳动力市场,并实质性地改变企业的产出。我们仍然相信,将强大的工具迭代地交到人们手中,将带来广泛分布的卓越成果。”

接下来,市场迅即看到了OpenAI在这方面的第一次认真尝试:

1月14日,OpenAI宣布推出名为Tasks的测试版新功能,为ChatGPT增加了一些基础的自动化功能。无论是一次性提醒还是周期重复性任务,现在只需说明需求和完成时间,ChatGPT就能自动定时实现。

1月23日,OpenAI推出一款名为Operator的通用型 AI代理的研究预览版,能够控制网页浏览器并独立执行某些操作。Operator首先面向ChatGPT的200美元包月Pro订阅用户在美国推出,公司计划未来将其集成到所有ChatGPT客户端中。

Tasks让ChatGPT在实用性上更接近Siri或Alexa,而Operator展示了传统虚拟助手所无法实现的新能力。据OpenAI介绍,Operator旨在自动化各种任务,例如预订旅行住宿、预约餐厅以及在线购物。在Operator界面中,用户可以选择多个任务类别,包括购物、外卖、餐饮和旅行等,每个类别都支持不同类型的自动化操作。

当ChatGPT用户启用Operator时,会弹出一个小窗口,显示该智能代理用于完成任务的专用网页浏览器,并附带对其执行的具体操作解释。在Operator运行期间,用户仍然可以控制自己的屏幕,因为Operator使用的是独立的浏览器。

OpenAI在支持文档中补充道:“目前,Operator无法可靠地处理许多复杂或专业化的任务,例如创建详细的幻灯片、管理复杂的日程系统,或与高度定制化或非标准的网页界面交互。”此外,出于谨慎考虑,OpenAI要求对某些任务进行监督,例如银行交易。

Operator进入了一个高度竞争的领域,但其优势在于ChatGPT的广泛应用以及OpenAI强大的模型集成能力。然而,Google、Microsoft和Meta等公司同样拥有深厚的资源和庞大的用户基础,而Rabbit、Adept和Perplexity等初创公司则在AI自动化方面不断创新和突破。

如今的竞赛核心在于,谁能打造出最可靠、安全且高效的AI代理,并顺利融入现实工作流程。

未来,AI代理将如何发展,以及谁能在代理式人工智能竞赛中保持领先地位,将会是人工智能产业的一大看点。

▲ 图源Pixabay

自从生成式人工智能大行其道以来,人们最担心的问题之一就是它将如何影响就业并是否会取代人类劳动力。而现在,提到人工智能代理,这种担忧只会更加强烈,因为这些代理甚至不需要人类的不断提示或监督就能为人类执行任务,从而进一步消除了人类执行特定任务的需要。

当我们谈论“工作的未来”时,很容易迷失在各种流行术语和宏观概念之中。众多机构都在研究工作的未来,但视角各不相同。我们该如何拨开迷雾,直击核心?

我认为,可以采用哈罗德·莱维特(Harold Leavitt)提出的经典框架——工作的“三大支柱”来对我们面临的代理化的未来展开分析:人(People)、流程(Processes)和技术(Technology)。

工作本质上是人在完成任务,而技术则影响着流程以及工作的执行方式。在三大支柱中,如果一个组成部分发生变化,其他两个组成部分也必须随之变化,以便在变化过程中保持有效的平衡。

这一框架被简称为“PPT框架”,它有两个关键优势:

一个优势是促进有效的变革管理。例如,当组织引入新技术时,员工通常需要学习新技能,而现有流程可能也需要重新配置。PPT框架确保员工得到充分培训,并调整流程以适应新技术,从而降低变革阻力,提高组织适应能力。

另一个重要优势是促进持续改进。通过持续监测和评估“人员、流程和技术”三大要素,组织可以识别改进点并采取行动,从而形成持续优化和创新的文化。这种方法对于企业保持竞争优势至关重要,使其能够在快速变化的市场环境中立于不败之地。

如今,人工智能正在深刻改变这三大支柱。这不仅仅是一次普通的技术升级,而是一场范式转变,可能会彻底重塑“工作”的概念,并改变这三者之间的互动方式,从而提升生产力、利润率和整体效率。

人:被取代还是被增强?

从人的角度来讲,随着工作的性质持续演变,从业者的技能要求和人才结构也在不断变化。组织需要持续适应这些变化,以确保其拥有所需的人才储备。如果执行自动化任务的AI代理人得到广泛应用,有可能在多个领域取代人类代理人。

受到冲击最大的职业包括客户服务和软件工程。AI代理正在被开发用来执行软件工程师当前处理的任务;而在客服中心,AI代理可以自动化交互,处理常规咨询,这些将显著改变软件处理和客户服务的方式。目前,AI代理在医疗、金融、制造、零售、教育、交通和物流等领域受到广泛探索,有潜力自动化这些行业的任务和流程。

微软正在开发自己的AI模型MAI,旨在减少对OpenAI GPT模型的依赖。有报告称MAI展示了与行业标准相当的推理能力。微软采用的推理模型通常能够生成直接答案,展示其推理过程,并遵循更结构化的思维方式。这些特性使其特别适用于需要复杂问题解决的应用场景,例如:医疗保健中的医学诊断;科学研究中的数据分析;制造业中的自动化决策;金融领域的风险评估。

微软的研发重点在于MAI在多种任务上的表现,包括为该公司的Copilot AI助手提供支持。一旦集成到Copilot产品中,微软的自主推理模型可以提供先进的解决问题能力和更高的成本效益。

如果多种任务都交给AI代理来做,我们可以想象,在各行各业,除了上文已然提到的软件工程师和呼叫中心座席员及在线聊天支持代表,最有可能被AI取代的工作还将包括:

医疗领域的放射科技师;保险行业的理赔员、核保员和客户服务代表;金融行业的银行柜员、贷款专员和初级金融分析师;制造业中的流水线工人、质检员和仓库拣货员;零售业中的收银员和库存管理员;物流业中的长途卡车司机、本地送货司机和货运协调员;教育业中的考试评分员和行政协调员;法律业中的法律助理、法律研究员和文件审查员;娱乐和媒体业中的事务性新闻(比如财务报告和体育回顾)记者、视频编辑和图形设计师,等等。

听来吓人,且慢恐慌。还有一种声音强调,AI更应被视为增强而非取代人类能力的工具。例如,Salesforce的爱因斯坦人工智能(Einstein AI)通过自动执行任务和预测销售线索来增强销售团队的能力,使销售代表能够专注于达成交易,而不是忙于行政事务。在普华永道,顾问们利用人工智能更快地提出见解,使他们能够专注于战略决策。

在制造业方面,熟练的技术人员仍然是必不可少的,他们负责监督自动化系统、排除故障并编程AI驱动的机械设备。制造业的未来将是自动化与人类专业知识的结合。

就服务而言,尽管AI正在替代基础层面的客户支持工作,但人类客服仍将在复杂问题解决、高端客户体验、情感支持等方面发挥关键作用。未来,AI与人类协作将成为趋势,企业可能更倾向于用AI处理基础问题,而人工客服则专注于个性化和复杂案例的服务。

尽管AI正在自动化医疗行业的许多任务,但它的本质是增强医生、护士和研究人员的能力。未来的医疗行业将更加依赖AI提升效率,但人类的专业知识和决策能力仍然不可替代,尤其是在病患护理和复杂医疗决策方面。

教师也不会被AI取代,取代的只是重复性的任务。人类教育者仍然对学生指导、课程开发和课堂互动至关重要。教师在培养创造力和批判性思维方面具有不可替代的作用。

在新闻和娱乐行业,人类的创造力仍然是讲故事、品牌塑造和高质量艺术制作的关键。娱乐和媒体业的未来将取决于AI驱动的效率与人类创意相结合,创造出更具吸引力和活力的内容。

▲ 图源Pexels

流程:更聪明地工作,而不是更辛苦地工作

人工智能不只是遵循流程,而是实时优化流程。看看UPS的ORION系统,它能即时调整送货路线,为公司节省数百万美元。同样,物流公司可以利用人工智能预测供应链需求并实时管理库存。

在零售与电子商务业,AI拥有自动化客户互动、优化库存管理和提升购物体验的能力;机器学习系统能够个性化推荐、预测需求并简化运营。

在金融业,AI可以自动化交易、自动开展风险评估和欺诈检测;机器学习模型能够比人工分析师更快地识别趋势并做出预测,这提高了准确性、降低了成本并增强了决策能力。这些都是流程精细化的放大。

人工智能也可以颠覆旧有的不合理的、效率低的流程。例如,在医疗领域的药物研发方面,机器学习算法可以比传统研究方法更快地发现潜在疗法,加速新药开发。在个性化治疗上,机器学习模型可以分析医学图像,协助诊断,甚至建议治疗方案,而AI代理人也可以通过大数据分析帮助医生为患者制定个性化治疗方案,从而减少人为错误并改善患者的治疗效果。

现代商业流程极具复杂性,往往涉及多个利益相关者,使得流程规划和优化变得困难。组织必须确保其流程精简、高效且能够有效达成目标,以应对复杂的业务环境。

在这方面,AI代理将带来自主工作流的崛起。它可以超越传统的被动工具,这类工具需要不断的人类输入,而自主代理系统则能够独立行动,做出决策,并在各个行业中执行复杂的任务;同时亦能从环境中学习并实时调整行为。在某些情况下,AI代理能够与其他AI系统合作,形成多代理网络,解决大规模问题。

技术:终极的动力组合

人工智能可以为技术增压。Netflix的人工智能算法是其个性化推荐背后的大脑,它不仅提升了用户体验,还减少了用户流失,为公司节省了数十亿美元。特斯拉的自动驾驶系统是将人工智能与物联网相结合,重新定义交通的一个完美范例。

在此,我们需要认识到AI代理与AI助手的不同。AI助手是反应式的,按你的要求执行任务。而 AI代理则是主动式的,能够自主工作,通过任何可用的手段实现特定目标。

前者建立在对话式AI(conversational AI)的基础上,从2010年代末发展到今天。这一时期的AI助手不仅能回答问题、提供信息,还能够完成一定的任务,如自动回复邮件、设置日程,甚至是进行简单的推理和建议。

简单来说,AI助手是一种智能应用程序,能够理解自然语言指令,并通过对话式 AI接口为用户完成任务。许多现代虚拟助手,如亚马逊的Alexa和苹果的Siri,依赖这些功能来增强用户互动。

随着高级语言模型(如OpenAI的GPT系列)和自然语言处理(NLP)技术的进步,人工智能不再仅仅是执行指令的工具,而是能与人类进行流畅对话的虚拟助手和聊天机器人。

AI助手需要一个明确定义的问题或查询(现在常常称为“提示”)才能开始工作。它需要持续的用户输入,可以根据其访问的数据建议信息或行动,用户自身应检查输出结果的准确性。这些助手通过集成API扩展其功能。

用户可以通过调优使AI模型更适应特定任务,从而避免重新训练模型。通过微调,他们可以给出标有示例的模型,使其适合目标任务。通过提示调优,实践者可以为模型提供特定任务的上下文。

与AI助手相比,AI代理则是指一种系统或程序,可以自主地为用户或其他系统完成任务,设计自己的工作流程并使用可用的工具。

AI代理更加自主、复杂和可连接,可以涵盖除了自然语言处理以外的广泛功能。这些功能包括决策、问题解决、与外部环境互动和执行操作。

与AI助手需要用户为每个动作提供提示不同,AI代理可以在初始启动提示后独立操作。它们评估分配的目标,将任务拆解成子任务,并开发自己的工作流程以实现特定目标。

这些代理被部署在各种企业应用中,从软件设计和IT自动化到代码生成工具和对话助手。利用来自大语言模型的先进自然语言处理,AI代理逐步理解用户输入、制定行动策略并决定何时调用外部工具。

这一进步使AI迈向更高层次的智能——不仅是辅助人类,而是能够与人类共同创造,甚至主动完成复杂任务,为各个行业带来深远的影响。

▲ 图源Pixabay

第一, 每个人都会有一个AI助手。

无论是消费者还是知识工作者,未来每个人都会拥有一个AI助手。这将重新定义垂直应用、自动化平台和IT服务之间的传统边界,创造出为企业家提供转型市场机会的条件。AI助手将以不同的形式出现,从现有平台的副驾驶到嵌入AI 的应用程序和各种形式的AI代理。

第二,“人在回路中”必不可少。

目前大多数应用场景都处于实验阶段或早期生产阶段,主要集中在顾问和助手型的工作流程上。大语言模型目前还无法稳定地进行规划或推理,记忆和上下文等领域仍处于研究阶段。在自动化平台中,确定性执行至关重要,大语言模型主要用于特定任务的“设计阶段”,还不是“执行阶段”。

第三,AI代理的风险常常被低估。

随着AI代理能力的增强,也伴随着风险。安全性和伦理问题日益增长。这些系统通常需要访问敏感数据,这引发了隐私、偏见和责任等问题。同时,AI代理在自主行动时,可能会做出具有意外后果的决策,例如可能导致财务损失、误诊甚至法律纠纷的错误。如果没有明确的治理和监督,AI 代理可能会带来更多问题,而不是解决问题。

第四,任何AI部署都需要采取“爬行、走路、跑步”三步法。

自动化部署将从简单任务开始,逐步过渡到更复杂的工作流程。关键是持续实验 AI代理,了解其所真正能够增加的价值,并确保在自动化架构中拥有适当的数据、工具和执行的“支撑”基础。随着AI模型能力的增长,规模逐渐扩大到更多AI功能的应用。

来源:胡泳

相关推荐