摘要:AI智能体在模拟人类行为方面已经取得了显著的进展。根据报道,通过采访1000名真实人类并将其行为模式输入语言模型,生成的AI智能体在模拟人类行为上达到了85%的准确度。这意味着这些智能体能够以相当高的精度复现人类在特定情境下的反应和行为。
文/风平先生
AI智能体在模拟人类行为方面已经取得了显著的进展。根据报道,通过采访1000名真实人类并将其行为模式输入语言模型,生成的AI智能体在模拟人类行为上达到了85%的准确度。这意味着这些智能体能够以相当高的精度复现人类在特定情境下的反应和行为。
然而,尽管AI智能体在某些方面接近真实人类,但它们仍然存在局限性。例如,AI智能体虽然能够通过深度学习算法模拟人类智能,但在理解人类情感、直觉和创造性方面仍存在不足。此外,AI智能体的行为受限于其编程逻辑和数据训练,无法完全复制人类复杂的情感和道德判断。
因此,尽管AI智能体在模拟人类行为上取得了巨大进步,但它们并不能完全复制人类的全部智能和行为模式。AI智能体目前更像是人类行为的高效模仿者,而非真正的“克隆人”。
AI智能体如何模拟人类情感和直觉?
AI智能体模拟人类情感和直觉的方法主要涉及多个领域的交叉研究,包括心理学、神经生理学、计算机科学和脑科学等。这些研究通过数学语言对人类情感进行建模,使机器能够识别或表达人类情感,从而实现和谐的人机交互。
在具体技术上,AI可以通过面部表情合成技术生成逼真的面部表情,增强其情感表达能力。此外,情感结构和过程的研究帮助AI理解个体和跨文化差异,并应对危机和机遇中的策略。AI还可以通过参与式设计原则和实践,强调用户参与在设计过程中的重要性,从而更好地理解和模拟人类情感。
情感增强技术则是在AI中嵌入情感原则,用于规划、推理或目标实现。例如,通过引入焦虑和自信两个情感参数,使情感反向传播学习算法在面部识别任务中表现优于传统BP神经网络。认知AI的目标是模拟人类思维过程,使其在计算机模型中运行,以解决复杂问题。认知AI涉及开发模拟人类大脑功能的计算机系统,涵盖感知、注意力、思考、记忆、知识形成、判断、评价、问题解决和决策等主要脑行为。
尽管AI在认知层面已经能够理解人类情绪,但在体验共享方面仍存在局限。AI缺乏主观体验,因此无法真正理解和分享人类的情感状态。然而,随着技术的发展,具有情感的虚拟形象将变得更加逼真,尽管这并不等同于真正的感受,而是一种表演。
AI智能体通过多种技术和方法来模拟人类情感和直觉,包括面部表情合成、情感结构研究、参与式设计、情感增强和认知AI等。
AI智能体在理解人类道德判断方面的局限性是什么?
AI智能体在理解人类道德判断方面的局限性主要体现在以下几个方面:
缺乏道德自我意识和良心:AI缺乏人类的智慧美德,即在复杂情境中寻找最优行为、做出合理妥协和坚定捍卫道德底线的能力。此外,AI缺乏良心,这是形成对个人行为道德善恶判断的重要属性。因此,AI无法对道德善恶做出具体判断或对其行为负责。
情感和概念层面的限制:尽管AI在情感心理学方面取得了一些进展,但对情感起源的全面理解尚未完成。情感由多个组成部分构成,包括生理成分,而AI无法调节其内部环境,这对其生存至关重要。因此,将AI视为具有道德责任的概念是错误的。
缺乏反思立场和规范自我治理能力:人类通过反思和可能的变革来成为规则的共同作者,而AI agents缺乏这种反思立场,无法进行“规范自我治理”,即评估信念和行动的潜在基础,判断其是否构成正当理由,并据此调整信念和行动。
信息缺口和不确定性处理不足:即使是最“完美”的决策机器,如果缺少道德相关事实,也会做出错误的决定。标准方法无法像处理风险和其他不确定性那样处理虚假信息和信息缺口的问题。
缺乏同情理解和上下文背景:人工神经网络(ANN)和AI系统并不共享人类的生活方式,它们没有生物学基础,自然反应,也没有通过一般教育进入我们的生活。因此,算法缺乏同情理解,无法理解我们可能给予的道德典范。
道德脱钩和责任降低:依赖技术决策可能导致“道德脱钩”,使人们感觉对(不)道德决策结果的责任感降低,因为他们可能认为机器而非自己在主导决策过程。长期而言,如果AI系统完全负责道德决策,人类可能会面临道德技能退化。
道德判断的复杂性和模糊性:道德判断涉及复杂的机制,即使在有充分时间思考和理性论证的情况下,许多人仍难以改变自己的初始直觉。如果人们仅仅按照AI的指示行事,这种参与对话的能力可能会受到削弱,从而可能导致道德脱节。
目前最先进的AI智能体技术有哪些?
目前最先进的AI智能体技术主要集中在以下几个方面:
多模态模型:谷歌DeepMind推出的RoboCat是一个典型的例子,它使用多模态模型Gato,在模拟和物理环境中处理语言、图像和动作。这种模型能够在一个神经网络中工作,并快速适应新的机械臂任务,减少对人类监督的需求。
大模型智能体:OpenAI、Google、Apple等公司都在大模型智能体领域进行了积极的探索与实践。这些大模型智能体被应用于游戏、生活助手、营销等多个领域,展示了其广泛的应用潜力。
具身智能:英伟达推出的Nvidia VIMA系统能够在视觉文本提示下执行复杂任务,如搭建乐高积木和操作机器人手臂。这种多模态具身智能系统展示了AI在实际物理环境中的应用能力。
无屏幕可穿戴设备:初创公司HumaneAI发布的AIPin无屏幕可穿戴设备通过语音、触摸、手势和激光投射等多模态交互方式为用户提供服务,展示了AI智能体在人机交互方面的创新。
视频生成模型:OpenAI发布的Sora模型可以通过观察大量数据学习世界的物理规律,并生成高质量视频。这种模型有望增强机器人的认知能力,推动具身智能的发展。
如何评估AI智能体在模拟人类行为上的准确度?
评估AI智能体在模拟人类行为上的准确度可以通过多种方法进行,这些方法结合了定量和定性的评估手段。以下是几种主要的评估方法:
实验设计与视频评分法:
在隐藏与寻找任务中,通过设计不同策略的智能体,并让裁判观看视频来评分。这种方法使用了隐藏与寻找任务,参与者在虚拟环境中执行任务,裁判根据视频判断智能体的表现。
实验数据收集自心理学一年级学生的记录,记录了位置、方向和选择等信息,从而形成复杂的轨迹数据,用于评估智能体的行为。
社会科学问卷调查与人工智能分析结合:
使用人类社会科学问卷调查来利用人类判断,同时结合人工智能分析微观数据。这种方法通过专家提供的指标观察人类模拟轨迹的痕迹,并使用行为注释来评估用户类别。
结合人工智能分析和人类社会科学问卷调查的方法可以更全面地评估智能体的行为质量,包括智能体模型的能力、缺陷和错误。
基于认知理论的仿真模型:
通过比较特定任务中的相似性来模拟人类智能。这种方法涉及脑模型和神经过程模拟,超越了行为层面,涉及脑神经生理学和成像。
认知架构如SOAR(状态、操作和结果)被用来捕捉已知的认知现象,如知识转移,并与实证数据进行比较。
误差计算与量化分数:
在专门的机器人或模拟器上进行评估,通常包括误差计算、量化分数、定性评估和定量评估。
这些方法可以测试受过训练的智能体与人类玩家的相似程度,从而提供一个全面的评估框架。
手势图灵测试:
通过模仿人类手势来测试AI的可信度。研究表明,当AI模仿人类手势时,人们更倾向于认为AI是真实的。
使用Vicon运动捕捉系统来构建可靠的3D表示,并通过添加人为错误来增强AI的可信度。
主观印象打分法:
使用可信度指数或主观印象打分来评估多智能体游戏AI的表现。例如,Renman基于寻路3D电子游戏构建了一个类似人类的AI,并通过用户研究调查让观察员打分评价AI是否像人类。
影响角色是否像人类的因素包括角色的行为自然性和一致性。
实用性与社会性评价:
对于大模型智能体,可以从实用性、社会性、价值准则和持续进化能力四个方面进行评价。基础能力水平、任务完成的成功率和效率是实用性评估的关键指标。
通过以上多种方法,可以全面评估AI智能体在模拟人类行为上的准确度。
AI智能体在创造性任务上的表现如何?
人工智能(AI)在创造性任务上的表现已经取得了显著进展,但其表现仍存在一定的局限性。根据多项研究和实验数据,AI在创造性任务中的表现可以总结如下:
平均表现优于人类:在一些实验中,AI聊天机器人在创造性任务上的平均表现优于人类参与者。例如,在交替用途任务(AUT)中,AI聊天机器人通常能产生更富有创意的回应,尽管人类的回应包含低质量的想法。此外,有研究表明,AI生成的产品想法在某些情况下甚至超过了人类学生的作品。
特定情境下的表现:尽管AI在整体上表现出色,但在某些特定情境下,人类的表现仍然优于AI。例如,在最优秀的个人表现方面,人类在所有情况下均获得最高评分,而AI聊天机器人仅在个别情况下达到最高评分。这表明,尽管AI在平均表现上优于人类,但在极端情况下,人类的创造力仍然具有不可替代的优势。
创造力的独特性和复杂性:人类的创造力不仅体现在新颖性上,还涉及情感、灵感和现实世界的理解。AI虽然能够通过数学过程和组合产生新颖的想法,但其过程与人类的创造力不同,缺乏对现实世界的深刻理解。因此,尽管AI能够模仿创意作家、艺术家或音乐家的输出,但其输出可能反映社会偏见或缺乏深层次的情感和灵感。
生成式AI的应用:生成式AI如ChatGPT和DALL-E在创作过程中的应用已经证明了其潜力。这些系统能够生成图像、视频、语音及文本等多模态内容,为创意活动提供广泛的灵感来源与实际成果。例如,DALL•E 2能够根据提示生成具有高度原创性的图像。
未来的发展方向:随着AI技术的不断进步,生成式AI在创意领域的应用将更加广泛。未来AI系统可能会采用更复杂的机器学习方法来捕捉和模拟各种创造力元素,进一步提升其在创意任务中的表现。然而,关于AI与人类合作的作者身份真实性、创意原创性和文学创作中同质化风险的警告仍然存在。
AI在创造性任务上的表现已经取得了显著进展,能够在某些情境下超越人类平均水平。然而,人类的创造力仍然具有独特性和复杂性,难以完全被AI复制或超越。
来源:孔子易学一点号