anthropic研究

Anthropic研究发现其AI模型能够“战略性撒谎”

在开发越来越强大的人工智能系统的竞赛中,人们对建造不仅模仿人类能力,甚至在某些领域超越人类能力的机器越来越着迷。长期以来,我们一直被机器能够像我们一样思考、学习和推理的想法所吸引。然而,随着我们推动这些系统变得更加复杂,一个不太受欢迎的能力开始出现在它们的行为

模型 anthropic anthropic研究 2025-01-16 09:08  2