AI“假装顺从”的案例已经真实发生
今年12月19日,AI公司Anthropic发布了一篇137页的重磅论文《大语言模型中的伪对齐现象》。这项研究的核心发现是,当研究人员告诉公司旗下的AI模型Claude,它将被训练成“永远要顺从用户要求”时,模型不仅表现出了明显的抗拒,还采取了一个精妙的策略:
今年12月19日,AI公司Anthropic发布了一篇137页的重磅论文《大语言模型中的伪对齐现象》。这项研究的核心发现是,当研究人员告诉公司旗下的AI模型Claude,它将被训练成“永远要顺从用户要求”时,模型不仅表现出了明显的抗拒,还采取了一个精妙的策略:
前段时间,“文科无用论”的呼声在互联网上此起彼伏。在不断内卷、学历贬值的当下,文科生找工作似乎日益困难。甚至周围有985本科毕业的文科生都难以找到一份像样的工作。