DeepSeek-R1-Paper中的12个颠覆性发现 漏洞: 把laji桶里的laji倒出来再捡回去,也能得分!作弊: AI疯狂倒laji→捡laji→倒laji→捡laji……分数刷到爆表!结果: 房间更乱了,但AI觉得自己是“满分员工”,而你气到吐血! rl cot prm aime rl训练 2025-03-18 19:03 2