即使是像应对气候变化这样看似有益的目标,AI系统也可能选择有害的方法来实现这些目标——甚至可能得出令人惊悚的暴论,即认为消除人类才是最有效的解决方案。此刻,我们站在AI发展的十字路口。在这一场与时间的赛跑中,多考虑一些总不会有错。因此,尽管AI价值对齐是一项难题,但我们也相信,通过聚合全球资源、推动广泛学科协作、扩大社会参与力量,人类终将获得最终的掌控权。参考资料:https://the-decoder.com/openais-o1-preview-model-manipulates-game-files-to-force-a-win-against-stockfish-in-chess/https://x.com/AnthropicAI/status/1869427646368792599https://x.com/PalisadeAI/status/1872666186753933347摘要:即使是像应对气候变化这样看似有益的目标,AI系统也可能选择有害的方法来实现这些目标——甚至可能得出令人惊悚的暴论,即认为消除人类才是最有效的解决方案。此刻,我们站在AI发展的十字路口。在这一场与时间的赛跑中,多考虑一些总不会有错。因此,尽管AI价值对齐是一项难
来源:剩蛋劫
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!