李思雯:人工智能价值对齐的路径探析
价值对齐作为人工智能技术良善发展的有效手段和必经之路,旨在让大模型的能力、行为与人类的真实意图、价值观以及社会道德准则相一致。现有人工智能价值对齐的技术路径和伦理进路虽具备可行性,但存在局限与不足。价值对齐的技术路径缺乏有效性与可拓展性,受限于人类主观偏好,而
价值对齐作为人工智能技术良善发展的有效手段和必经之路,旨在让大模型的能力、行为与人类的真实意图、价值观以及社会道德准则相一致。现有人工智能价值对齐的技术路径和伦理进路虽具备可行性,但存在局限与不足。价值对齐的技术路径缺乏有效性与可拓展性,受限于人类主观偏好,而