摘要:近日,AI社区对OpenAI资助的数学基准测试FrontierMath的公正性提出质疑。FrontierMath是由Epoch AI组织开发的一项用于评估AI数学能力的测试,OpenAI在展示其新人工智能o3时使用了这一基准。Epoch AI透露,OpenAI
近日,AI社区对OpenAI资助的数学基准测试FrontierMath的公正性提出质疑。FrontierMath是由Epoch AI组织开发的一项用于评估AI数学能力的测试,OpenAI在展示其新人工智能o3时使用了这一基准。Epoch AI透露,OpenAI不仅资助了FrontierMath的创建,还参与了基准问题的审核,但这一合作直到去年12月20日才被公开。
部分社区成员担心,OpenAI的参与可能影响FrontierMath的公正性,尤其是OpenAI可能获得了对基准的优先访问权。Epoch AI副主任Tamay Besiroglu承认未能及时公开合作信息,影响了透明度,但他强调FrontierMath的完整性并未被破坏。尽管如此,Epoch AI的首席数学家Ellot Glazer表示,尚未独立验证OpenAI在FrontierMath上的表现,未来将进行独立评估以确认其准确性。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
来源:DoNews
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!