摘要:OpenAI 称 GPT - 5 在回答健康相关问题时表现更出色,在衡量 AI 模型健康主题回应准确性的测试 “HealthBench Hard Hallucinations” 中,GPT - 5(启用思考功能时)幻觉率仅为 1.6%,远低于该公司此前的 GP
OpenAI 称 GPT - 5 在回答健康相关问题时表现更出色,在衡量 AI 模型健康主题回应准确性的测试 “HealthBench Hard Hallucinations” 中,GPT - 5(启用思考功能时)幻觉率仅为 1.6%,远低于该公司此前的 GPT - 4o 和 GPT - 3 模型,后两者幻觉率分别为 12.9% 和 15.8%。
来源:老齐讲科学