openaio1

DeepSeek赢麻了，首个推理模型就超越OpenAI o1

今年早些时候，国内科技公司DeepSeek（深度求索）因V2模型一举成名，成名的原因简单粗暴，主打高性价比。在当时，DeepSeek V2的API定价约等于谷歌的七分之一，GPT-4 Turbo的七十分之一。

近日，淘宝天猫集团的研究者们提出了中文简短问答（Chinese SimpleQA），这是首个全面的中文基准，具有“中文、多样性、高质量、静态、易于评估”五个特性，用于评估语言模型回答简短问题的真实性能力。