DeepSeek赢麻了,首个推理模型就超越OpenAI o1
今年早些时候,国内科技公司DeepSeek(深度求索)因V2模型一举成名,成名的原因简单粗暴,主打高性价比。在当时,DeepSeek V2的API定价约等于谷歌的七分之一,GPT-4 Turbo的七十分之一。
今年早些时候,国内科技公司DeepSeek(深度求索)因V2模型一举成名,成名的原因简单粗暴,主打高性价比。在当时,DeepSeek V2的API定价约等于谷歌的七分之一,GPT-4 Turbo的七十分之一。
近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。