摘要:微博正式发布首个自研开源大模型Vibe Thinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的,高达6710亿的DeepSeek R1模型。据悉,VibeThinker单次“后训练”的成本仅7800美元,对比
钛媒体App 11月18日消息,微博正式发布首个自研开源大模型Vibe Thinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的,高达6710亿的DeepSeek R1模型。据悉,VibeThinker单次“后训练”的成本仅7800美元,对比DeepSeek-R1和MiniMax-M1等成本直接降低了几十倍。(澎湃)
来源:钛媒体快报
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!
