美国StabilityAI创始人强势发声:DeepSeek没有抄袭,真相如何?

B站影视 2025-02-01 10:46 3

摘要:在当下人工智能行业迅猛发展的浪潮里,模型之间的竞争激烈程度不断攀升,各类争议也随之频繁涌现。近期,中国大模型DeepSeek被卷入一场抄袭风波之中,OpenAI和Anthropic虽未直接点名,但明指DeepSeek在模型发展过程中依赖蒸馏技术,暗指其存在不正

在当下人工智能行业迅猛发展的浪潮里,模型之间的竞争激烈程度不断攀升,各类争议也随之频繁涌现。近期,中国大模型DeepSeek被卷入一场抄袭风波之中,OpenAI和Anthropic虽未直接点名,但明指DeepSeek在模型发展过程中依赖蒸馏技术,暗指其存在不正当竞争和抄袭行为。

然而,就在DeepSeek深陷舆论漩涡之时,美国StabilityAI创始人Emad Mostaque站了出来,为DeepSeek仗义执言,这一行为瞬间引发了行业内外的广泛关注。

Emad Mostaque何许人也?在新冠疫情期间,他曾领导利用大数据辅助政府决策。2020年,他创立了StabilityAI,致力于推动开源AI技术的发展,旗下的Stable Diffusion更是在生成式AI领域掀起了一场革命。他始终倡导开源模式,认为这能促进AI技术的创新和普及,让更多人受益于AI技术的发展。

面对DeepSeek遭受的质疑,Emad Mostaque迅速做出了强势回应。他强调,那些指责DeepSeek全靠OpenAI蒸馏的言论,简直是对强化学习的侮辱。他指出,DeepSeek论文里的R1-Zero模型堪称关键证据。该模型的训练模式如同围棋AI的进化历程,AlphaGo Zero通过自我对弈超越人类,MuZero无需规则自学成才,而R1-Zero则通过生成专属合成数据闭环训练,数据越练越强,根本不需要借鉴其他模型。Emad在视频中激情回应:“R1模型就像AlphaGo一样自己和自己下棋,根本不需要偷师!”

对于“模型输出含OpenAI痕迹”的指控,Emad给出了一个形象的比喻:“这就好比说人类吃了转基因玉米就会变成玉米!现在全网都是AI生成内容,模型训练时吃到点OpenAI数据残渣再正常不过。”他还进一步指出,现在许多模型在训练时,由于数据来源广泛,难免会混入其他模型的数据,比如Llama和Gemini,有时候它们也会在输出中体现出OpenAI的影子,因为训练数据里早就混进了GPT的基因。

Emad Mostaque还提供了更为有力的反驳证据——思维链。他指出,OpenAI最新o1模型根本不会展示推理过程,而DeepSeek的R1和Gemini Flash思维版都在努力优化思维链,不断提升模型的推理和解决问题的能力。Emad的这一观点,直接击中了质疑者的要害,从技术核心层面为DeepSeek的创新性提供了支撑。

此次事件不仅仅是对DeepSeek的一次考验,更是开源生态与闭源巨头之间的话语权争夺。Emad Mostaque所代表的开源阵营,强调开放、共享和创新,认为通过全球科研人员的共同努力,可以推动AI技术的快速发展。而OpenAI和Anthropic等闭源巨头,虽然在技术研发上投入巨大,但由于其闭源的特性,限制了技术的传播和共享。

这场争论或许也是AI进化路径的终极路线对决,未来AI行业究竟是走向更加开放的开源模式,还是继续由闭源巨头主导,值得人们持续关注。随着AI技术的不断发展,类似的争议或许还会不断出现。只有通过不断的创新和探索,才能让AI技术更好地服务于人类社会,为解决各种复杂问题提供更加智能的解决方案。

来源:悠闲的治水大禹

相关推荐