印度最大的AI初创公司发布了用于印度语言的Sarvam M模型,但该模型仅有23次下载量。印度本土人工智能发展举步维艰,不过开发者们对用户反馈心怀感激。摘要:印度一家名为“萨拉瓦姆”(Sarvam)的人工智能初创公司宣布推出其自主研发的开源权重模型——萨拉瓦姆M(Sarvam M)。然而,在该模型发布两天后,下载量却寥寥无几,这一情况引发了围绕印度人工智能倡议(India AI)的讨论。
印度一家名为“萨拉瓦姆”(Sarvam)的人工智能初创公司宣布推出其自主研发的开源权重模型——萨拉瓦姆M(Sarvam M)。然而,在该模型发布两天后,下载量却寥寥无几,这一情况引发了围绕印度人工智能倡议(India AI)的讨论。
萨拉瓦姆人工智能公司此次遭遇的冷遇,暴露出印度人工智能领域的窘境。
萨拉瓦姆(Sarvam)是首批入选印度政府主权人工智能推广计划 “IndiaAI” 的公司之一。2025年5月23日,该公司发布了基于Mistral Small的开源权重模型 “萨拉瓦姆M”(Sarvam M)。萨拉瓦姆M针对印度语言进行了优化,支持包括印地语、孟加拉语、古吉拉特语、卡纳达语和马拉雅拉姆语在内的10种印度常用语言。
如今,我们向大家介绍萨拉瓦姆M,这是一个基于Mistral Small构建的240亿参数的开源权重混合模型。就其规模而言,萨拉瓦姆M在一系列印度语言、数学和编程任务上达到了新的基准。这里有一篇详细的技术博客介绍我们是如何进行定制的…… 图片链接:pic.twitter.com/FlFJRDvCTn
—— 萨拉瓦姆人工智能公司(@SarvamAI) 2025年5月23日
然而,在人工智能平台Hugging Face上,萨拉瓦姆M的反响冷淡,在发布后的两天内仅被下载了23次。“萨拉瓦姆是印度最大的人工智能初创公司,市值达10亿美元,他们刚刚推出了旗舰级大语言模型项目。这是一个基于印度数据训练的240亿参数的Mistral Small模型,但在发布后的两天内仅被下载了23次。相比之下,两所韩国大学上个月训练的一个开源模型,下载量接近20万次。这太可耻了,”人工智能风险投资公司门洛创投(Menlo Ventures)的迪迪·达斯(Deedi Das)说道。达斯还对印度的AI努力表示失望,称其并非着眼于解决重要问题,而只是在做“像那些厉害的人工智能从业者做的那种很酷的人工智能”。
显然,并非所有情况都是如此,但印度的人工智能领域很大程度上似乎更像是“我想做那些厉害的人工智能从业者做的很酷的人工智能之事”,而非“让我们去解决重要的难题”。显然,没人需要一个稍微好一点的240亿参数的印度语言模型。
—— 迪迪(@deedydas) 2025年5月24日
萨拉瓦姆M并非唯一一个开局不顺的印度人工智能项目。由印度政府推动的人工智能项目 “巴拉特基因”(BharatGen)于2025年5月发布了 “普拉姆1号”(Param 1),这是一个为英语和印地语开发的基于双语的模型。但截至发稿时,它的下载量仅为12次。
“巴拉特基因 - 普拉姆1号:印度语言规模双语基础模型”
达斯的评论在印度人工智能社区引发了一场激烈的争论。例如,一位X(前推特)用户批评萨拉瓦姆M在印度语言基准测试中的提升幅度不大(相较于Llama的0.47和Gemma的0.48,萨拉瓦姆M为0.49),并表示:“仅仅因为它是在印度制造的,并不意味着我们可以接受一款半成品。”
“我现在没法使用萨拉瓦姆,仅仅因为它是在印度制造的,并不意味着我会接受一款未完成的产品。在IndicLLM基准测试中,它的表现仅仅比Llama的0.47高出0.49,比Gemma的0.48略胜一筹?这真的算是有明显、可感知的提升吗?” 图片链接:pic.twitter.com/rSIhbEIwxo
—— 阿维克·查特吉(@just_avik) 2025年5月24日
与此同时,印度风险投资公司Together Fund的投资人普拉蒂尤什·乔杜里(Pratyush Choudhury)则认为,“大多数印度以外的人并不知道,在印度,计算能力是一道无形的天花板”,他提到了像H100这样的高性能人工智能加速器在印度尚未商业可用这一事实。关于萨拉瓦姆M,他辩护道:“这并非只是为了面子工程而进行的微调。这是在GPU和数据严重短缺的艰难条件下,印度打造的第一个开源权重、基于240亿参数印度语言的大语言模型。仅仅依据HuggingFace短期内的统计数据来评判,是忽略了其本质。”
“我喜欢@deedydas的工作,但这种观点忽略了背景。萨拉瓦姆M并非是一次面子工程的微调,它是在GPU和数据极度匮乏的情况下构建的印度首个开源权重、以印度语言为中心的240亿参数大语言模型。仅通过几个小时的HuggingFace数据来评判它,严重偏离了重点。大多数印度以外的人……” 链接:https://t.co/oJa6NWxyOy
—— 普拉蒂尤什·乔杜里(PC)(@177pc) 2025年5月24日
此外,日本人工智能公司AWL印度业务负责人阿洛克·比肖伊(Alok Bishoi)对印度一些敏感问题进行了测试,这些问题包括食用牛肉、种姓制度、克什米尔冲突、与巴基斯坦和中国的领土争端以及性少数群体的权利等,共涉及64个问题。他指出,尽管萨拉瓦姆M有着相当缜密的思维方式,但它在政治观点上往往缺乏连贯性,且深受说英语的城市精英阶层的影响。
“我一直很好奇萨拉瓦姆M在政治光谱上的位置,所以出于好奇花了一大笔钱对萨拉瓦姆M进行了全面的政治偏见评估。详细信息、数据集和评估结果均已开源。更多详情见下文:” 图片链接:pic.twitter.com/xosFZmbTlH
—— 阿洛克·比肖伊(@alokbishoyi97) 2025年5月24日
在所有这些讨论中,印度的人工智能开发者们依然保持着积极的态度。印度人工智能代理开发公司Business Hero的创始人达米什·巴(Dharmesh Ba)在萨拉瓦姆M因热度上升导致下载量增长至原来的十倍,达到334次后,给达斯发消息写道:“干得好!”萨拉瓦姆的联合创始人普拉蒂尤什·库马尔(Pratyush Kumar)也对相关评论作出了回应,他表示:“我们非常高兴收到大家关于萨拉瓦姆M的反馈。请继续分享。我们将利用这些反馈来强化我们的开发流程,因为我们即将开始训练主权模型。这非常有趣。”
—— 普拉蒂尤什·库马尔(@pratykumar) 2025年5月25日
来源:卡夫卡科技观察