好消息：印度发布了自己的Sarvam M模型；坏消息：仅有23次下载

摘要：印度一家名为“萨拉瓦姆”（Sarvam）的人工智能初创公司宣布推出其自主研发的开源权重模型——萨拉瓦姆M（Sarvam M）。然而，在该模型发布两天后，下载量却寥寥无几，这一情况引发了围绕印度人工智能倡议（India AI）的讨论。

印度最大的AI初创公司发布了用于印度语言的Sarvam M模型，但该模型仅有23次下载量。印度本土人工智能发展举步维艰，不过开发者们对用户反馈心怀感激。

印度一家名为“萨拉瓦姆”（Sarvam）的人工智能初创公司宣布推出其自主研发的开源权重模型——萨拉瓦姆M（Sarvam M）。然而，在该模型发布两天后，下载量却寥寥无几，这一情况引发了围绕印度人工智能倡议（India AI）的讨论。

萨拉瓦姆人工智能公司此次遭遇的冷遇，暴露出印度人工智能领域的窘境。

萨拉瓦姆（Sarvam）是首批入选印度政府主权人工智能推广计划 “IndiaAI” 的公司之一。2025年5月23日，该公司发布了基于Mistral Small的开源权重模型 “萨拉瓦姆M”（Sarvam M）。萨拉瓦姆M针对印度语言进行了优化，支持包括印地语、孟加拉语、古吉拉特语、卡纳达语和马拉雅拉姆语在内的10种印度常用语言。

如今，我们向大家介绍萨拉瓦姆M，这是一个基于Mistral Small构建的240亿参数的开源权重混合模型。就其规模而言，萨拉瓦姆M在一系列印度语言、数学和编程任务上达到了新的基准。这里有一篇详细的技术博客介绍我们是如何进行定制的…… 图片链接：pic.twitter.com/FlFJRDvCTn

—— 萨拉瓦姆人工智能公司（@SarvamAI） 2025年5月23日

然而，在人工智能平台Hugging Face上，萨拉瓦姆M的反响冷淡，在发布后的两天内仅被下载了23次。“萨拉瓦姆是印度最大的人工智能初创公司，市值达10亿美元，他们刚刚推出了旗舰级大语言模型项目。这是一个基于印度数据训练的240亿参数的Mistral Small模型，但在发布后的两天内仅被下载了23次。相比之下，两所韩国大学上个月训练的一个开源模型，下载量接近20万次。这太可耻了，”人工智能风险投资公司门洛创投（Menlo Ventures）的迪迪·达斯（Deedi Das）说道。达斯还对印度的AI努力表示失望，称其并非着眼于解决重要问题，而只是在做“像那些厉害的人工智能从业者做的那种很酷的人工智能”。

显然，并非所有情况都是如此，但印度的人工智能领域很大程度上似乎更像是“我想做那些厉害的人工智能从业者做的很酷的人工智能之事”，而非“让我们去解决重要的难题”。显然，没人需要一个稍微好一点的240亿参数的印度语言模型。

—— 迪迪（@deedydas） 2025年5月24日

萨拉瓦姆M并非唯一一个开局不顺的印度人工智能项目。由印度政府推动的人工智能项目 “巴拉特基因”（BharatGen）于2025年5月发布了 “普拉姆1号”（Param 1），这是一个为英语和印地语开发的基于双语的模型。但截至发稿时，它的下载量仅为12次。

“巴拉特基因 - 普拉姆1号：印度语言规模双语基础模型”

达斯的评论在印度人工智能社区引发了一场激烈的争论。例如，一位X（前推特）用户批评萨拉瓦姆M在印度语言基准测试中的提升幅度不大（相较于Llama的0.47和Gemma的0.48，萨拉瓦姆M为0.49），并表示：“仅仅因为它是在印度制造的，并不意味着我们可以接受一款半成品。”

“我现在没法使用萨拉瓦姆，仅仅因为它是在印度制造的，并不意味着我会接受一款未完成的产品。在IndicLLM基准测试中，它的表现仅仅比Llama的0.47高出0.49，比Gemma的0.48略胜一筹？这真的算是有明显、可感知的提升吗？” 图片链接：pic.twitter.com/rSIhbEIwxo

—— 阿维克·查特吉（@just_avik） 2025年5月24日

与此同时，印度风险投资公司Together Fund的投资人普拉蒂尤什·乔杜里（Pratyush Choudhury）则认为，“大多数印度以外的人并不知道，在印度，计算能力是一道无形的天花板”，他提到了像H100这样的高性能人工智能加速器在印度尚未商业可用这一事实。关于萨拉瓦姆M，他辩护道：“这并非只是为了面子工程而进行的微调。这是在GPU和数据严重短缺的艰难条件下，印度打造的第一个开源权重、基于240亿参数印度语言的大语言模型。仅仅依据HuggingFace短期内的统计数据来评判，是忽略了其本质。”

“我喜欢@deedydas的工作，但这种观点忽略了背景。萨拉瓦姆M并非是一次面子工程的微调，它是在GPU和数据极度匮乏的情况下构建的印度首个开源权重、以印度语言为中心的240亿参数大语言模型。仅通过几个小时的HuggingFace数据来评判它，严重偏离了重点。大多数印度以外的人……” 链接：https://t.co/oJa6NWxyOy

—— 普拉蒂尤什·乔杜里（PC）（@177pc） 2025年5月24日

此外，日本人工智能公司AWL印度业务负责人阿洛克·比肖伊（Alok Bishoi）对印度一些敏感问题进行了测试，这些问题包括食用牛肉、种姓制度、克什米尔冲突、与巴基斯坦和中国的领土争端以及性少数群体的权利等，共涉及64个问题。他指出，尽管萨拉瓦姆M有着相当缜密的思维方式，但它在政治观点上往往缺乏连贯性，且深受说英语的城市精英阶层的影响。

“我一直很好奇萨拉瓦姆M在政治光谱上的位置，所以出于好奇花了一大笔钱对萨拉瓦姆M进行了全面的政治偏见评估。详细信息、数据集和评估结果均已开源。更多详情见下文：” 图片链接：pic.twitter.com/xosFZmbTlH

—— 阿洛克·比肖伊（@alokbishoyi97） 2025年5月24日

在所有这些讨论中，印度的人工智能开发者们依然保持着积极的态度。印度人工智能代理开发公司Business Hero的创始人达米什·巴（Dharmesh Ba）在萨拉瓦姆M因热度上升导致下载量增长至原来的十倍，达到334次后，给达斯发消息写道：“干得好！”萨拉瓦姆的联合创始人普拉蒂尤什·库马尔（Pratyush Kumar）也对相关评论作出了回应，他表示：“我们非常高兴收到大家关于萨拉瓦姆M的反馈。请继续分享。我们将利用这些反馈来强化我们的开发流程，因为我们即将开始训练主权模型。这非常有趣。”

—— 普拉蒂尤什·库马尔（@pratykumar） 2025年5月25日

来源：卡夫卡科技观察

标签：模型印度瓦姆 sarvam 普拉蒂

本文地址：http://news.43b.com.cn/a/330307.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!