从印度二本到Meta副总裁，被世界拒绝15次的他，撑起AI时代地基

摘要：PyTorch这玩意儿如果不是靠死磕，基本很难有今天。就像开局被拒12次还能扛下来，这事你放谁身上都挺玄乎，但Soumith Chintala就这么一步步闯出来了。说实话，现在AI公司里哪家还不用PyTorch？我们天天用，有时候都懒得想是谁发明的，没它还真不

PyTorch这玩意儿如果不是靠死磕，基本很难有今天。就像开局被拒12次还能扛下来，这事你放谁身上都挺玄乎，但Soumith Chintala就这么一步步闯出来了。说实话，现在AI公司里哪家还不用PyTorch？我们天天用，有时候都懒得想是谁发明的，没它还真不习惯。

背景其实挺一般。Soumith家在印度，不算什么名门，学校也没多特殊。别看张口就提AI工程师，最早想留学靠着GRE还不错，结果美国那边敲了12个学校，统统不收。他那段时间真是各种不顺，签证只能刷到短期的J-1，钱也不够，刚到美国也没什么方向，像一条鱼扔到新池子里，找工作基本算难，无数道门都关着。

他转去申请南加州大学和纽约大学，倒是NYU给他留了个坑，算是勉强留下来。那阵子签证马上到期，快回不了印度。身边人不是劝放弃，就是觉得肯定干不下去。Soumith偏要硬抗，他最后进了亚马逊，不过在那也是最普通的测试工程师。别期待什么主角光环，实际就是死磕，谁看都像“最轴的同事”。

后面他还想去DeepMind试水，结果三次面试全被刷掉，签证又卡了一阵子，搞得日子一点没顺。你要是见到这种情况，基本没人愿意继续折腾，他却一点点熬到Facebook AI Research。据说他刚进去，职位L4级，离那帮大牛还差一大截，最早的团队也就一两个人，公司内部推那个Torch7框架，没什么人用，连公司高层都想关项目。他们自己有时候喝闷酒瞎聊，也觉得快撑不下去了。

直到2016年，这伙人突然把Torch7的底层推倒重来，从接口到结构，全为AI研究者量身打造，这才有了今天的PyTorch。一开始基本没多少人关注，大家都用惯了TensorFlow，论文也好，模型也罢，不喜欢切换新框架。换句话说，PyTorch当时这局就跟打冷板凳一样。

但事情后来拐了个大弯。2017年开始PyTorch开源，直接冲上热搜，学界、工业界都一拥而上试玩。2018年，Facebook给PyTorch来了一波升级，推了1.0版本，做起生产环境支持。原来社区只有几个人，用着用着直接变成几十万人，论文引用也开始狂飙，建模、代码、范例都铺开了。那些顶会NeurIPS、ICML、CVPR，十有八九都切换，用TensorFlow反到成了小众选择。

到了2021年，PyTorch热度也超过了TensorFlow，大家都说开发体验友好，调试方便，效率嘎嘎高，这谁用谁知道。像咱们装系统发现哪个用得顺手，肯定愿意一直用。社区氛围也很有意思，Hugging Face那种模型托管平台，PyTorch直接霸榜，各种初创公司做AI原型，做研究，一水儿全在用。

Soumith这几年混到Meta副总裁，工程师、社区大拿该有的他都有，但没什么硅谷头牌的架子。其实他不太爱刷屏，也不爱写励志贴，维护代码偶尔审PR就够了。别人看他一路“逆袭”，他自己反而淡定，老挂在嘴边一句：“就是被拒过12次还在坚持的人。”感觉这话比什么励志段子还让程序员有共鸣。

更好玩的是，现在全球最火的生成式AI，无论是OpenAI的GPT、Claude、扩散模型，底层都要靠PyTorch托底，行业默认离不开它。以前这玩意儿被冷落，现在成了标配。Soumith一个个敲出来的代码，流到几百万开发者电脑里。他自己倒不爱聊什么成功，只希望后面的“小人物”也别被卡死在起点。有些人吧，看着低调，可结果把底层规则全给重写了。