摘要:PyTorch这玩意儿如果不是靠死磕,基本很难有今天。就像开局被拒12次还能扛下来,这事你放谁身上都挺玄乎,但Soumith Chintala就这么一步步闯出来了。说实话,现在AI公司里哪家还不用PyTorch?我们天天用,有时候都懒得想是谁发明的,没它还真不
PyTorch这玩意儿如果不是靠死磕,基本很难有今天。就像开局被拒12次还能扛下来,这事你放谁身上都挺玄乎,但Soumith Chintala就这么一步步闯出来了。说实话,现在AI公司里哪家还不用PyTorch?我们天天用,有时候都懒得想是谁发明的,没它还真不习惯。
背景其实挺一般。Soumith家在印度,不算什么名门,学校也没多特殊。别看张口就提AI工程师,最早想留学靠着GRE还不错,结果美国那边敲了12个学校,统统不收。他那段时间真是各种不顺,签证只能刷到短期的J-1,钱也不够,刚到美国也没什么方向,像一条鱼扔到新池子里,找工作基本算难,无数道门都关着。
他转去申请南加州大学和纽约大学,倒是NYU给他留了个坑,算是勉强留下来。那阵子签证马上到期,快回不了印度。身边人不是劝放弃,就是觉得肯定干不下去。Soumith偏要硬抗,他最后进了亚马逊,不过在那也是最普通的测试工程师。别期待什么主角光环,实际就是死磕,谁看都像“最轴的同事”。
后面他还想去DeepMind试水,结果三次面试全被刷掉,签证又卡了一阵子,搞得日子一点没顺。你要是见到这种情况,基本没人愿意继续折腾,他却一点点熬到Facebook AI Research。据说他刚进去,职位L4级,离那帮大牛还差一大截,最早的团队也就一两个人,公司内部推那个Torch7框架,没什么人用,连公司高层都想关项目。他们自己有时候喝闷酒瞎聊,也觉得快撑不下去了。
直到2016年,这伙人突然把Torch7的底层推倒重来,从接口到结构,全为AI研究者量身打造,这才有了今天的PyTorch。一开始基本没多少人关注,大家都用惯了TensorFlow,论文也好,模型也罢,不喜欢切换新框架。换句话说,PyTorch当时这局就跟打冷板凳一样。
但事情后来拐了个大弯。2017年开始PyTorch开源,直接冲上热搜,学界、工业界都一拥而上试玩。2018年,Facebook给PyTorch来了一波升级,推了1.0版本,做起生产环境支持。原来社区只有几个人,用着用着直接变成几十万人,论文引用也开始狂飙,建模、代码、范例都铺开了。那些顶会NeurIPS、ICML、CVPR,十有八九都切换,用TensorFlow反到成了小众选择。
到了2021年,PyTorch热度也超过了TensorFlow,大家都说开发体验友好,调试方便,效率嘎嘎高,这谁用谁知道。像咱们装系统发现哪个用得顺手,肯定愿意一直用。社区氛围也很有意思,Hugging Face那种模型托管平台,PyTorch直接霸榜,各种初创公司做AI原型,做研究,一水儿全在用。
Soumith这几年混到Meta副总裁,工程师、社区大拿该有的他都有,但没什么硅谷头牌的架子。其实他不太爱刷屏,也不爱写励志贴,维护代码偶尔审PR就够了。别人看他一路“逆袭”,他自己反而淡定,老挂在嘴边一句:“就是被拒过12次还在坚持的人。”感觉这话比什么励志段子还让程序员有共鸣。
更好玩的是,现在全球最火的生成式AI,无论是OpenAI的GPT、Claude、扩散模型,底层都要靠PyTorch托底,行业默认离不开它。以前这玩意儿被冷落,现在成了标配。Soumith一个个敲出来的代码,流到几百万开发者电脑里。他自己倒不爱聊什么成功,只希望后面的“小人物”也别被卡死在起点。有些人吧,看着低调,可结果把底层规则全给重写了。
来源:奋发有为熊猫9PwtSx