摘要:转眼距离博士毕业已经六个月了,过去的一年时光可谓心路坎坷,时常陷于纠结犹豫之中,前一阵还收到邀请分享就业心得。因为行程安排没有能参加,趁着今天放假,就直接记录一段这段时间的心情和事情,记录的内容里,我的选择有对有错,以后或许翻出来看看会有益处。
作者:郑思泽,北京大学博士、字节TopSeed
知乎:郑思泽,已获作者授权
地址:https://zhuanlan.zhihu.com/p/20604468985
转眼距离博士毕业已经六个月了,过去的一年时光可谓心路坎坷,时常陷于纠结犹豫之中,前一阵还收到邀请分享就业心得。因为行程安排没有能参加,趁着今天放假,就直接记录一段这段时间的心情和事情,记录的内容里,我的选择有对有错,以后或许翻出来看看会有益处。
我是 2024 年 7 月毕业的博士,找工作是从 2023 年农历新年之后开始的,我一般只和主动联系上来的公司聊,最开始联系到的,是华为计算产品线的计算研究部昇腾和鲲鹏 lab,随后联系的有上海人工智能实验室,幻方 AI(年底改名为 deepseek)。此外就是当时在字节实习,leader 和我提起可以有转正 offer,所以当时有四个去处,上海人工智能实验室和幻方 AI 都开出了带具体职级和金额的 offer,字节给出了没有金额和职级的口头 offer,不过我当时的想法就是争取去华为,想做国产芯片,所以已经开出来的三个 offer 全都搁置了。
不巧的是 2023 年 9 月开始出国交换,一直没有参与应届生找工作的各种活动,华为的线下交流会也没有参加,华为计算研究部的 offer 一直没有推进,眼看同学的 offer 都已经敲定,我想去的地方还没有给我明确消息,而我也没有主动投递其他任何公司,对于邮箱里大量的猎头信息也都没有回复,于是有点慌了,开始了紧急弥补,给邮箱里各色猎头和 hr 回邮件,一下子给自己排了几十场面试,包括有华为的全球服务部,2012,海思,终端,还有互联网百度,阿里,腾讯,高校也投递了上交和人大。当时每天的日程就是白天去学校,下午四点多坐公交回公寓开始面试,面试完再做饭,西雅图冬季多雨,无数个雨夜,平均一天两场的面试,讲烂的稿子,就是那段生活最多的记忆。
好在高强度的面试很快有收效,华为全球服务部率先开出了天才少年 A,这个 offer 一度是手上最高的,不过短暂犹豫后我还是拒绝了,只想用这个 offer 催动一下计算研究部的 offer,不过拒 offer 时候,猎头的一句话还是在我心里种下了一些嫌隙的种子,他告诉我计算研究部因为在等另一位候选人,没有推进我的 offer,虽然事后我多次验证这个事情,都得到否定的回答,但是还是不那么高兴。
随着华为全球服务部这个 offer 出来,其他家的也立刻跟进,腾讯大咖 offer 很快下来,2012 中研,海思,终端很快推进总裁面。这些信息反馈给计算研究部之后,终于有了推进并给了 offer,也是拿到了天才少年 A。12 月底也直接签了 offer,基本确定就去这里了,1 月回国后,很快地把三方也邮寄给华为,一切看似尘埃落定了。至于其他的 offer,腾讯的直接拒掉;海思的和廖博聊不来,直接退群; 2012 中研给了天才少年 A;百度 hr 说跟不上其他家 offer,直接放弃;阿里不了了之,七八场面试后就没人再找我了;字节开出了高职级低薪水的 offer,也没啥竞争力;上交没有任何反馈;人大给出了讲师 offer。正好也临近回国,打算回国过年后一一拒掉。
但是没有想到的是,在春节期间,字节突然打来电话,我多了两个选择,一个是可以直接去北美入职,另一个是在中国入职涨薪,并且薪水直接超过了我其他所有 offer,一下子成为了最具竞争力的 offer,另一边 deepseek 也不断保温 offer,于是难题来临,华为,字节,deepseek 怎么选呢。
三者之间的纠结困扰我很久,我试图向身边的“过来人”寻求建议,导师,师兄,同学,都给出了各自的想法,一致导向华为,对于字节的看法是,去了美国的话,tiktok 是大隐患,留在中国的话,距离美国 leader 太远,不利于晋升,毕竟跨海交流,总比不上面对面。对于 deepseek,一致表示没听过。既然身边人没什么好的建议,我打算亲身进三家再感受一次,先从 deepseek 开始,然后再去华为实习,字节实习过,所以算是有所了解,可以先不去。
2024 年 4 月,在和 Deepseek 梁老板视频聊了一次后,我拿了实习 offer,彼时的 deepseek 还在互联网金融中心,只占了一个办公室,算法、人事、工程的人全在一个屋子里,办公室里有零食区,休息区,中午就餐是外包的餐线送到公司,晚上是80元额度的外卖,有下午茶,吃的水果比较精致,看起来像是组内的小姐姐亲自切的果切,每个月有生日会,会举办一个小party。工作上,没有什么事情安排给我,我基本上就是自己写毕业论文,看看 paper,研究一下 hopper gemm 怎么写,我之前关于 hopper gemm 的文章就是在这个期间写的。整体氛围安静祥和,我自己是个超级 i 人,基本不社交,周围的同事其实也没怎么聊天,听上去像是北大中文系的,做 rl 数据的 (这也是我觉得现在 deepseek 模型文采比较好的原因),期间还去杭州出个差,结识一下做 infra 的同学。在 deepseek 待的一个月其实回想起来非常自由,不过由于当时身体不好,再加上还要紧接着去体验一下华为,就早早离职了。
接着就是到华为入职,不过华为没有办法短期实习,最好直接入职,同时也有一些外界因素催我,就同意了。2024 年 5 月,正式入职华为,但是第一天就很难受,华为的北研所太远了,北清路又太堵,每天打车堵的很难受。前期也没什么工作,主要是读文档,做各种考试,学线上课程,每天非常无聊。组里的小伙伴有一种强烈的班味,公司要求按时打卡,大家也都乖乖遵守,每天同事吃饭讨论的内容也是上班下班的琐碎日常,听起来没太多趣味。办公系统非常定制化,保密规定也非常繁琐细节。期间也是出差了一次杭州,在杭研所和领导一起聚餐,感觉华为的商务风很浓,等级也比较森严,大家见面,领导都会介绍我是天少,大家职级也都可以查,发言时候总有一种按职级说话的感觉。在华为里同学和熟人非常多,总觉得走到哪都不陌生,身边的同事也非常热心,情商比较高,待人接物很舒服,有一种可以推心置腹的感觉(也可能是错觉),大家对博士也很尊重。总体来说,华为是一个不错的地方,但是我判断这里不是我理想的地方,一方面我不喜欢过于严格和繁复的规章制度,特别是严格打卡上下班和让人三缄其口的保密制度,另一方面,他们的技术过于稳扎稳打,推进速度缓慢,没有那种尖兵的感觉,最后,他们不喜欢发论文(但是看论文积极),我还是想继续发论文。所以一个月后,我决定离开。
离职后,重新在 deepseek 和字节之间选择,我一度非常倾向 deepseek,并和梁老板第二次视频,可惜当时梁老板希望做的事情,我觉得我做不来,芯片设计和制造,投入的资金和人力都是巨大的,我当时不太认为 deepseek 能做。另一方面,由于从华为离职是涉及到劳动合同变动和社保变动,我失去了应届生落户北京的机会,这个问题 deepseek 也解决不了,只有字节有弥补方案。再就是我寄希望于 deepseek 能再拉高薪水,和字节有明显差距,但是梁老板批准的涨幅仅略超出字节。所以最终选择了字节。
入职字节后,其实也有一些落差,首先是字节太拥挤了,deepseek 人少工位大,间距大,工作起来非常舒适,华为虽然人多,但是工区大,工位非常大,工作环境也挺舒服,字节完全是网吧大小的工位挤在一起,非常不舒服。另一个是感觉在这里很难融入,熟人少,即使是熟人,相互之间也是提防,普遍学历也是硕士,对于博士没什么好感,没有华为那种友善感,也没有 deepseek 那种高水平人才相互之间的敬畏感。再就是公司福利看起来多,品味普遍偏差,免费三餐,每餐标准其实也就 25 元,可以想象也吃不到什么好东西,下午茶质量和 deepseek 比也是差很远,不过今年之后福利也没有了。不管这些细节可以忽略的话,其他倒还可以,自由度有的,我想参加学术活动,想发论文,想出差参加会议(这个 deepseek 做不到),想做博后,都是可以谈,可以支持的,并且公司比较大,多方面资源也比较强。另外,字节的技术力是有的,而且我认为非常顶尖。
虽然没有最终到 deepseek,不过还是和当时结识的同事做了朋友。最近 deepseek 大火,我觉得一点也不意外,大家今天看到的,其实是他们半年前的努力的结果,大众的认知普遍具有滞后性和从众性,这也是今天大家才开始追捧 deepseek 的原因。不过,目前作为字节的兵,我一直在思考的问题是,字节明明有超过 deepseek 的人才储备,硬件资源,数据资源,为啥在 AI 上没有爆品,一直不愠不火?该怎么做才能让字节也有领先的机会呢?
我个人看法,大公司的问题是,没有信仰,没有信心,人太杂。首先是信仰,梁老板本人很有信仰,他相信 AGI 一定会达成,而且是有限的时间内可以达成,这个 AGI 一定是稀疏的,这份信仰传播给每一个下属。相比之下,字节领导对 AGI 的信仰不足,没有明确的判断,也不会把信仰传递到下属(人确实太多了,也传播不过来)。第二个是信心,字节大部分情况下都在服务于 okr,业务最重要,如果对于业务没有明确好处的东西,大家会表现出没有信心,不愿意深挖。换言之,在字节很难抗住因为探索一件事情而没有产出的压力。我观察和我一起进字节的同学,做事非常仔细谨慎,一心一意服务业务,不敢越雷池半步。第三个,人太杂,很难统一军心,很多时候别人做的东西自己也不关心,甚至会有人暗地使绊子。deepseek 里则是大家有一种莫名的一致性,大家都是老板的粉丝,都信老板的话,平时谈话也都是自己哪里比友商强,哪里可以改进,整体氛围非常巩固军心,相互之间是促进关系。相比之下,我在字节看到了一些组的合并,合并的过程是先赛马再强行整合,大家相互敌对,浪费人力,浪费时间,浪费信仰,浪费资源,最后两败俱伤,把原本可以有领先机会的东西再次搞落后。我曾经想过,如果把所有的 topseed 聚在一起,在一个领导带领下一起探索 AGI,或许可以复现 deepseek 的环境,不过这个也只能想想而已了。字节无论在算法,infra,还是算力上,布局都比 deepseek 或者华为要全,至于能不能利用这个优势领先,就看字节以后的战略和领导的实际操作吧,我这种小角色也无法左右。
不过上面的想法都是站在 AGI 的角度去看的,我自己本身不做算法,只做 compiler,如果从个人角度来看,在字节的优势就是可以单独做 infra 出一些好的工作,具有一定的独立性,对于我这种想做科研的,比较友好 (相比之下,deepseek 的 infra 一定是紧耦合算法的,独立性弱,毕竟你们看他们 paper,infra 顶多是二作,infra 自己单独的论文也很难发)。
总结过去一年的经验,大概是以下几条吧。
1. 要自己分析和选择,不要总想从别人那里获取结论。我最开始找工作各种犹豫,总想让别人告诉我哪个好,但是大多数时候,其他人根本没有完整可靠信息,做不出合理的建议。比如当时已经能看出来 deepseek 很好了,其实就可以选了,没必要到处去问不知情的人有什么建议。
2. 要多点耐心,少操作。一个偏差可能要大量的后续操作来修正,一切修正都不如最开始就正确。这个是针对华为而言的,如果当时坚持留在华为,应该也最后能适应,其实华为也是很好的公司。
3. 要坚持追求自己喜欢的事情,不要妥协,并且专注。要能抗住 okr,绩效压力,不能因为想活的容易点就到处 walk around。也不要被太多事情分散精力,就做一件事做好就行。这一点我过去一年没有践行,回顾过来这一年就没有值得高兴的成果,未来一定要坚持,哪怕绩效被打低。
4. 在哪里工作不重要,但其实也很重要。不要轻易放弃已有的幸福,去追求不属于自己的别人的幸福,每一家都有很不错的优点。
来源:AI科技小本本