摘要:在高考后填报志愿时,李宇飏对技术领域充满兴趣,原本想选择计算机专业,但因一位关系较好的学长推荐,便选了自动化专业,进入清华大学自动化系,并幸运地成为清华大学首届通班的一员。他回忆道:“当时对专业了解很肤浅,只是觉得搞技术可能会选计算机,但后来发现自动化系的培养
李宇飏
从多模态感知到交互推理,
他在具身智能的征途上不断开拓创新;
从人来人往的街头到冲破云霄的飞机,
他用镜头捕捉光影瞬间;
定格工程奇迹,
心怀智能梦想;
让我们走进他的故事——
北京大学人工智能研究院博士生李宇飏。
01 逆风而上:加入通班是无悔的选择
李宇飏与通班的缘分始于他对科研的热爱和探索欲望。
在高考后填报志愿时,李宇飏对技术领域充满兴趣,原本想选择计算机专业,但因一位关系较好的学长推荐,便选了自动化专业,进入清华大学自动化系,并幸运地成为清华大学首届通班的一员。他回忆道:“当时对专业了解很肤浅,只是觉得搞技术可能会选计算机,但后来发现自动化系的培养模式和课程设置也十分吸引我。”
通班的培养体系为本科生提供了接触前沿科研的机会,这种模式为李宇飏打开了科研的大门,让他能够更早地参与到科研项目中。他感慨道:“通班的培养方案让我在本科期间就能深入接触科研工作,这种提前的科研体验是我成长的关键,这真的很棒。”在这样的培养体系支持下,李宇飏开展了他的第一项科研工作——多物体抓取研究,并历时两年进行深入地探索。这段经历为他积累了宝贵的科研经验。
通班的导师们也给了李宇飏极大的支持和自由度,让他能够在科研的道路上自由探索。“老师们特别开明,他们鼓励我们大胆尝试,不怕失败,这种宽松的学术氛围让我能够充分发挥自己的创造力。”这样的培养资源和支持对李宇飏的影响是深远的。他不仅在这里找到了自己的科研方向,还培养了独立思考和解决问题的能力。他表示:“通班的经历让我更加坚定了在科研道路上走下去的决心,它是我科研生涯的重要起点。”
“加入通班后,我有幸在一名非常 nice 的学长的指导下在人-物交互领域开展一番探索。尽管我还处在很多系统知识的初学阶段、很多工程工作的锻炼阶段,尽管自己的研究兴趣也还没定死在视觉这一领域,但在几个月的锻炼中,我学到的不仅仅是专业知识和一些做研究、读论文上的技巧,更有在研究过程中的心态、态度、品质——这是不论以后做什么领域的工作都大有裨益的。”
在通班,李宇飏还与导师朱毅鑫结缘,本科毕业后,他便来到北大跟随朱毅鑫老师攻读博士学位,主攻机器人和三维视觉领域,聚焦于具身智能体如何高效获取环境知识,尤其是多模态感知,如触觉和视觉等,继续他的探索之路。
“也许到不了‘无人之境’,但我要出发了。”
02 御风而行:对多模态感知探索的坚持
李宇飏的科研之路围绕“多模态感知”和“具身灵巧操作”领域展开,他致力于解决机器人如何高效获取环境知识以及如何在与物理世界的交互中学习和推理这两大问题。在多模态感知方面,他不仅关注传统的视觉传感器,更将目光投向触觉领域,期望机器人能通过触觉感知手与物体的接触关系、运动趋势等关键信息。他解释道:“我们期望机器人能像人一样,通过触觉传感器拿到的原始数字信号里,精准地把有意义的语义信息给‘拎’出来。”
本科期间李宇飏就参与了多物体抓取研究,目标是让多指灵巧手能够抓住多个物体。经过两年的努力,这一成果成功发表,为他积累了宝贵的科研经验。他回忆道:“当时的想法很简单,就是想把多指灵巧手的功能最大化,让它能像人手一样灵活地抓取多个物体。”他回忆起当时的情景:“我们团队在实验过程中遇到了很多挑战,但正是这些挫折让我学会了如何设计实验、分析数据,并从中提炼出有价值的研究成果。”
之后,李宇飏又一头扎进了触觉感知研究中。他和团队开发了触觉驱动的物体交互算法,让机器人利用触觉感知完成铰链物体交互任务。他说:“敲代码和实际物理空间测试是分不开的,那时候,我每天泡在实验室调试仿真器和算法,看着机器人从频频卡壳到能顺利操作各类物体。” 最终这项研究展示了触觉感知在机器人复杂操作任务中的巨大潜力。
李宇飏参与研发了一款五指机械手,其正面70%以上面积被高分辨率的触觉传感器覆盖。他介绍道:“这款机械手的触觉传感器分辨率比人的触觉感觉还要高。在抓握任务中,它能精准感知物体在手中的位置,还能根据触觉信息实时调整抓取动作。” 这一成果为机器人未来在复杂任务中的应用开辟了新的可能性。此外,他还参与开发了针对触觉传感器的仿真器。在前期一系列的科研中,他深知真机实验成本高昂,因此开发仿真器显得尤为重要。李宇飏感慨:“仿真器就像是机器人学习的一个‘虚拟乐园’,它能模拟出各种场景,让机器人在不耗费大量硬件资源的情况下,积累丰富的交互经验。”这一创新有望为机器人触觉传感器的研究与优化提供新的手段。
李宇飏的科研工作就像一场持续的探索之旅。目前,他已经 在IEEE Transactions on Robotics, IEEE Robotics and Automation Letters, CVPR, ICRA 等顶级期刊或会议上发表了多篇学术论文,未来他希望继续深耕多模态感知领域,推动智能机器人具备人类级别的感知和交互能力。
03 追风少年:是“网管”也是摄影“发烧友”
李宇飏在初中时就对电脑硬件产生了浓厚兴趣,并开始接触组装电脑。后来,他将这一兴趣延伸到了网络设备管理领域,先后在清华通班和北大人工智能研究院管理机房和服务器集群,负责设备维护和网络管理等工作,为 AI 院与通班师生开展科研工作的算力需求提供保障。他打趣地称自己为“网管”,并表示这项工作让他积累了宝贵的经验,也让他在科研工作中能够更好地应对各种技术问题。李宇飏提到,管理机房的过程中会遇到各种意想不到的问题,需要耐心和细心去解决,这些经历也锻炼了他的耐心和应变能力。“我小学五六年级的时候就喜欢和朋友一起逛电脑市场,现在做‘网管’,也算是爱好融入工作了”,李宇飏笑道。
科研之外,摄影也是他的拿手绝活。“我初中时就对摄影很感兴趣,那时候家里也特别支持,给我买了第一台相机。我当时还负责班里的活动拍摄,虽然刚开始拍得不好,但越拍越有感觉。”在大学期间,李宇飏的摄影爱好与他的科研工作相辅相成。他提到,科研工作压力大时,摄影是他放松身心的好方式。他喜欢在周末或假期,带上相机去城市的大街小巷扫街或去郊外拍风景。他说:“每次按下快门,看到取景器里定格的画面,我的心情就会放松下来。”李宇飏还表示,摄影让他对视觉信息的捕捉和处理有了更深入的理解,这对他在科研工作中探索新的感知方式提供灵感。
飞机是李宇飏钟爱的摄影对象。为了“集邮”拍到特殊型号的飞机,李宇飏会提前几天甚至几周查看飞机的航班信息,分析机场周边地形,寻找最佳拍摄地点。
photo by Yuyang Li
“Lab 团建的时候,mentor 问我为什么对飞机如此喜爱。于我而言,一个百余吨的铁疙瘩,能在两台发动机的推动下飞上蓝天,爬上万米高空,将广阔世界的遥远距离缩短至数小时可达,是无比伟大的工程奇迹。从头顶划过的,不只有几百双脚底板和几十吨航空燃油,还有材料科学、工程科学、计算机科学数十年的智慧结晶。类似的,还有一列列高速运行的列车,一艘艘远洋轮船——他们承载着人们回家的思念、远征的壮志、探索世界的好奇。我想,这就是我的答案。”
李宇飏认为,摄影和科研有相似之处。他说:“无论是科研还是摄影,都需要耐心和坚持。有时候为了拍到一张满意的照片,我会在同一个地方等待几个小时,这和在实验室里反复实验直至获得理想结果的过程很像。”
无论是做网管、街头摄影还是拍飞机,都是李宇飏生活中的重要组成部分。他说道:“这些爱好让我在生活中找到了平衡,让我在忙碌的科研工作中也能保持对生活的热爱和对美的追求。”
04 微风正好:成长为乐观自洽的科研人
“生活未必要轰轰烈烈,能在平凡的日子里吃苦、忍耐,顶着生活的压力前行,从酸、苦、辣中尝出甜味、尝出思索、尝出收获、尝出智慧,还能过得快乐,那我希望这样的日子再来一年。”
李宇飏对自己的评价体现在多个方面。他提到自己性格比较内向,享受独处。李宇飏将自己类比为情绪稳定的卡皮巴拉,“就像卡皮巴拉一样,出了天大的事,我也能表现得像是没什么事一样。内心可能会有些波动,但表面上总能保持镇定。”在生活里,李宇飏还是个 “梗王”。喜欢讲冷笑话,逗大家开心。他笑着说:“讲个笑话,能给身边人带来欢乐,也能缓解自己的压力。”李宇飏还用“自洽”这个词来描述自己。他认为自己的生活和工作节奏比较自洽,能够平衡好科研、兴趣爱好和个人生活。他提到自己的生活和科研工作时说:“我觉得这个节奏还蛮好的,而且包括我周围的一些导师……大家都不是很 push,而是鼓励我产出真的有意义的见解和新的发现。”这种自洽的生活方式让他能够在忙碌的科研工作中找到自己的节奏,同时保持对生活的热爱和对科研的热情。
在学术与兴趣间寻找完美平衡;凭借着对未知的好奇心,在具身智能领域不断探索;用镜头记录生活美好瞬间;以乐观态度面对生活中的酸甜苦辣。
未来之路,充满无限可能,李宇飏怀揣着梦想与热爱,向着远方坚定前行。
文字 | 赵绮萱
素材 | 李宇飏
排版 | 梁文凯玥
本文来自【北京大学】,仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。
ID:jrtt
来源:全国党媒信息公共平台