摘要:2025年2月18日,美国艾尔弗·斯隆基金会在其官网公布了2025年斯隆研究奖获奖名单,126位来自七个不同学科领域的杰出青年学者获此殊荣。
2025年2月18日,美国艾尔弗·斯隆基金会在其官网公布了2025年斯隆研究奖获奖名单,126位来自七个不同学科领域的杰出青年学者获此殊荣。
康奈尔大学孙温获得2025年斯隆计算机科学研究奖,在此向孙温博士表示祝贺!
孙温,康奈尔大学计算机科学系助理教授,研究领域: 人工智能和机器学习。[1]
一、学习工作经历
2012年,加拿大西蒙菲莎大学和中国浙江大学联合学位,计算机科学学;
2014年,美国北卡罗来纳大学教堂山分校计算机科学硕士学位;
2019年6月,美国卡内基梅隆大学计算机科学学院机器人研究所机器人学博士;
2014年8月~2019年6月:卡内基梅隆大学机器人研究所研究助理;
2019年7月~2020年6月:纽约市微软研究院博士后研究员;
2020年7月~至今:康奈尔大学计算机科学系助理教授。
二、奖项与荣誉
2015年,UAI最佳学生论文奖;
2024年,康奈尔计算与信息科学学院颁发的安·S·鲍尔斯研究卓越奖;
2024年,美国国家科学基金会职业奖;
2025年,斯隆研究奖学金。
三、作品精选[2]
专著Monograph
阿莱克·阿加瓦尔,南·江,沙姆·卡卡德,孙温. 《强化学习:理论与算法》。
预印本
Zhaolin Gao, Wenhao Zhan, Jonathan D. Chang, Gokul Swamy, Kiante Brantley, Jason D. Lee, 孙温.“回归相对未来:多轮RLHF的高效策略优化”, arXiv, 2024
Runzhe Wu, Yiding Chen, Gokul Swamy, Kiante Brantley,孙温. “扩散状态与匹配分数:一种新的模仿学习框架", arXiv, 2024;
Zhiyong Wang, Dongruo Zhou, John C.S. Lui, 孙温. “基于模型的强化学习作为一种最小化方法,用于无时间范围和二阶界限", arXiv, 2024.
期刊论文
Theodoris Lykouris、Max Simchowitz、Aleksandrs Slivkins、孙温.在时序强化学习中的抗腐败探索.运筹学数学,2023年.
孙温, Jur van den Berg, Ron Alterovitz, “随机扩展LQR:基于优化的不确定性下运动规划”, IEEE自动化科学与工程杂志(TASE), 2016.
孙温,Sachin Patil, Ron Alterovitz, “在不确定性下使用并行采样基运动规划进行高频重规划”,IEEE机器人学汇刊(TRO), 2015.
参考文献
[1]https://www.aminer.cn/
来源:海风uh6