摘要:李飞飞:斯坦福大学计算机科学系的终身教授,曾任人工智能实验室(SAIL)主任,现任 World Labs CEO。她是 ImageNet 数据集及其挑战赛(ImageNet Challenge)的发明者,这一大规模数据集和基准测试项目被广泛认为是推动现代人工智
李飞飞主讲的 cs231n 新版课程的视频和材料现已在网上全面发布!上一次公开发布是在 2017 年,距今已有近 8 年时间。
这是该课程的教职工阵容:
李飞飞:斯坦福大学计算机科学系的终身教授,曾任人工智能实验室(SAIL)主任,现任 World Labs CEO。她是 ImageNet 数据集及其挑战赛(ImageNet Challenge)的发明者,这一大规模数据集和基准测试项目被广泛认为是推动现代人工智能和深度学习革命的三大驱动力之一。
Ehsan Adeli:斯坦福大学精神病学与行为科学系的研究助理教授,同时兼任计算机科学与生物医学数据科学系的研究助理教授。他的研究方向包括医学与心理健康中的转化人工智能算法,利用视频分析和神经影像学探索人类行为与大脑功能之间的关系。
Justin Johnson:密歇根大学计算机科学与工程系的助理教授,曾在 Facebook AI Research 担任研究科学家。他的研究方向包括计算机视觉、视觉推理、图像生成和 3D 感知等领域,致力于开发深度神经网络模型以解决这些问题。
Zane Durante:斯坦福大学计算机科学博士生,师从李飞飞教授和 Ehsan Adeli 教授。他的研究方向包括多模态视觉理解、视频语言模型、少样本学习以及人工智能在医疗健康中的应用,致力于开发可解释且具社会价值的 AI 系统。
cs231n Spring 2025课程简介
计算机视觉在我们的社会中已变得无处不在,应用领域包括搜索、图像理解、应用程序、地图绘制、医学、无人机和自动驾驶汽车等。许多这些应用的核心任务之一是视觉识别任务,如图像分类、定位和检测。近年来,神经网络(即“深度学习”)方法的快速发展,极大地提升了这些先进视觉识别系统的性能。本课程将深入探讨深度学习架构的细节,重点讲解如何为这些任务(特别是图像分类)构建端到端的模型。
cs231n 2025 课程包含 18 门正式课和 4 节复习课。这里简单总结了该课程的目录,你可以在课程主页下载相应的材料:
深度学习与计算机视觉简介图像分类与线性分类器正则化和优化神经网络与反向传播利用卷积神经网络(CNN)进行图像分类卷积神经网络(训练与架构)循环神经网络(RNN)注意力机制与Transformer目标检测与图像分割视频理解大规模分布式训练自监督学习生成式模型3D 视觉视觉与语言机器人学习以人为中心的人工智能中间还穿插了四门复习课程:Python / Numpy 复习课程、反向传播复习课程、PyTorch 复习课程、RNN与Transformer 复习课程。
课程主页:https://cs231n.stanford.edu/schedule.html
另外,在考虑学习这门课程之前,你应该先具备以下能力:
熟练掌握 Python:所有课程作业均需使用 Python(及 numpy 库),我们为不熟悉 Python 的同学准备了入门教程。若您具备其他编程语言(如 C/C++/Matlab/Javascript)的丰富经验,也能轻松适应。大学微积分、线性代数(如 MATH 19、MATH 51 课程):你需要熟练掌握求导运算,并能理解矩阵与向量的运算规则及其表示方法。基础概率与统计(例如 CS 109 或同等课程):你需要掌握概率论基础知识,包括高斯分布、均值、标准差等基础知识。来源:数据派THU一点号