终于等到你!“西瓜书”《机器学习》官方配套习题集重磅出版

B站影视 2025-01-06 19:32 2

摘要:作为人工智能领域(AI)中文教材扛鼎之作,南京大学周志华教授所著的《机器学习》帮助无数AI从业者理清了机器学习的基本原理。在书中,周志华解释机器学习基本术语和问题时,贯穿全书用西瓜进行比喻讲解,因此该书也被读者们昵称为“西瓜书”。

作为人工智能领域(AI)中文教材扛鼎之作,南京大学周志华教授所著的《机器学习》帮助无数AI从业者理清了机器学习的基本原理。在书中,周志华解释机器学习基本术语和问题时,贯穿全书用西瓜进行比喻讲解,因此该书也被读者们昵称为“西瓜书”。

近日,机械工业出版社携手南京大学人工智能学院推出《《机器学习》习题参考》,本书配套周志华教授所著《机器学习》的教学及自学的辅助参考书。

周志华教授撰文推荐

由叶翰嘉和詹德川两位老师合作的《〈机器学习〉习题参考》(以下简称“本书”)是一本配合本人所撰《机器学习》(清华大学出版社于2016年出版,以下采用读者给予的昵称“西瓜书”)的教学参考书。

西瓜书于2016年出版后即被用作南京大学计算机系本科课程“机器学习导论”的教材(讲授前9章),2018年南京大学成立人工智能学院后,又被用作人工智能学院本硕核心必修课的教材(本科讲授前10章、研究生讲授全书)。八年来在南京大学课堂以西瓜书为教材进行学习的同学已逾3000人,另有海内外五百余家单位以其为教材进行授课。西瓜书中每章通常提供10道习题,有不少同学希望有更多的习题以供练习。

本书的两位作者都是南京大学人工智能学院的优秀青年教师,在机器学习领域有扎实的研究基础,成果斐然。两位都先后三轮担任本人授课的助教,并已开始独立授课,有较为丰富的教学经验。本书是对南京大学教学实践中使用的课程作业的总结和拓展,书中习题试图从不同角度帮助读者更好地掌握和巩固西瓜书中前10章所涉及的主要知识点,并综合考虑习题的难度和广度,尽可能兼顾不同读者的需求。

希望本书的出版能够辅助读者加深对机器学习的理解,并为教师授课提供有益的补充材料。

——周志华,南京大学副校长

国际人工智能联合会理事会主席、《机器学习》作者

关于本书

本书是“西瓜书”《机器学习》的教学或自学的辅助参考书,包含142道习题,题型分为简答题、计算题和编程题,对“西瓜书”中关于基本概念和常用算法的第1~10章内容进行考查,习题涵盖不同难度级别,尽可能兼顾不同读者的学习需求。

本书分为两部分,共16章。第一部分为“基础考评篇”,对应“西瓜书”前10章内容,对书中知识点进行循序渐进地探究。第二部分为“综合应用篇”,考查对“西瓜书”前10章知识点融会贯通的能力。

书中习题均具有详细解答, 给出了出题的主要思路、所考查的知识要点、其他可能的解法,以及相关知识点的关联和拓展,并对以往授课过程中发现的易错点进行了探讨。

作者介绍

叶翰嘉南京大学人工智能学院副教授、博士生导师。从事机器学习领域研究工作,入选全国高校计算机专业优秀教师奖励计划,获中国计算机学会优秀博士学位论文奖等荣誉。

詹德川南京大学人工智能学院教授、博士生导师,南京大学科研院副院长。主要研究方向为机器学习、人工智能,入选全国高校计算机专业优秀教师奖励计划,获江苏省科学技术一等奖等荣誉。

内容简介

本书配套周志华教授所著的《机器学习》教材,通过大量习题考查读者对机器学习相关知识点的理解与掌握。全书分为两个部分:第一部分习题对应《机器学习》第1~10章的内容,包括绪论、模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习;第二部分包含6章应用专题,通过综合题的形式对知识点进行多角度考查,包括线性模型的优化与复用、面向类别不平衡数据的分类、神经网络的优化与应用、EM算法及其应用、集成学习的过拟合现象研究、度量学习及其应用。书中包含简答题、计算题和编程题,涵盖不同难度级别,机器学习初学者可以通过这些习题深入了解和巩固教材的关键概念,对机器学习有一定基础的读者也可以通过习题发现对一些知识点不同角度的解读,为后续机器学习的深入研究打下基础。

本书面向《机器学习》读者以及广大机器学习爱好者,可作为高等院校人工智能、计算机、自动化及相关专业的本科生或研究生的教学辅助书籍,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

如何使用本书?

本书是“西瓜书”《机器学习》(简称为“教材”)的教学或自学的辅助参考书,包含大量习题、解答和注释,就像一位学习助手从不同角度帮助读者更好地掌握和巩固教材中关于基本概念和常用算法的前10章所涉及的主要知识点,并综合考虑习题的难度和广度,尽可能兼顾不同读者的需求。

本书的142道习题与教材章节末的习题并不重合,包含简答题、计算题和编程题三种题型,一方面可以为教师授课提供作业、考评的思路参考,同时也可帮助学生在上课或自学之余通过习题练习的方式对知识点的掌握情况进行自我评测。

本书分为两部分。第一部分为“基础考评篇”,共10章,对应教材第1~10章以及附录中机器学习数学基础部分的内容,包括105题,以计算题、简答题为主,这部分习题大多采用多个子问题的形式对书中知识点进行循序渐进的探究,部分习题和当前机器学习的前沿研究相结合,对教材中知识点的当前研究进展进行了一定程度的介绍,并给出了相应的参考文献。第二部分为“综合应用篇”,共6章,以“大作业”的形式考查对教材前10章知识点融会贯通的能力,包含37题,以编程题、简答题为主,这部分中每一章节将包含第一部分中一个或多个章节所覆盖的知识点。一方面考查将不同知识点灵活应用于实际问题的能力,另一方面考查对所学内容灵活拓展的能力。

本书提供的编程题的实验环境基于Python 3脚本语言,通过编程实践能够更便捷地在实际数据上探究知识点和算法的性质,同时也能更方便地展示如何在实际问题中应用机器学习算法。

目录

推荐序

前言

基础考评篇

第1章 绪论2

1.1 基本术语2

1.2 假设空间5

1.3 归纳偏好9

1.4 矩阵、优化和概率分布13

参考文献21

第2章 模型评估与选择23

2.1 经验误差与过拟合23

2.2 评估方法26

2.3 性能度量31

2.4 比较检验41

2.5 偏差与方差43

参考文献47

第3章 线性模型49

3.1 线性回归49

3.2 对数几率回归60

3.3 线性判别分析63

3.4 多分类学习74

参考文献78

第4章 决策树80

4.1 基本流程80

4.2 划分选择81

4.3 剪枝处理90

4.4 连续与缺失值93

4.5 多变量决策树100

参考文献105

第5章 神经网络106

5.1 感知机与多层网络106

5.2 误差逆传播算法112

5.3 全局最小与局部极小128

5.4 其他常见神经网络130

参考文献132

第6章 支持向量机134

6.1 间隔、支持向量与对偶问题134

6.2 软间隔与正则化142

6.3 核函数154

6.4 核方法158

参考文献160

第7章 贝叶斯分类器162

7.1 贝叶斯决策论162

7.2 极大似然估计166

7.3 朴素贝叶斯分类器179

7.4 贝叶斯网188

参考文献190

第8章 集成学习191

8.1 Boosting191

8.2 Bagging与随机森林201

8.3 结合策略207

8.4 多样性211

8.5 集成剪枝222

参考文献223

第9章 聚类225

9.1 距离计算225

9.2 k均值算法229

9.3 高斯混合聚类249

9.4 性能度量251

9.5 密度聚类与层次聚类254

参考文献262

第10章 降维与度量学习263

10.1 k近邻学习263

10.2 维数灾难265

10.3 主成分分析268

10.4 核化线性降维287

10.5 低维嵌入与流形学习288

10.6 度量学习291

参考文献295

综合应用篇

第11章 线性模型的优化与复用298

11.1 数据获取和预处理298

11.2 岭回归分类器的优化方法探究302

11.3 线性模型的参数选择314

11.4 线性模型的参数复用320

参考文献324

第12章 面向类别不平衡数据的分类326

12.1 类别不平衡现象与评价指标326

12.2 类别不平衡模型初探334

12.3 基于采样的“再缩放”方法340

12.4 类别不平衡问题的多分类扩展348

参考文献356

第13章 神经网络的优化与应用357

13.1 数值求导和自动求导357

13.2 神经网络优化实例362

13.3 BP算法的回顾与思考374

13.4 SOM神经网络377

参考文献385

第14章 EM算法及其应用387

14.1 数据中的隐变量387

14.2 EM算法的迭代优化视角391

14.3 EM算法的隐变量视角396

14.4 EM算法应用实例——缺失值处理398

参考文献413

第15章 集成学习的过拟合现象研究415

15.1 分布有偏移数据集的构造和划分415

15.2 机器学习中的过拟合现象418

15.3 AdaBoost的多分类算法实现425

15.4 AdaBoost是否会过拟合433

参考文献437

第16章 度量学习及其应用438

16.1 近邻分类器438

16.2 降维方法的评价444

16.3 度量学习448

16.4 度量学习的回顾与思考461

参考文献466

上下滑动查看本书目录

来源:机械工业出版社

相关推荐