更新时间:2023-10-27 19:21:07
封面
版权信息
文前
译者序
前言
数学符号
第1章 导入、汇总和可视化数据
1.1 简介
1.2 类型结构特征
1.3 汇总表
1.4 汇总统计量
1.5 数据可视化
1.5.1 定性变量绘图
1.5.2 定量变量绘图
1.5.3 双变量的数据可视化
1.6 扩展阅读
1.7 习题
第2章 统计学习
2.1 简介
2.2 监督学习和无监督学习
2.3 训练损失和测试损失
2.4 统计学习中的权衡处理
2.5 估计风险
2.5.1 样本内风险
2.5.2 交叉验证
2.6 数据建模
2.7 多元正态模型
2.8 正态线性模型
2.9 贝叶斯学习
2.10 扩展阅读
2.11 习题
第3章 蒙特卡罗方法
3.1 简介
3.2 蒙特卡罗抽样
3.2.1 生成随机数
3.2.2 模拟随机变量
3.2.3 模拟随机向量和随机过程
3.2.4 重采样
3.2.5 马尔可夫链蒙特卡罗
3.3 蒙特卡罗估计
3.3.1 朴素蒙特卡罗
3.3.2 自举法
3.3.3 方差缩减
3.4 蒙特卡罗优化
3.4.1 模拟退火
3.4.2 交叉熵方法
3.4.3 分裂优化
3.4.4 噪声优化
3.5 扩展阅读
3.6 习题
第4章 无监督学习
4.1 简介
4.2 无监督学习的风险和损失
4.3 期望最大化算法
4.4 经验分布和密度估计
4.5 通过混合模型聚类
4.5.1 混合模型
4.5.2 混合模型的EM算法
4.6 向量量化聚类
4.6.1 K均值
4.6.2 通过连续多极值优化进行聚类
4.7 层次聚类
4.8 主成分分析
4.8.1 动机:椭球体的主轴
4.8.2 PCA和奇异值分解
4.9 扩展阅读
4.10 习题
第5章 回归
5.1 简介
5.2 线性回归
5.3 线性模型分析
5.3.1 参数估计
5.3.2 模型选择和预测
5.3.3 交叉验证与预测残差平方和
5.3.4 样本内风险和赤池信息准则
5.3.5 分类特征
5.3.6 嵌套模型
5.3.7 决定系数
5.4 正态线性模型的推理
5.4.1 比较两个正态线性模型
5.4.2 置信区间和预测区间
5.5 非线性回归模型
5.6 用Python实现线性模型
5.6.1 建模
5.6.2 分析
5.6.3 方差分析
5.6.4 置信区间和预测区间
5.6.5 模型验证
5.6.6 变量选择
5.7 广义线性模型
5.8 扩展阅读
5.9 习题
第6章 正则化和核方法
6.1 简介
6.2 正则化
6.3 再生核希尔伯特空间
6.4 再生核的构造
6.4.1 通过特征映射构造再生核
6.4.2 根据特征函数构造再生核
6.4.3 利用正交特征构造再生核