更新时间:2021-11-05 17:49:30
封面
版权信息
关于本书
作者简介
译者简介
译者序
前言
第1章 引言
1.1 深度强化学习可以做什么
1.2 本书的结构
1.3 框架:Chainer和ChainerRL
1.4 Python的运行检查
1.5 Chainer的安装
1.6 ChainerRL的安装
1.7 模拟器:OpenAI Gym
第2章 深度学习
2.1 什么是深度学习
2.2 神经网络
2.3 基于Chainer的神经网络
2.4 与其他神经网络的对应
2.5 基于深度神经网络的手写数字识别
2.6 基于卷积神经网络的手写数字识别
2.7 一些技巧
第3章 强化学习
3.1 什么是强化学习
3.2 强化学习原理
3.3 通过简单的示例来学习
3.4 应用到Q学习问题中
3.5 使用Python进行训练
3.6 基于OpenAI Gym的倒立摆
3.7 如何保存和加载Q值
第4章 深度强化学习
4.1 什么是深度强化学习
4.2 对于老鼠学习问题的应用
4.3 基于OpenAI Gym的倒立摆
4.4 基于OpenAI Gym的太空侵略者
4.5 基于OpenAI Gym的颠球
4.6 对战游戏
4.7 使用物理引擎进行模拟
4.8 物理引擎在颠球问题中的应用
4.9 物理引擎在倒立摆问题中的应用
4.10 物理引擎在机械臂问题中的应用
4.11 使用其他深度强化学习方法
第5章 实际环境中的应用
5.1 使用摄像机观察环境(MNIST)
5.2 实际环境中的老鼠学习问题
5.3 使用Raspberry Pi处理老鼠学习问题
5.4 使用Arduino + PC处理老鼠学习问题
5.5 使用Raspberry Pi + Arduino处理老鼠学习问题
5.6 结语
附录
A.1 VirtualBox的安装
A.2 Raspberry Pi的设置
A.3 安装Arduino
A.4 GPU的使用
A.5 使用Intel Math Kernel Library安装NumPy