本章已经开始介绍RL的实践部分了!在本章中,我们安装了OpenAI Gym,它能提供大量的环境。本章研究了它的基础API,创建了一个行为随机的智能体。
还介绍了如何以模块化的方式扩展现存环境的功能,介绍了如何使用Monitor类录制智能体的活动。后面的章节会大量使用这些技巧。
Monitor
下一章将使用PyTorch快速回顾DL,PyTorch是DL研究人员最喜欢用的一个库,敬请期待!