深度强化学习算法与实践:基于PyTorch的实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 OpenAI Gym环境

OpenAI Gym环境是一个非常重要的一系列强化学习环境的集合。之所以称它为强化学习环境的集合,是因为它本身是一个框架,包含了一系列的强化学习环境,甚至可以通过Python类的继承来自定义强化学习环境。实际上,因为这个强化学习环境的通用性和对应接口的简单性,很多强化学习算法发表的论文都会在这个强化学习环境中做试验来验证算法的有效性。由于本书主要研究的是强化学习算法,书中的大多数算法示例也将会基于这个强化学习环境来展开叙述。另外,由于OpenAI Gym环境中包含的强化学习环境比较多,下面将会根据环境类型的不同来进行叙述。