Python深度强化学习:基于Chainer和OpenAI Gym
上QQ阅读APP看书,第一时间看更新

1.6 ChainerRL的安装

本书使用ChainerRL的0.3.0版,这是深度强化学习使用的框架。与Chainer一样,需指定版本并安装。

1. Windows环境

执行以下命令。

024-1

请按照以下步骤确认安装。首先,创建一个包含代码列表1.2中所示的Python程序的文件。可以使用编辑器[1]以便编写Python程序,例如Visual Studio Code、Atom、Sakura编辑器。使用Visual Studio Code较为方便,因为它可以执行单行代码以进行调试。

代码列表1.2 用倒立摆检查ChainerRL:chainerrl_test.py

024-2

然后执行以下命令。

024-3

执行该命令后如果立即(或者过一会儿)显示如图1.7所示的图像,则表示运行成功。如果要中途退出,请将鼠标放到终端界面上,然后按Ctrl+C组合键。这一程序通过省略错误处理来进行简化,因此它可能会因发生错误或警告而中止运行。

025-1

图1.7 倒立摆问题

2. Linux环境

执行以下命令。

025-2

确认安装时请使用与Windows中相同的程序(chainerrl_test.py)。

执行请使用以下命令。

025-3

3. 使用Mac的用户

执行以下命令。

025-4

该安装确认步骤与Linux的相同。

4. RasPi环境

执行以下命令。

026-1

该安装确认步骤与Linux的相同。


[1]在本章末尾的“编写程序的编辑器”专栏中对此进行简要介绍。