深度强化学习实践(原书第2版)
上QQ阅读APP看书,第一时间看更新

7.5 总结

本章讨论了更高级的RL库、它们的动机和要求。然后深入研究了PTAN库,本书的其余部分会用它来简化示例代码。

下一章将回到DQN方法,通过研究自从经典DQN引入以来研究人员和工程人员已经发现的扩展,来提升该方法的稳定性和性能。