上QQ阅读APP看书,第一时间看更新
7.5 总结
本章讨论了更高级的RL库、它们的动机和要求。然后深入研究了PTAN库,本书的其余部分会用它来简化示例代码。
下一章将回到DQN方法,通过研究自从经典DQN引入以来研究人员和工程人员已经发现的扩展,来提升该方法的稳定性和性能。
本章讨论了更高级的RL库、它们的动机和要求。然后深入研究了PTAN库,本书的其余部分会用它来简化示例代码。
下一章将回到DQN方法,通过研究自从经典DQN引入以来研究人员和工程人员已经发现的扩展,来提升该方法的稳定性和性能。