深度强化学习实践(原书第2版)
上QQ阅读APP看书,第一时间看更新

3.9 总结

本章简要介绍了PyTorch的功能和特性,讨论了诸如张量和梯度之类的基本要素,并且在介绍如何自行实现模块之前,介绍了如何用基本构建块构造NN。

讨论了损失函数和优化器,以及训练动态的监控。最后,介绍了PyTorch Ignite,该库为训练模型提供了高级接口。本章的目的是对PyTorch进行简要介绍,本书后面会用到PyTorch。

下一章将介绍本书的主要内容:RL方法。