上QQ阅读APP看书，第一时间看更新

译者序

我最早于2018年接触强化学习这一令人兴奋的技术，在深入了解后，感觉打开了一扇新世界的大门。使用强化学习，我不仅可以享受编程的乐趣，也可以享受玩游戏的乐趣。同时，强化学习也在一定程度上给了我一些生活上的启示，从前的我是容易陷入“局部最优性”的人：我之前只要在食堂遇到一种喜欢吃的食物，就会天天吃，直到吃腻为止；回家的路，只会走那条最熟悉的（即使可能有近路，但是害怕走错还是不会选择那条可能的近路）。强化学习对于探索的需求是很强烈的，对于未见过的观察，智能体必须要有强烈的探索欲望，经历过各种场景，最终得到的策略才会更优。在探索强化学习的同时，我自身也更接纳“探索”了：多尝试以前没有吃过的菜，多探索几条新的回家的路。这种不需要后续步骤、可以立即得到确定性状态价值的探索非常高效，必须要好好利用。

在接触本书后，我发现，如果在啃Sutton的《强化学习（第2版）》前，能先好好学习一下本书，那该多么幸福！本书从理论和实践两个角度对强化学习进行了解释和演示，如果想快速上手强化学习并开始实践，那么本书就是目前的不二之选了。

由于译者水平有限，书中出现错误与不妥之处在所难免，恳请读者批评指正。如果有强化学习相关的问题想和译者进行探讨，可发邮件至boydfd@gmail.com。

最后，感谢本书的策划编辑王春华的耐心和悉心指导。当然，还要感谢我的女朋友王薇，在她的支持和协助下，这本书才得以翻译完成，并呈现在大家面前。感谢每一位读者，你的潜心研习与融会贯通将会令本书更有价值。

林然
2021年1月