上QQ阅读APP看书,第一时间看更新
译者序
我最早于2018年接触强化学习这一令人兴奋的技术,在深入了解后,感觉打开了一扇新世界的大门。使用强化学习,我不仅可以享受编程的乐趣,也可以享受玩游戏的乐趣。同时,强化学习也在一定程度上给了我一些生活上的启示,从前的我是容易陷入“局部最优性”的人:我之前只要在食堂遇到一种喜欢吃的食物,就会天天吃,直到吃腻为止;回家的路,只会走那条最熟悉的(即使可能有近路,但是害怕走错还是不会选择那条可能的近路)。强化学习对于探索的需求是很强烈的,对于未见过的观察,智能体必须要有强烈的探索欲望,经历过各种场景,最终得到的策略才会更优。在探索强化学习的同时,我自身也更接纳“探索”了:多尝试以前没有吃过的菜,多探索几条新的回家的路。这种不需要后续步骤、可以立即得到确定性状态价值的探索非常高效,必须要好好利用。
在接触本书后,我发现,如果在啃Sutton的《强化学习(第2版)》前,能先好好学习一下本书,那该多么幸福!本书从理论和实践两个角度对强化学习进行了解释和演示,如果想快速上手强化学习并开始实践,那么本书就是目前的不二之选了。
由于译者水平有限,书中出现错误与不妥之处在所难免,恳请读者批评指正。如果有强化学习相关的问题想和译者进行探讨,可发邮件至boydfd@gmail.com。
最后,感谢本书的策划编辑王春华的耐心和悉心指导。当然,还要感谢我的女朋友王薇,在她的支持和协助下,这本书才得以翻译完成,并呈现在大家面前。感谢每一位读者,你的潜心研习与融会贯通将会令本书更有价值。
林然
2021年1月