上QQ阅读APP看书,第一时间看更新
5.大量试错
阿尔法狗的学习方法是通过试错不断地进行实验。它采用的不是暴力算法,而是强化学习法:不断地与环境互动,并在此过程中学习。为了不断提升阿尔法狗的获胜率,屡战屡败是必经的过程。为实现彻底创新,失败是必不可少的输入。
谷歌每年会进行2万次快速实验,评估实验结果,然后周而复始,以便实现渐进式提升。这一过程中的失败不会受到惩罚。埃里克·施密特(Eric Schmidt)在评价Google Wave这个即时交流平台的失败时说:“我们的政策就是不断地尝试。我们欢迎失败。在我们公司,啃硬骨头绝对不会有问题。即便没有成功,我们也可以吸取教训,然后用在新项目上。”
这些帮助阿尔法狗打败李世石的原则,也帮助谷歌创造了一种能孕育彻底创新的文化。正是因为顺应了自然法则,这些原则对所有组织具有普适性。