科学史上的365天
上QQ阅读APP看书,第一时间看更新

2016年3月9日
黑白世界的对决——人机大战

2016年3月9日,一场牵动人心的“人机大战”在韩国首都首尔四季酒店正式拉开帷幕,大战于3月15日告终。这惊心动魄的7天,引起全世界10亿人的高度关注。大战的一方是美国谷歌集团下属“深度思维”(Deep Mind)公司研发的人工智能AlphaGo(阿尔法狗,其中Go代表围棋,源于日文“围棋”的发音),这台超级计算机通过在美国的云计算服务器,经由光缆与比赛现场接通;另一方是近十年来获得世界冠军头衔最多的高手,韩国职业围棋九段李世石。

这是一场“人类智慧”对决“人工智能”的大战,结果AlphaGo以4:1的优势获得最终胜利。这不是一场普通的比赛,它改变了世界围棋的格局,引起了世人对围棋的关注,更令世人关注到了人工智能的发展。图1是李世石在比赛中执黑开局,图2是第三局中盘时的李世石,这是他唯一获胜的一局。

图1

图2

这次计算机的胜利并非孤例,1997年,IBM的超级计算机“深蓝”曾战胜国际象棋大师卡斯帕罗夫;2011年,人工智能系统“沃森”在智力问答节目“危险边缘”中战胜人类;2014年伶牙俐齿的“小男孩”尤金蒙骗了人类,通过了图灵测试;2015年,作为计算机“深度学习”代表的“阿尔法围棋”战胜了欧洲围棋冠军樊麾。现今这一次,与其说是再一次人类与机器智能的对决,不如说是一场捍卫人类尊严之战,更是一场丰美的围棋盛宴,黑白世界因这场对决变得更加绚丽多彩。由于受到广泛的关注,围棋这个看似高冷的项目与广大观众有了更广泛的交集,一时间,关于围棋和人工智能的话题充斥着街头巷尾(参见本书6月7日“2014年图灵测试——‘小男孩’尤金”)。

这场大战之前,许多围棋业内专家对人工智能并不看好,有的专业棋手名家公开宣称,人工智能要想在围棋上战胜人类,起码也要再等40年,甚至100年,他们做出这样的判断并不是没有根据的。

围棋是东方文明的产物,是世界上最复杂的棋类,在中国已有4000年的历史。方格棋盘、黑白棋子、规则简单、棋路优雅,无论棋子还是棋盘都不含任何等级关系,在看似简单之中,充满着神奇的复杂与魅力。它既是平和之下的战争厮杀,又是静默之中的智力较量,内中蕴含着丰美的东方智慧与神韵,精确的谋算与模糊的思维,详尽的策划与虚无缥缈的路数,大度舍弃与锱铢必较,所倚重的直觉更是难以言传。这些特征注定它与讲究定量和严格逻辑的西方文明完全不同。正因如此,在大多数用来考察人类智慧的游戏中,如国际象棋、拼字游戏、奥赛罗棋等,人工智能都能毫不费力地击败人类,唯独围棋,却能让人类保持最后一点尊严。

这次大战,电脑战胜了人脑令举世震惊(图3)。在大战中,AlphaGo的“平衡感”和“大局观”令许多专业棋手赞叹。中国棋手常昊九段曾经以为,不易做出直觉判断是人工智能的弱点,但他发现“事实上并非如此”。在赛前,对AlphaGo报以不屑的棋圣聂卫平九段,曾预测李世石将以5:0取胜,但仅第一局的结果就让他非常震惊,几局下来,他对AlphaGo的评价是,“布局有职业六七段水平,而中盘有十三段的水平。”棋评大师李喆六段的体会更加深刻。他说:“这场人机之战给我最大的震撼来自于棋谱。AlphaGo下出了许多完全在人类棋手经验之外的‘招法’,这些着法在目前尚不能得到人类棋手的统一理解。我隐隐地读到了这些招法背后的壮美天地,这壮美天地当然不是AlphaGo所创造的,而是四千多年围棋历史所自有的丰富与辽阔。”

图3

围棋比国际象棋复杂得多,有人做出了估算,如果象棋的复杂度是1048,围棋的19路盘的复杂度就是10170,也就是它的10122倍。打个比喻,如果把象棋的复杂比喻为一个单个原子核的结构,那围棋的复杂程度就像是整个太阳系。因此,即使最强大的超级计算机也难以在规定的时间内分析出每种走法所产生的结果。

AlphaGo的最厉害之处就是它的“大局观”。表面上看,它的每一步都很平凡,从人的思维角度审视,不觉得有什么惊奇,有什么优越性,甚至感觉是步错棋,但是下着下着,人就觉得落后了,这显示出人工智能对全局的掌控能力的确有过人之处。中国围棋等级分第一人柯洁观看完比赛之后不无感慨地说:“‘阿尔法围棋’能分清大小,这点非常厉害。”这说明,它在下棋时,具有了进行价值判断的能力,这是它战胜李世石的一个重要的因素。虽然与人相较,它缺乏想象力和创造力,没有好恶是非和喜怒哀乐的情感,但它的长处是非常明显的:它的学习能力强大,记忆力强大,行事不受情绪影响,不会犯错。“你很难解释AlphaGo上一步或下一步的着子。”美国出生的专业围棋九段,唯一的西方专业围棋大师迈克尔·雷蒙(图4),也是这次比赛对西方国家转播的英语解说人。他说:“在第58子时,它似乎下错了,就像第四盘的中盘那样,但后来它越下越好,它强大的学习功能,给对手造成了很大的麻烦。”韩国九段金成龙补充说:“它就像是一个科学家那样,在比赛中,它总是力图突破程式,找到一个新的路数去发展。它的这一强大功能对人类是一个挑战,促使人类棋手开拓新的视野。我们已经从这次比赛中看到了不少极为吸引人的漂亮步法,不仅吸引着专业棋手,也扩大了围棋的影响力,这是非常有意义的事,可以说,AlphaGo超出了人类的想象。”

图4

AlphaGo为围棋创造了新的历史,这次人机对决是具有里程碑意义的重大事件。围棋不仅是一种胜负的游戏,它也是一种文化、一种修为。这五盘棋对围棋的推广和普及非常有帮助,特别是在欧美地区的传播,人们在领教科技魅力的同时,也领会了围棋的魅力。

就像当年IBM研发的、战胜国际象棋顶级大师卡斯帕罗夫的“深蓝”得到了美国国防部的资助那样,这次围棋的人机大战背后也有推手。与李世石博弈的并不是一个人,在AlphaG o的背后,拥有无数的“指教者”,这就是全球规模最大的搜索引擎——谷歌公司。谷歌,这个全球最大的知识库,它的发展始终建立在不断创新之上。它拥有力量雄厚的X实验室,从各处搜罗来的高级人才在这里毫无边界地去搞发明,“深度思维”(Deep Mind)就是谷歌以高价收购来的实验机构。图5是在谷歌公司秘密开展人工智能研究的电脑工程师德米斯·哈萨比斯。

图5

哈萨比斯曾经是位英国象棋神童,后来成为电脑游戏的设计者。2013年,他手下的这个仅有50人的英国小公司秘密地开始了人工智能研究。当其他人从语言入手时,他们却从感官经验开始,使人工智能更具有人类的特点。当时所研发出的AlphaGo还很“幼稚”,但谷歌公司却很有眼光,仅看了一次AlphaGo的表演之后,就毫不犹豫地以4亿美元的重金收购了这家小公司。AlphaGo首次测试始于2015年10月,与生于中国的樊麾职业二段进行了5周的较量,AlphaGo没有给这位欧洲围棋冠军翻盘的机会。然而那次对决只是内部测试,没有引起太多人的注意。随后的进展却大大地出人的意料,不到半年,它的思维已经接近了人类,真正实现了从“计算”到“智能”的超越。人类4000年的围棋史被AlphaGo所改写,从此这场里程碑式的事件开辟了围棋的新纪元。图6是哈萨比斯手下的人工智能开发团队,图7是工作中的哈萨比斯。

图6

图7

AlphaGo的进展之所以如此神速是与它强大的人工智能系统分不开的。AlphaGo拥有两个神经系统,一个叫做“政策神经系统”(policy network),一个叫做“价值神经系统”(value network)。它的神经网络已经具备了数百万计的神经元,12个不同的网络层面。其中“政策神经系统”的运行不总是计算,而是先采取一种所谓“蒙特卡洛树搜索”的排除法,这是人工智能最伟大的先驱者马文·闵斯基(Marvin Minsky)的同事克劳德·香农(Claude Shannon)在几年前发明的,从中确定哪些应该计算,哪些不需要计算而应该舍弃,从中筛选出棋盘上若干点。一旦选点确定,就需要“价值神经系统”对所选出的点进行价值再评估哪些最有价值,哪些代表未来,哪些能更有力地削弱对方,根据比赛需要决定出哪些点需要深度计算,哪些点只需计算一两步就不算了。两种系统、两种思维分工合作,不仅决定下一步的着子点,还要评估出在这块棋盘上,正在下的这部分的价值有多高,是继续在这个地盘上与对手厮杀下去呢,还是抛弃这个地盘,另处开辟一片新天地。

AlphaGo的自我强化学习能力也很强大,除了学习历史棋谱,它还通过自我对局,无限量地增长评价每步落子的策略,相比“深蓝”,AlphaGo的自我学习更接近于人类。因此,AlphaGo是人类所创造出来的唯一一个具有与人类类似“全局观”的人工智能,这是非常了不起的。图8是人机大战后,代表“人”与“机”双方的合影。从左到右是深度思维公司执行总裁哈萨比斯、韩国围棋九段李世石和谷歌创始人兼总监谢尔盖·布林。布林也是个围棋迷,在校学习期间,他曾花了大量时间下围棋,那时他从来没有想到以后的谷歌竟然与围棋结了缘。比赛后,他不无感慨地说:“围棋是一种非常漂亮的游戏,它比象棋更加丰富。我认为,它简直就是一部人生的教科书。当你观看一场围棋比赛时,禁不住要被它的壮丽所吸引。我感到非常的幸运,能把围棋这种壮美注入到计算机之中。”

图8

这次大战的意义不在于一场围棋赛的输赢,谷歌研发AlphaGo也不只为了战胜人类棋手,更不只是想在围棋领域有什么作为,而是希望通过神经网络技术推进人工智能的发展。一旦人工智能获得重大的突破,它可以代替人类做许多事情。在未来社会发展中,人工智能在大数据处理、计算和神经网络系统等方面可以帮助人类在诸多领域中做出正确的判断,因而更具有重要意义。例如利用人工智能打造金融分析师,以机器来分析市场、进行交易等,虽然此时估计它的应用将给世界带来什么变化为时尚早,但有一点可以肯定,由于人工智能的开发,社会将进入一个“人机交互”的时代。

在“人机交互”时代,人与机器应当是什么关系,著名科幻作家艾萨克·阿西莫夫早在1942年就提出了著名的机器人三定律,对人机关系加以规范。人工智能与机器人,是两条截然不同的路线,人工智能是更高一层的能力,目前人工智能挑战了人类,但它的水平,只限定在某些局部领域上。这次围棋高手的对抗,更多地体现在计算智能上,认知智能还未达到所期望的程度。AlphaGo的进步还只是依赖于海量的自我对局数目,虽然从自我对局中学习是它的长处,但也恰好说明了它并未真正掌握人在学习中所具有的思维和意识等能力,要达到人类智能水平,人工智能还有很长的路要走。

从AlphaGo的胜利还能得到更深层次的启示。谷歌高瞻远瞩地把公司的发展建立在引领社会文明之上,它的发展不靠卖地,不囿于房地产的开发或电商赚钱,也正因如此,使它能慧眼识珠地看上了“深度思维”。在谷歌以4亿美元收购“深度思维”的当初,这家小公司只是一个初创企业,几乎没有什么产品,手中仅有的三款设计还只在研发,其中一款就是作为高智能游戏的AlphaGo的前身。谷歌看中了它的发展前途,也看中了以哈萨比斯为首的研发团队的才华,看中了这些人在人工智能上的专注度和他们科技研发的实力。虽然有了人才,未来的产品和利润不足为患,但谷歌的长远眼光并不只赚钱,他们要为人工智能的研究奠定雄厚的基础,并将围棋作为人工智能发展的突破口之一。明晰的长远目标、以创新为龙头是谷歌行事的一贯风格。有人说,在谷歌,10%的人负责赚钱,90%的人负责“胡思乱想”和科技创新。这就是对人类第4个文明——信息时代的产品、结构和人员进行高屋建瓴的布局,这一布局不仅使谷歌在未来科技和信息领域拥有长远的竞争力,在创新高科技产品和信息技术产品上也始终处于高端地位,因而改变信息时代人们的生活方式,引领世界文明的发展。


关键词:阿尔法围棋,李世石,深度思维公司,德米斯·哈萨比斯,迈克尔·雷蒙,蒙特卡洛树搜索,AlphaGo,Lee Sedol,Deep Mind,Demis Hassabis,Michael Redmond,Monte Carlo tree search

图1:http://www.cbc.ca/news/technology/google-deepmind-go-final-1.3491693

图2:http://home.bt.com/tech-gadgets/tech-news/googles-alphago-beats-worlds-top-player-lee-se-dol-with-third-st

图3:http://www.hngn.com/articles/188201/20160312/googles-alphago-defeats-go-world-champion-third-time-video.htm

图4:https://en.wikipedia.org/wiki/Michael_Redmond_%28Go_player%29

图5:http://articles.economictimes.indiatimes.com/2014-01-29/news/46783755_1_larry-page-computer-google

图6:http://www.usgo.org/news/2016/03/alphago-edges-lee-sedol-in-game-5-to-win-google-deepmind-challenge-4-1/

图7:http://news.yesky.com/185/100245185.shtml

图8:http://technews.tw/2016/03/07/kai-fu-lee-alphago-vs-lee-sedol/