前言
“军平,我觉得你不妨用科普的形式把你的观点写出来!”
看完我写的技术报告,我的博士生导师王珏研究员对我说道。
1 萌芽
图0.1 最初的技术报告——科普雏形
那是2006年11月,我博士已毕业3年。小朋友刚2岁,每天抱着她闲逛,看着她日渐成长,痛并快乐着。她虽尚不能流畅交流,但我相信,多跟她说些话,她总能潜移默化吸收一些,也许对她今后的智力发育会有大的帮助。出于天生的好奇心重,我也顺便观察着她的智力发育变化,比如发错音的问题、颜色辨识困难的现象,诸如此类。那段时间,我对人的认知心理也有些兴趣,顺便看了点皮亚杰的《儿童发展心理学》、华生的《行为主义》等心理学方面的书籍。有一阵子,经常为自己在智能发育方面的一些奇思怪想激动不已。为了能方便总结,我向陆汝钤老师申请了去北京的中科院数学所访问2个月。陆老师很快就答应了,并将中科院计算所他的办公室借给我使用。在那里,我完成了图0.1所示的技术报告,还见到了就在隔壁房间办公,我一直很仰慕的人工智能老前辈史忠植老师。偶尔也会去隔壁办公室,跟当时正在用传统机器学习和计算机视觉方法在人脸识别领域奋斗着的山世光,以及在生物信息学领域钻研着的贺思敏闲聊。
我把技术报告给陆老师看后,他说还不够深入。王珏老师也说,缺乏实验在计算机领域是站不住脚的。如果只是想表达自己的观点,不如用科普的形式写出来,就像厦门大学的集禅宗、古琴、机器作曲于一身的周昌乐教授写的《无心的机器》那样。
仔细想了想,感觉工作确实也不是太完整,不如放一放,再多积累点,多看看世界,也许会更丰满。
2 修身
时间过得飞快。2007年9月,我去加州大学圣迭戈分校访问了半年,旁听了不少课程和报告,如提出Adaboost算法的约法夫·弗洛德(Yoav Freund)的“机器学习”课,也听到杰弗里·希尔顿(Geoffrey Hinton)介绍他2006年发表在Science(《科学》)上,在深度玻尔兹曼机方面的研究进展。不过当时,大家多还处在对“深度学习”将信将疑的阶段,毕竟第二波人工智能的低潮把大家打击坏了。回国后,我继续做我的博士研究方向——基于流形学习的降维研究。我们小组针对高维数据降维后如何做统一的客观评估提出了一套准则,也基于代数拓扑中的持续同调思想,构造了主单纯复形的监督学习算法。在远距离身份识别这一块,基于人可以根据人的走路轮廓而不需要对图像进行细粒度的分析就能识别行人这一特点,提出了基于时间不变的步态模板的行人识别算法。
这期间,我也为人工智能两个主流会议做了些服务性工作,包括给2013年在北京举行的“人工智能国际会议”(IJCAI)做学生志愿者主席,以及2014年在北京举行的“机器学习国际会议”(ICML)做当地组委会成员。2013年11月的第一个周末,我和西安电子科技大学高新波教授承办了“第十一届中国机器学习及其应用研讨会”。该会议2002年始于复旦,由陆汝钤老师发起,2005年转至南京大学,在王珏老师、周志华教授的推动下,成为国内机器学习领域最负盛名的研讨会。通过参加这些会议,我对人工智能的认识也深入了一些。
2014年8月—2015年8月再次赴美国访问,并被宾夕法尼亚州立大学聘为研究助理(Research Associate),在信息科学技术学院王则(James Z. Wang)教授的指导下做些机器学习和气象预测等相关的研究。临行前,特地去拜见了我的博士导师,他又给我讲了一些他对人工智能发展近况的思考,并给我建议了一些值得关注的方向。而我到美国后,也利用这一年的时间,安安静静地思考了人工智能的发展与不足。
回国后,发现深度学习已经如火如荼,不跟进几乎很难在预测性能上占得优势。在发现单块显卡处理能力的问题后,我们便开始陆续购入了更多的GPU(图形处理器)显卡,来帮助增加计算能力,目前已经有了22块像样的显卡。对我来说,与以往最明显的区别,就是发论文的成本高了,这让人多少有些心痛。以前一支粉笔、一块黑板、一个仿真程序可能解决的事,现在靠大数据、GPU、硬盘存储系统,一篇论文的成本可能接近10万元。更何况,还经常会碰到参数调了半天,算法不收敛的状况。
2017年5月左右,应邀去西安参加了两次郑南宁老师主持的人工智能的相关研讨会,并参与筹备中国自动化学会混合智能专委会。7月,国务院发布了《新一代人工智能规划》,其中谈到了人机回路。8月,混合智能专委会成立,西安交通大学薛建儒老师任主任,我很荣幸当选为副主任之一。同年,我们开通了专委会的微信公众号。
3 科普
2018年上半年,机缘巧合在《科技日报》上写了一篇关于对抗生成网的访谈报道。想着要给大众读,趣味性就得加强一点。所以,我在报道中讲了两个小故事,一是奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》里,一个囚犯在监狱里自己跟自己下国际象棋的故事,另一个是金庸的《射雕英雄传》里周伯通被困桃花岛后的双手互搏。虽然内容与对抗生成网的目的有一定的出入,但这两个故事都比较形象地讲述了同一个模型里存在对抗的事实。后来从阅读量来看,反响还不错。
于是感觉自己可以尝试写点科普文章。刚巧专委会也需要对微信公众号进行宣传,而我又一直对论文成本上升太快、经费有点撑不住耿耿于怀。某天在“追寻长寿之道”时突然发觉个体和统计的差异如此明显,觉得这个道理似乎能解释深度学习的优异和不稳定性,便给专委会微信公众号连续写了两篇文章,《深度学习,你就是那个116岁的长寿老奶奶》和《童话(同化)世界的人工智能》,科普深度学习之现状以及对现在产业和学术界带来的同化效应。在文章的最后,我留了个尾巴,我认为现在的研究尚不能完全解开智能的谜团。也许,答案要从犯错中去寻找。
这两篇文章的反响也是出奇的大,我便跟我博士导师的好朋友、对我有很大帮助的中国科学院自动化所的王飞跃老师在微信上说了这件事。开心之余,他建议我不妨写个科普系列。
要写科普系列,我想起了2000—2003年在北京读博士期间经常逛北京大学校区二手书摊时偶得的一本科普书《哥德尔,艾舍尔,巴赫——集异璧之大成》。王珏老师告诉我这是本好书,要好好看看。然后跟我讲了译者之一、严勇的导师、北京大学马希文教授(也是周昌乐的导师)的一些轶事,比如精通六国语言,对此书在信达雅的翻译处理方面赞叹不已。2016年,陆汝钤老师来复旦时又给我补充了一些对马希文教授的回忆。再说说这本书,它在美国一直是本科普畅销书。不过,不足在于,这本书第一版发行的时间是1979年,正处在人工智能第一波的寒冬中,对于1979年以后的人工智能的进展、观点变更没有涉及。其次,书还是太厚了。真心有兴趣把这本书细细读完的,十有八九是与人工智能相关的科研工作者或从业人员。另一本是2015年我在美国买的畅销图画书,克莱夫·吉福德(Clive Gifford)撰写的Eye Benders: The Science of Seeing and Believing(《眼睛弯管:看和相信的科学》),书中讲了不少视觉错觉的例子,但并没有从人工智能的角度去做深入分析。
所以,我想结合两本书的一些背景知识,再加上我2006年以来对智能结构发育的一些认识和再认识,以及近年来对人工智能的许多更新理念来撰写。
而在写作手法上,我希望能做到专业和引人入胜。俗话说,科学家上报纸,就会少一圈朋友;科学家上电视,就没有朋友了。所以,写的内容我都反复斟酌过,确保逻辑通畅、无漏洞,防止没朋友。但人不是神,总有可能会出错。如果仍有遗漏和问题,后面我会做个勘误表。而关于如何引人入胜,我采用了与我所读过的科普书不太一样的风格,即小故事加严肃科普的形式,偶尔会穿插几个科学笑话,当然还要有点中国特色,这个风格基本贯穿了全书。
不过,万事开头难。虽然每一节要写的基本路线我都清楚,但怎么开头都挺头痛的。所以,我想了一些办法。比如跑跑步、遛遛狗,期望缓解之余还能释放点多巴胺来启发一下,一有好的点子就赶紧记下。当然,还得有充足的时间投入。所以,在完成这个系列的过程中,我把很多朋友的讲座邀请、登门讨论都无情地拒绝了。没办法,有时候创作和研究都需要一个人有不间断的独立思考时间。这应该就是做科研要有的狂热吧。另外,有的时候短时间高强度的集中思考,确实能促进思维、帮助人更深入细致地思索问题的可能答案。虽然这段时间平均每天睡眠约5个半小时,确实很累,每当想放弃时,我就会想起美国作家罗伯特·卡尼格尔写的《知无涯者:拉马努金传》中描述过的印度数学家拉马努金追求数学真理的过程,就会想起因玻尔兹曼方程和朗道阻尼的工作而于2010年获得“数学界的诺贝尔奖”——菲尔兹奖、主攻最优输运理论的塞德里克·维拉尼(Cédric Villani)在其书《一个定理的诞生:我与菲尔茨奖的一千个日夜》中提到的坚持和努力。也会想起近代著名学者王国维在《人间词话》中提及的古今成大事业、大学问者必经之三重境界:
1. 昨夜西风凋碧树。独上高楼,望尽天涯路。——北宋晏殊《蝶恋花·槛菊愁烟兰泣露》
2. 衣带渐宽终不悔,为伊消得人憔悴。——北宋柳永《蝶恋花·伫倚危楼风细细》
3. 众里寻他千百度。蓦然回首,那人却在,灯火阑珊处。——南宋辛弃疾《青玉案·元夕》
总之,写这个系列对我来说,是物超所值的,因为在科普的同时,我也在其中总结了不少我对人工智能诸多问题的观点和探讨,希望能给那些对人工智能感兴趣的人有所启发。
最后感谢中国自动化学会混合智能专委会薛建儒主任、陈德旺副主任、王晓师妹对本科普系列在微信公众号传播的大力支持,感谢科学网连续20余次推荐本科普系列文章至科学网头条,也感谢众多微信公众号如中国工程院院刊、中国自动化学会等的推荐。这些支持,让更多对人工智能感兴趣的人了解了这个科普系列的工作。另外,我也衷心感谢很多朋友在本书撰写中提出的宝贵意见,尤其是与我一同从2002年“第一届中国机器学习及其应用研讨会”出道的、北京交通大学的于剑教授对本书一些概念的讨论。感谢家人和我的学生们的理解和默默支持。没有他们在生活和科研上的顺畅配合,我也不可能有多余的时间来写这个科普系列。也感谢国家自然科学基金(资助号:61673118)、上海市“脑与类脑智能基础转化应用研究”市级科技重大专项资助(项目编号:NO.2018SHZDZX01)和张江实验室对本书的支持。
仅以此书献给我的博士导师:王珏研究员
写于2018年12月24日