从“深蓝”到“阿尔法狗”, 人工智能发展的一大步-z6尊龙旗舰厅
对于人工智能来说,1997 年5月11日是历史性的一天。
ibm的超级计算机“深蓝”(deep blue)以2胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里·卡斯帕罗夫,一时间全球轰动。
“深蓝”的设计者们在当时就想到了下一个小目标:“何时计算机也能下围棋呢?”
2016年3月15日,谷歌围棋人工智能“阿尔法狗”(alpha go)与韩国棋手李世石对弈并以4:1的成绩获胜,这场“人机大战”成为人工智能史上一座新的里程碑,也再次为人工智能技术做了科普——
从“深蓝”到“阿尔法狗”,这二十多年的发展似乎也在预示着,人工智能终将改变人类的生活。
计算机的胜利
超越人类的思维限制,创造出一种能够自我学习、自我进步的超级大脑,一直是人类的终极梦想。
ibm的“深蓝”最早可以追溯到1985年,当时卡内基梅隆大学的博士生许峰雄开始开发一种名为“芯片测试”的国际象棋电脑“深思”(deep thought)(来源于科幻小说《银河系漫游指南》中的一台机器)。后来,许峰雄和他的同事被ibm聘用,继续从事国际象棋的研究工作。
卡斯帕罗夫是国际象棋史上最伟大的棋手之一,他不仅精通国际象棋,还是一位数学家、计算机专家,并且精通15国语言。他的棋风活泼,有异常敏锐的感知判断力,对弈时常常能以出人意料的策略赢得比赛。
卡斯帕罗夫曾在1989年的两场比赛中轻松击败“深思”,于是ibm团队继续改进他们的超级计算机,1993年将其重新命名为“深蓝”,这是deep thought和ibm蓝色logo的组合。
1996年2月17日,卡斯帕罗夫对阵ibm“深蓝”计算机,最终,卡斯帕罗夫以4:2战胜“深蓝”,一举夺得40万美元奖金。
这场比赛给许峰雄团队带来了信心,因为出乎他们的意料,世界象棋冠军在第一场比赛中输给了“深蓝”。比赛结束后,许峰雄团队一直在为“深蓝”做升级,升级后,“深蓝”每秒可以检测2亿个不同的国际象棋位置。
1997年5月3日,又一场人机大战开始了。卡斯帕罗夫赢了第一场,深蓝赢了第二场。第三、第四和第五局以平局告终。5月11日,深蓝以3.5比2.5的比分赢得了第六场比赛。
对于这场胜利,“深蓝”设计者许峰雄认为,这主要是依靠“深蓝”强大的计算能力穷举所有路数来选择最佳策略:“深蓝”靠硬算可以预判12步,卡斯帕罗夫可以预判10步。
如今“深蓝”的性能已经不再值得一提,就cpu来说,早在2006年,英特尔推出的第一代酷睿2就已经超过了“深蓝”,我们国家超级计算机天河二号的浮点运算能力,则是“深蓝”的30万倍。
但计算机战胜人类的开端,则为人工智能的从业者带来了更大的想象空间。
从“算”到“学”,人工智能发展的一大步
从今人的角度来看,“深蓝”还算不上足够智能,它的算法核心是暴力搜索:生成尽可能多的走法,执行尽可能深的搜索,换言之,它每走一步,几乎都是在遍历后续所有可能的情况下作出的决策。
因此,很多人认为这是计算机的胜利,而不是人工智能的胜利。
但2016年一战成名的alpha go不同。围棋和国际象棋在复杂程度上不可同日而语,围棋变数极多,一回合有250种可能,而一盘棋可以长达150回合。显然“深蓝”式的硬算在围棋上行不通。
alpha go胜利的秘诀不仅仅是计算机强大的计算能力,更依赖其精妙的算法。alpha go的算法的核心则依靠强化学习、深度学习和蒙特卡洛树搜索。“强化学习让alpha go有了自学能力,深度学习让alpha go通过数据驱动的机器学习有了估值量化能力,蒙特卡洛树则是一个连接所有技术和动作的框架。”
“感觉就像一个有血有肉的人在下棋一样,该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出出自程序之手。”柯洁曾这样评价alpha go。
2017年,alpha go进一步升级为新版程序 alpha go zero:从空白状态学起,在不利用人类任何围棋比赛数据作为训练数据的条件下,它能够迅速通过2900万次自我博弈、自学围棋,并以 89比11 的战绩击败“前辈”。
有专家形容alpha go zero在某种程度上部分突破了人类认知学习的能力,原理上可以习得包括围棋在内的其他观测信息是完备的、状态动作空间是可数的各种人类技艺,甚至展现出“直觉”判断能力。
人工智能的应用当然不会只是用来下棋,智能搜索、无人驾驶汽车、智能机器人……人工智能已经在试探着进入人类实际生活之中,许多人说,未来人类的大部分工作或许都将被人工智能取代。
对于这一点,卡斯帕罗夫或许有更深的感受。
作为第一个工作受到机器威胁的知识工作者,23年后2020年,卡斯帕罗夫再次回到了被“深蓝”打败的纽约一个酒店的宴会厅参加活动,他说自己已经与人工智能和平相处。
“这场比赛不是诅咒,而是福气,因为我成为了一件非常重要事情的一部分。 22年前,我的想法可能不同。”卡斯帕罗夫表示,每种技术都会在创造就业机会之前就破坏就业机会。也许在未来,人类角色将会是牧羊人。人类只需轻轻推动智能算法,将正确的机器放在正确的空间中执行正确的任务,那么剩下的事就可以交给机器来完成。
而当下,几乎所有人都认为,目前人工智能发展水平还处在初级阶段。“目前人工智能算法大多依赖高质量的海量数据,需要的功率也远高于人类大脑的能耗水平,同时也很难应用于多种场景。一个明显的例子就是,alpha go的实现方法在明确定义的环境下效果明显,而在开放环境下,结果往往不尽如人意。”
但从“深蓝”到“阿尔法狗”,人工智能已经走上了正确方向,一切才刚刚开始。