从“深蓝”到“阿尔法狗”，人工智能发展的一大步-z6尊龙旗舰厅

日期：2020-05-13 【来源 : 新民周刊】阅读数：0

阅读提示：超越人类的思维限制，创造出一种能够自我学习、自我进步的超级大脑，一直是人类的终极梦想。

作者｜周　洁

对于人工智能来说，1997 年5月11日是历史性的一天。

　　ibm的超级计算机“深蓝”（deep blue）以2胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里·卡斯帕罗夫，一时间全球轰动。

　　“深蓝”的设计者们在当时就想到了下一个小目标：“何时计算机也能下围棋呢？”

　　2016年3月15日，谷歌围棋人工智能“阿尔法狗”（alpha go）与韩国棋手李世石对弈并以4：1的成绩获胜，这场“人机大战”成为人工智能史上一座新的里程碑，也再次为人工智能技术做了科普——

　　从“深蓝”到“阿尔法狗”，这二十多年的发展似乎也在预示着，人工智能终将改变人类的生活。

计算机的胜利

　　超越人类的思维限制，创造出一种能够自我学习、自我进步的超级大脑，一直是人类的终极梦想。

　　ibm的“深蓝”最早可以追溯到1985年，当时卡内基梅隆大学的博士生许峰雄开始开发一种名为“芯片测试”的国际象棋电脑“深思”(deep thought)（来源于科幻小说《银河系漫游指南》中的一台机器）。后来，许峰雄和他的同事被ibm聘用，继续从事国际象棋的研究工作。

　　卡斯帕罗夫是国际象棋史上最伟大的棋手之一，他不仅精通国际象棋，还是一位数学家、计算机专家，并且精通15国语言。他的棋风活泼，有异常敏锐的感知判断力，对弈时常常能以出人意料的策略赢得比赛。

　　卡斯帕罗夫曾在1989年的两场比赛中轻松击败“深思”，于是ibm团队继续改进他们的超级计算机，1993年将其重新命名为“深蓝”，这是deep thought和ibm蓝色logo的组合。

　　1996年2月17日，卡斯帕罗夫对阵ibm“深蓝”计算机，最终，卡斯帕罗夫以4:2战胜“深蓝”，一举夺得40万美元奖金。

　　这场比赛给许峰雄团队带来了信心，因为出乎他们的意料，世界象棋冠军在第一场比赛中输给了“深蓝”。比赛结束后，许峰雄团队一直在为“深蓝”做升级，升级后，“深蓝”每秒可以检测2亿个不同的国际象棋位置。

　　1997年5月3日，又一场人机大战开始了。卡斯帕罗夫赢了第一场，深蓝赢了第二场。第三、第四和第五局以平局告终。5月11日，深蓝以3.5比2.5的比分赢得了第六场比赛。

　　对于这场胜利，“深蓝”设计者许峰雄认为，这主要是依靠“深蓝”强大的计算能力穷举所有路数来选择最佳策略：“深蓝”靠硬算可以预判12步，卡斯帕罗夫可以预判10步。

　　如今“深蓝”的性能已经不再值得一提，就cpu来说，早在2006年，英特尔推出的第一代酷睿2就已经超过了“深蓝”，我们国家超级计算机天河二号的浮点运算能力，则是“深蓝”的30万倍。

　　但计算机战胜人类的开端，则为人工智能的从业者带来了更大的想象空间。

从“算”到“学”，人工智能发展的一大步

　　从今人的角度来看，“深蓝”还算不上足够智能，它的算法核心是暴力搜索：生成尽可能多的走法，执行尽可能深的搜索，换言之，它每走一步，几乎都是在遍历后续所有可能的情况下作出的决策。

　　因此，很多人认为这是计算机的胜利，而不是人工智能的胜利。

　　但2016年一战成名的alpha go不同。围棋和国际象棋在复杂程度上不可同日而语，围棋变数极多，一回合有250种可能，而一盘棋可以长达150回合。显然“深蓝”式的硬算在围棋上行不通。

　　alpha go胜利的秘诀不仅仅是计算机强大的计算能力，更依赖其精妙的算法。alpha go的算法的核心则依靠强化学习、深度学习和蒙特卡洛树搜索。“强化学习让alpha go有了自学能力，深度学习让alpha go通过数据驱动的机器学习有了估值量化能力，蒙特卡洛树则是一个连接所有技术和动作的框架。”

　　“感觉就像一个有血有肉的人在下棋一样，该弃的地方也会弃，该退出的地方也会退出，非常均衡的一个棋风，真是看不出出自程序之手。”柯洁曾这样评价alpha go。

　　2017年，alpha go进一步升级为新版程序 alpha go zero：从空白状态学起，在不利用人类任何围棋比赛数据作为训练数据的条件下，它能够迅速通过2900万次自我博弈、自学围棋，并以 89比11 的战绩击败“前辈”。

　　有专家形容alpha go zero在某种程度上部分突破了人类认知学习的能力，原理上可以习得包括围棋在内的其他观测信息是完备的、状态动作空间是可数的各种人类技艺，甚至展现出“直觉”判断能力。

　　人工智能的应用当然不会只是用来下棋，智能搜索、无人驾驶汽车、智能机器人……人工智能已经在试探着进入人类实际生活之中，许多人说，未来人类的大部分工作或许都将被人工智能取代。

　　对于这一点，卡斯帕罗夫或许有更深的感受。

　　作为第一个工作受到机器威胁的知识工作者，23年后2020年，卡斯帕罗夫再次回到了被“深蓝”打败的纽约一个酒店的宴会厅参加活动，他说自己已经与人工智能和平相处。

　　“这场比赛不是诅咒，而是福气，因为我成为了一件非常重要事情的一部分。 22年前，我的想法可能不同。”卡斯帕罗夫表示，每种技术都会在创造就业机会之前就破坏就业机会。也许在未来，人类角色将会是牧羊人。人类只需轻轻推动智能算法，将正确的机器放在正确的空间中执行正确的任务，那么剩下的事就可以交给机器来完成。

　　而当下，几乎所有人都认为，目前人工智能发展水平还处在初级阶段。“目前人工智能算法大多依赖高质量的海量数据，需要的功率也远高于人类大脑的能耗水平，同时也很难应用于多种场景。一个明显的例子就是，alpha go的实现方法在明确定义的环境下效果明显，而在开放环境下，结果往往不尽如人意。”

　　但从“深蓝”到“阿尔法狗”，人工智能已经走上了正确方向，一切才刚刚开始。

※z6尊龙旗舰厅的版权作品，未经新民周刊授权，严禁转载，违者将被追究法律责任。

从“深蓝”到“阿尔法狗”， 人工智能发展的一大步-z6尊龙旗舰厅

从“深蓝”到“阿尔法狗”，人工智能发展的一大步-z6尊龙旗舰厅