围棋是人工智能领域的一个具有标志性的挑战,现在“阿尔法狗”战胜了世界冠军李世石,是否意味着霍金对人工智能的担忧将成为现实?人工智能对人类生存的威胁会超过核武器吗?对于这一重大问题,一些人工智能的支持者却不这么认为。
2016年3月13日,世界围棋冠军李世石执白在第78手下出“神之一手”战胜“阿尔法狗”(AlphaGo)。而在此前的三次对垒中,李世石无论执黑执白,都没有还手之力,在人类一直引以为傲的围棋领域,人工智能战胜人类已成定局。
正如谷歌董事长施密特表示:“这次无论谁胜谁负,实际上都是人类的胜利,因为正是因为人类的努力,才让机器学习有了现在的进展和突破。”
从象棋到围棋,人工智能已经攻克了人类最复杂的封闭博弈系统。如今,网上流传着一句话:“人工智能像一列火车,你听到了隆隆声,你盼着它来。它到了,一闪而过,便远远地把你抛在身后。”
在围棋上战胜人类后,人工智能真的让人担心吗?
从“算”到“想”
举世瞩目的“阿尔法狗”和李世石对战,并不是历史上第一次人机对战的棋类运动。1997年,IBM的“深蓝”战胜了俄罗斯国际象棋大师卡斯帕罗夫。当时,“深蓝”2胜1负3平的战绩让卡斯帕罗夫深受打击。后来,IBM还拒绝了卡斯帕罗夫的再战请求,拆卸了“深蓝”,让给他至今无法找“深蓝”复仇。
卡斯帕罗夫的遗憾并不无理由——今天,“深蓝”的确算不上“聪明”的电脑。“深蓝”主要依靠强大的计算能力穷举所有路数来选择最佳策略。依靠硬算,“深蓝”可以预判12步棋,而卡斯帕罗夫可以预判10步,二者势均力敌。
当然,“深蓝”必须具有相当的计算速度。据认为,“深蓝”实际上是一台超算机,有480颗特别制造的象棋芯片,下棋程序以C语言写成,运行AIX操作系统,其计算能力在世界超级电脑中排名第259位。
然而,围棋在复杂程度和组成数量上远超国际象棋,是目前最复杂的博弈类封闭游戏。2015年1月28日,Nature杂志在封面论文中称,围棋是人工智能领域一个具有标志性的“大挑战”,源于围棋“巨大的搜索空间、很难估计局面和下子”。围棋棋盘上每一点,都有黑、白、空三种情况,棋盘上共有361个点(19乘19),理论上可能产生的局数为3的361次方种。这个数字大概是10的170次方,比已观测到的宇宙中原子数量还多。国际象棋只有10的46次方。
除了棋盘大,围棋在下棋过程中还会出现“吃子”的情况,更加剧了其复杂性。曾任职谷歌公司的李开复说,当年“深蓝”与卡斯帕罗夫的对局,实际上使用的是人工调整的评估函数,并用特殊设计的硬件和“暴力”(brute-force)的搜索征服了国际象棋级别的复杂度。
围棋则不行。“因为它的搜索太广,每步的选择有几百而非几十。也太深,一盘棋有几百步而非几十步。”李开复在知乎上回答称。
所以,只靠算,计算机恐怕无法学会下围棋。在“阿尔法狗”问世前,最成功的围棋计算机程序能达到业余人类选手的程度,但还不能和专业选手在不让子的情况下平局。2014年初,围棋程序“疯狂的石头(Crazy stone)”在一次比赛中战胜九段棋手依田纪基。但是当时是在人类棋手让出4子的情况下赢得比赛。
开发这款程序的法国程序员Rémi Coulom在得知李世石将在不用让子的情况下对战谷歌公司的“阿尔法狗”时,感到既兴奋,又有些难以置信。他表示,这是人工智能巨大的进步,而他原本以为这一天将在十年后到来。
在“疯狂的石头”的设计中,Coulom使用了被称为“蒙特卡洛树”的搜索技术。这种算法对大量随机过程进行统计评估,得出一个最优的解法。也就是说,蒙特卡罗算法对计算进行了筛选,数据库中的低胜率选择直接抛弃,放弃了穷举法中那些大量消耗计算资源,但却没有意义的计算,使其对具有高胜率的选择有更加精确的计算和分析。
加拿大艾伯塔大学计算机科学家乔纳森·谢弗曾设计程序提高计算机的国际跳棋水平,试图遇到了瓶颈。他发现,就算使用了蒙特卡洛树算法简化了运算,计算机依然无法获得人类高手拥有的“棋感”。
作为一名围棋爱好者,Deep Mind公司的CEO哈萨比斯也表示,人类顶级大师中,走法很多时候依靠直觉。在他的理解中,“棋感”是指棋手能够根据形势分析攻防线路,还需要对棋形进行审美,这也是围棋几千年来让人着迷的原因。所以,从2014年开始,包括脸书(Facebook)、谷歌的Deep Mind等人工智能研究团队都将使程序模仿人类的直觉作为围棋人工智能的突破方向。
直到论文发表的前一天,即1月27日,Deep Mind团队在Nature杂志网站上宣布:“谷歌公司的人工智能掌握了古代围棋。”
像人类那样学习和进化
3月9日,人机大战的第一场中,“阿尔法狗”获胜。
接受美国科技媒体“The Verge”采访时,哈萨比斯表示,看到比赛中“阿尔法狗”的特殊举动,他感到有些意外。哈萨比斯从“阿尔法狗”的棋风上看出了“侵略和大胆”。
李世石以好战而闻名,首场比赛一开始,他就在整个棋盘上假装求战。传统的围棋程序在处理这种情况时非常无力。而哈萨比斯看到,“嗯,它在比赛中戏耍了李世石”。
而在第四场的较量中,序盘双方不相上下。从第78手开始,当李世石连下三步妙手之后,“阿尔法狗”开始应对不及,出现了很多“问题手”,直接导致101手出现低级错误。李世石觉得,阿尔法围棋有两个弱点,一是它执黑时下得困难,二是它遇到没想到的一手棋时应对能力下降。
在与李世石对战前,2015年10月,“阿尔法狗”已经与欧洲围棋冠军樊麾进行了比赛,樊麾以0比5失败。“‘阿尔法围棋’的棋风很像人,如果是在网络上对局,恐怕猜不到对手是个计算机程序。”樊麾在赛后说。
1950年,图灵在曼彻斯特大学提出了著名的“图灵测试”理论,代表着人工智能的概念被初步提出。图灵提出,一个人和一台机器隔开的情况下接受测试,当提问者不断提出各种问题来判别回答者是人还是机器时,如果机器有30%的回答骗过了提问者,这台机器就通过了测试,被认为具有人类智能,即人工智能。
毫无疑问,“阿尔法狗”通过了“图灵测试”。
中科院计算所副研究员陈天石告诉南方周末:“‘阿尔法狗’的核心思想是深度学习和增强学习。”
他指出,深度学习的核心思想是大规模、深层的人工神经网络。正是依靠神经网络,当面对新问题时,“阿尔法狗”能像人类一样从以往的经历中总结出经验来解决问题,而不再用扔硬币式的穷举法来试图寻找概率最大的解决方案。
神经学家的研究成果告诉我们,大脑由神经细胞和突触组成,突触和神经细胞间的电信号形成了意识。微观上来说,神经通路每接通一次,人的意识和行为就将得到一次正面的强化,这就是学习的过程。
早在冯·诺依曼时代,科学家也想用电脑模拟大脑,神经细胞和突触分别对应计算单元和通路。虚拟的“大脑”接受任务时,调用不同的信号通路去执行,任务成功则该通路得到“正面强化”。
神经网络系统模仿以人类大脑为原型的信息处理模式,使神经网络可以根据特定的输入产生特定输出,并实现图片识别、语音识别等功能。
2015年,谷歌在2015I/O大会上推出了图像识别技术。据该项目的工程师介绍,这一图像识别系统具有30层神经网络,每一层对应着不同的抽象程度,比如最低层次能识别光线、色彩,下一层次能识别图片的边缘等等。这样一层层的“训练”需要大量的数据。每一层都能提取出更高层次的细节,而最后一层会决定AI对图片的理解。
不过,这项技术最后呈现的结果让人啼笑皆非。在测试中,当提问者输入“哑铃”的时候,系统输出了带手臂的哑铃。这说明,在输入学习的图片库中,哑铃从来都是和手臂一起出现的。而输入一张满是噪点的图片,系统输出了“香蕉”。尽管这项技术的精确度还不高,但这已经足够说明神经网络如何让机器学习到知识。
“阿尔法狗”的神经网络具有增强学习的功能。“增强学习的核心思想则是不直接给信号而让机器学习模型通过多次反馈得到改进。“陈天石说。
Deep Mind公司的工程师为“阿尔法狗”做了两个神经网络。早在1月28日Nature杂志发表的论文中提到,“阿尔法狗”会利用“价值网络”预测局面,“策略网络”负责选择下一步走法。
自项目启动以来,程序员在程序中录入了多达3000万步职业棋手的棋谱,用增强学习的方法训练“阿尔法狗”,让它自己下棋,研习棋谱。这将预测对手下一步棋落子的准确率提升到57%。随后让系统进行自我博弈,计算出比已经学习到的棋谱更多新的落子策略,战胜人类就要靠这些新的东西。
Deep Mind的工程师David Silver表示:“在与其它神经网络和它自己对战数百万局后,‘阿尔法狗’学会了自己发现新策略,并逐渐提高了水平。”
陈天石表示,深度学习和增强学习的结合在业界被称为“深度增强学习”,也就是大家俗称的“人工神经网络的自我进化”。
在战胜樊麾后,工程师们将“阿尔法狗”的硬件从1202个CPU增加到1920个CPU,加上超强的学习能力,“阿尔法狗”迅速完成自我进化,最终“耍”了顶尖棋手。
2016年1月28日Nature杂志封面。正是发表在这一期杂志上的论文,奠定了人工智能战胜人类的基础。(南方周末资料图/图)“奇点”来临了吗?
在科幻电影《超验骇客》中,约翰尼·德普饰演的科学家因为研发人工智能而被恐怖组织暗杀,临死之前仓促地将自我意识上传至电脑中。最后,这名科学家成为一个能够不断进化的结合生物智慧和人工智能的“超级计算机”。
“阿尔法狗”战胜李世石之后,人工智能通过自我进化增加智慧已经变为现实。搜狗CEO王小川认为,人工智能能做到随着时间推移变得越来越聪明,正如金庸小说中老顽童让自己左手和右手“左右互搏”练就天下无敌的武功。
“在下棋这个领域,‘阿尔法狗’这样一台在算法上没有天花板的机器,将有机会登峰造极。”王小川评价说。
并非所有人都对人工智能报以乐观的态度。早在1993年,美国科幻作家弗诺·文奇在《即将到来的技术奇点》一文中写道:“在未来30年间,我们将有技术手段来创造超人的智慧。不久后,人类的时代将结束。”在他的描述中,所谓“技术奇点”是指在未来的某个时期,当机器达到“强人工智能”时,其智商将超过人类,从而对人类社会造成巨大的冲击。
而自称美国未来学家的库兹韦尔则在他2005年出版的《奇点临近》一书中,把“技术奇点”进一步转述为“奇点理论”。他写道:“2045年将出现‘奇点’时刻,人类文明走到终点,生物人将不复存在,取而代之的是一个叫做‘奇点人’的新物种。”
霍金也对人工智能表示极度担忧。他说:“人工智能开发成功将会是人类历史上最大的事件。但不幸的是,这可能也会是最后一个大事件。”去年,霍金还与特斯拉创始人伊隆·马斯克、苹果计算机共同创办人史蒂夫·沃兹尼克等数百名顶尖精英发表联署公开信,表示人工智能对人类生存的威胁更甚于核子武器。
霍金认为,特别是高科技军事装备的普及,如美军在战场上大量使用无人机远程杀敌,或多或少印证了这种忧虑。
不过,人工智能研究者则认为,这多半属于杞人忧天。陈天石告诉南方周末,“阿尔法狗”虽然展示了非凡的才能,但人工智能不大可能像人们想象的那样进步神速。早在上世纪八十年代,人工神经网络的算法基础就已经基本构建好,但那时处理器的运算能力上不去,使人工神经网络的威力不能完全发挥。“阿尔法狗”的成功展示了计算系统(即处理器芯片)运算能力的进步。
“随着芯片摩尔定律的终结,处理器芯片的运算能力不再高速增长,人工智能也很可能会进入一个瓶颈。”陈天石说,“我们距离真正的强人工智能还差得很远,也许五十年,也许一百年,或者更久。”
“阿尔法狗”的支持者们认为,今天我们不仅无需为人工智能感到担心,反而应该感到高兴。
李开复指出,基于深度学习的人工智能,未来将创造更多价值,包括更准确地计算投资回报率、个性化的精准医疗、搜索引擎更贴近的推荐结果等等。
目前,哈萨比斯正同英国政府合作,利用人工智能提高英国全国医疗服务体系的效率。人工智能也会让手机软件更个性化,成为使用者的贴心助手。他预计,市场会在四五年内看到这类产品。
当然,伦理问题可能是人工智能目前面临的最大困局。加拿大温莎大学哲学研究者马塞洛·戈里尼表示,只有彻底解决伦理方面的问题,人工智能才能取得实质性进步。
随着越来越多的汽车厂商开始研发无人驾驶汽车,学者们对无人驾驶汽车遇到紧急情况时的处理方式给予了极大的关注。2015年5月,由华盛顿智库布鲁斯金学会举办的一次论坛上,有人提出,为保护自己或乘客,汽车突然刹车该如何规避后车碰撞,或者,汽车为规避行人而突然转弯又如何避免撞倒其他人?
参加这次论坛的德国西门子公司工程师卡尔·库恩认为,研究人员应该研发能在“二个坏主意”之间做出正确选择的人工智能。