人工智能统治人类?先得打开认知智能这扇门(一)
录入者:15959541500 人气指数: 次 发布时间:2021年04月24日
出品:新浪科技《科学大家》、墨子沙龙
撰文:周熠 博士、上海脑科学与类脑研究中心类脑计算研究组研究员
回顾整个人类的发展历史,人类文明高度整体上几乎是呈现着指数上升的趋势。我们花了很长的时间来感知自然界,但实际上人类目前的感知能力跟大猩猩、猴子等动物差不多。大约在250万年前,人类祖先发生了认知革命,从感知到认知,开始认知自然界。到了大概1.2万年前,人类祖先又经历了一个新的革命,也就是从认知自然界到改造自然界。而在约500年前的文艺复兴后,人类的认知能力又有了一次飞跃:从改造自然界到创造自然界。直至现在,人类文明在不断攀登新的高度。
对机器而言,大抵也要经历这样的过程,也要遵循一个类似的发展曲线。刚开始的时候,可能还是得先从感知做起,这也是现在人工智能正在做的,而且做得相对比较成功。某种意义上,现在人工智能正在经历一个所谓的范式转变(paradigm shift),即从感知智能到认知智能的范式转变。
人类通过视觉、听觉、触觉、味觉等等,去感知自然界,得到一些初步的信息。认知则是在感知的基础之上,理解这些对象并且产生知识,做出决策。某种意义上,从感知到认知是整个行为决策过程中的两个不同的环节。为什么说从感知智能到认知智能是一个很重要的变化呢?为什么认知智能特别难?现在到底做的怎么样了?
感知智能与认知智能
很多社会新闻中的当事人,作出了看上去不太明智的决定。大家看了之后,可能会觉得这些人做的事情很“蠢”。但请仔细想一想,这些人在感知自然界的时候,他们很蠢吗?其实并不是,他们和其他人的正常感知是一模一样的。只是他们在做认知的时候、在做决策的时候做了一些我们觉得很愚蠢的事情。实际上,从感知到认知的跨度很大,我们觉得生活中有些小伙伴们比较愚蠢的行为,机器也并不能做得比他们好多少。这大概是现在人工智能所处的状态。
简而言之,从感知智能到认知智能,人工智能还有很长的路要走。
如果再比较一下动物和人类,感知和认知的区别就更加明显了。人类是对地球,但事实上我们感知的能力并不比动物强。论速度比不上豹子,论力量比不过熊,论视觉比不过鹰,论嗅觉比不过狗。但是为什么我们成为了地球的主宰,因为我们有很强的认知能力。在感知之上,我们可以总结经验,得到知识,创造新的知识,从而成为了万物灵长。
以上种种都大约能传递一个信息:认知跟感知很不一样,它很关键,是人类能够变得一枝独秀的最重要的原因。
那么机器到底在感知和认知上做得怎么样?
在感知智能上,目前机器智能正在接近和逼近人类,已经做得很不错。比方说,现在已经被广泛应用的人脸识别,在火车站等公共场所中都已开始广泛应用;再有语音识别,这方面也做得非常好,可以把语音方便地转成文字;还有光学字符识别,对于报销单等,可以直接提取出一个结构化的文档来。可以说,在感知智能这个层次上面,基于深度学习的一些技术在某种意义上已经能够跟人类媲美了。
那么认知智能呢?其实认知智能领域也取得了很多突破,例如国际象棋和围棋方面的迅猛进步。1997年时人工智能便能击败人类的国际象棋冠军;而两年前,AlphaGo横空出世,在围棋上横扫人类;2011年的时候,IBM做了一个叫“沃森”的机器人,在类似于“开心词典”的知识抢答竞赛中,击败了人类的世界冠军。很多小伙伴在玩游戏时可能会感受到人工智能的能力,像星际争霸、王者荣耀等等游戏中,人工智能都有了很多不错的尝试,而且已经取得了很好的成绩。
但为什么我们还会说认知智能任重道远呢?不少人应该都看过2015年Alpha机器人挑战赛的失败集锦视频。虽然在演讲、报道时得到传播的往往都是行业发展的正面消息,但事实上这些反面的或者失败的经历同样很重要。它告诉我们人工智能的边界在哪,到底什么事情做得好,什么事情做得不好。当然,相比2015年的技术水平,现在的机器人技术已经突飞猛进了。比方说从2015年到现在,以波士顿动力为代表的一些公司研发的阿特拉斯机器人、“机器大狗”等产品,在平衡性上面已经做得很好了。
但是在一些特别简单的认知任务上,人工智能却出人意料得差。比如开一个阀门、开一扇门,在这些事情上面,机器人比大家想象的要差非常得多。某种意义上,现在的机器人技术根本没有办法打开任意一扇门。因为有不同的门,不同的把手,不同的开门方法。而机器人要用统一的方法来做“开门”这件事情,这是非常困难的。
认知智能在某些点上已经做得很不错了,但是反过来在有些很简单的事情上面,其实还做得特别糟糕。这是因为人跟机器不是一个物种,人跟机器有本质上的区别,某些人看起来特别难的事情,对机器并没有那么困难。比方说下国际象棋,对机器来说,它就是个搜索问题,而对人来说,因为搜索能力没达到那个程度,运算量、运算智能不足,才会觉得这个事情非常困难,需要有很多的知识和技巧,大量的高强度训练。
反过来,在有些人看起来特别简单的事情,机器会觉得非常的困难。就拿“开门”来说,世上有无数的不同类型的门,没有办法将其穷尽并定义成几种不同的开门方式。另外一个很难的事情就是所谓的常识知识,比方说下雨的时候地面会湿,这一类的信息。虽然对一般人来说这些常识都是一些不需要特别注意的信息,但这些常识知识非常多、非常复杂,处于不同的领域,所以对机器来讲就很难获取。
所以每当有人问:机器是不是要毁灭人类之类的问题,我只好笑一笑:让它先去开个门试一试!
什么是认知智能?
那么我们又该怎么定义“认知智能”呢?或许我们可以先从词源的角度探讨一下。简而言之,“认知”基本上等于“认识知识”。尼尔森说过,人工智能某种意义上是关于知识的科学。
在牛津词典里,关于智能、关于认知这些词的解释会经常变。其中有一个解释是这样的:智能是获取和使用知识和技巧的能力。认知是一个心理状态过程,也是获取知识并且去理解这些知识的能力。某种意义上,认知智能的核心就是怎么去认识知识,也就是说,它是关于知识处理方面的能力。
这方面的能力有三点是必备的,也是非常本质的。第一,需要把知识编码出来,即要进行知识表示或者知识编码。第二,怎么去获取这些知识,不管是常识知识也好,专业知识也好,不管是开门也好,下围棋也好,这知识到底怎么来的?第三,假设知识已经有了,到底怎么去运用这些知识解决问题。