人机交互与智能的研究(2)

刘伟
查看全部 内容介绍:
收起 内容介绍:

 

 

 

武术也好,搏击也好,最重要的是得意忘形,得到意识,忘掉它的形式,要去掉形式化,得到意向性。任何一套拳术任何一套搏击的手段,都要临机而断,都要根据实际的对抗来进行调整,而不是按照套路去打。真正的人的智能,恰恰就是这样的,是临机决策而不是按照套路。

 

 

我们来梳理一下人工智能的科学起源,大家司空见惯的是人工智能的技术起源,是从1956年的美国那个学校那个人那群人开始的,但是它的科学起源,是从剑桥大学的这一群人开始的,这群人第一个当首推,查尔斯・巴贝奇,这个人是机械计算机的鼻祖,他做了一台机械的计算机,用来算SinCos这种数值的大小,用来航海,从此以后人类拉开了计算的帷幕。

 

另外,他的一个很重要的搭档,就是阿达,第二个阿达这个女性,她是剑桥三一学院,拜伦的女儿,也是大名鼎鼎的诗人――拜伦,她是世界上第一个编程的程序员,所以大家记住第一个程序员不是男性。

 

第三位,是剑桥三一学院的大名鼎鼎的伯特兰・罗素。罗素他的哲学思想和他的数学功底,使他创立了一个很重要的哲学分支――分析哲学,但是分析哲学的至高点,这个顶峰的站立者不是他,也不是他的朋友弗雷格,是另外一个很著名的――维特根斯坦。2013年的时候,全世界的哲学家投票,排第一的就是这个分析哲学的最高者――维特根斯坦,刚才提到的哈耶克是他的表弟。他是整个分析哲学集大成,他提出了两个思想,在他的前半期写了一部很重要的书,叫《逻辑哲学论》。在这部书里边,他提出语言是哲学的重要的工具,也是哲学的切入点。在此之前,大家知道,哲学的发展有两个里程碑,第一个是关于世界本原的问题,是物质的还是意识的,这个讨论了一千多年,后来出现了一个重要的人物叫笛卡尔,他开始研究方法,用什么样的方法来认识世界,是物质的还是意识的,二元论的提出。

 

在此之后,大家找到很多方法来研究哲学,但是收效甚微,直到维特根斯坦,他的出现又改变了哲学的轨迹。他研究语言,大家知道,现在自然语言处理,在人工智能里边非常火,大家不知道的是,它的起源就是维特根斯坦。他前半生研究的是关于语言的人工性,所谓人工性的语言,就是标准化的语言,格式化的语言,是这种流程性的程序化的语言,而他的后半期,主要否定了自己前半期的工作,开始研究生活化的语言,自然性的语言。他认为,真正的哲学,就是通过这种生活化的“你吃了吗?喝了吗?”这种最简单的语言里边,来体现出哲学的深奥和哲学的意义,这个思想影响了他的学生――阿兰・图灵。阿兰・图灵后来在图灵测试,和图灵机的这种思考当中,把维特根斯坦之间的交流,作为一个起始点,提出了很多匪夷所思的一些理论,让大家感觉到,人工智能有可能从科学转到技术。

 

最后一个也是剑桥三一学院的一个毕业生,他的名字叫David Marr,他是计算机视觉的鼻祖,从他开始,计算机视觉就从理论变成了科学技术,随后在美国生根发芽,然后影响全世界,大家公认他是第一个开创者。

 

所以这几个人,都和剑桥三一学院密切相关。剑桥三一学院,就是牛顿的学院,也是伟大的物理学家,麦克斯韦的学院,三个伟大的物理学家它有两个。爱因斯坦也曾经到过该学院,曾经说过,因为爱因斯坦拿到诺贝尔物理学奖的时候,是剑桥三一学院的一个毕业生(爱丁顿爵士),当时验证了他的相对论是正确的,所以他为了感谢,那个三一学院的毕业生,特地来到了剑桥三一学院,他说过,我不是站在牛顿的肩膀上,我是站在麦克斯韦的肩膀上,拿到了物理学的最高奖。

 

大家可以看出,在人工智能,在智能科学的发展的科学历程中,剑桥大学起到很重要的作用,那么现代的人工智能的发展,剑桥大学也起到了,非常重要的作用,其中有三个代表性的人物,第一个就是阿兰・图灵。阿兰・图灵他是维特根斯坦的学生和朋友,他提出了图灵测试和图灵机的思想,然后影响了整个世界。后来大家设立的图灵奖,就是为了纪念他。第二个人,就是大名鼎鼎的“深度学习之父”――Geoffrey Hinton。他是剑桥大学心理学的本科生,他后来到了爱丁堡,到了加拿大,继续做关于人工神经网络的研究,再后来,提出了“深度学习”这个概念和方法,于是整个的人工智能界,因此而得到了复兴,得到了繁荣。

 

第三个近代影响的是大名鼎鼎的Alpha Go之父――哈萨比斯,他是剑桥大学计算机学院的本科毕业生,所以剑桥大学对人工智能的发展,起着非常举足轻重的作用。

 

谈起人机交互,非常有意思的是,它和剑桥大学也有密切的关系,大家不知道的,人工智能的起源在何处,在何时?我对这个问题,进行了偶然的研究。是我在2013年访问剑桥的时候去了一个酒吧,在这个酒吧里面,我找到了人机交互的起始点,这个照片是剑桥大名鼎鼎的Eagle Bar,老鹰酒吧。在二战末期的时候,这个酒吧里面人声鼎沸,非常热闹。因为在美军和盟军轰炸欧洲大陆,和德国本土的时候,剑桥大学周围有好十几座机场,其中美国第八空军,就驻扎在剑桥郊区,他们的飞行员经常到这个酒吧来喝酒,然后第二天去执行作战任务。在执行作战任务的时候,他们发现一个非常有意思的现象,他们发现他们损失的很多的飞机,不是德国人打下来的,而是他们起飞和降落的时候,出现了各种故障。于是,盟军和英国皇家空军,委托剑桥大学圣约翰学院的Gordon IlesKenneth Craik,这两个伟大的工程师和科学家,来研究为什么会出现这个现象。在研究过程当中,他们发现在飞行员起飞和降落的时候,经常操作一些按钮,和控制一些显示器,在这些里边往往很多设计是不合理的,很多人把起落架的打开和放下,这两个按钮经常掰错,尤其在执行紧急任务的时候,所以他们就展开了世界上最早的一个现代人机交互的一个实验室,这个实验室,当时起名为应用心理学实验室,这个实验室里边,伊莱斯和克雷克是正副主任,他们在这里边,找到了大量的关于人因工程的工作,也就是人机交互的问题,后来美国人二战以后就把这些工作整理完,移到了美国著名的航空航天工程NASA里边,美国的登月里面有大量的人机交互问题,所以人机交互成为世界上越来越重要的问题。再后来,日本人从美国把人机交互问题,移植到了家电里面,形成了索尼等著名的一些家电公司,它的产品为大家所熟知。这个照片就是著名的剑桥座舱,就是二战末期,研究人机交互的座舱,这就是伊莱斯和克雷克,这两个伟大的先行者。

 

我们可以看一下,人机交互它的起源诞生于哪里呢?航空航天。咱们中国也涉及到一个人机工程、人机交互问题,它的起源点是在北航。当时钱学森先生,在创立航空航天这个部门的时候,当时就提出了,人机环境系统工程的想法,再后来,我的导师袁修干先生,在钱先生等老一辈科学家的指导下,来具体的,做了一些具体的工作,在北航成立了第一个博士点,叫人机环境系统工程,然后主要是研究一些关于飞机里面飞行员和飞机之间交互的问题,后来浙江大学、清华大学、北京大学也有一些研究者,纷纷的做了相应的工作。另外,我想给大家强调的一点是,最近的人机交互里边,有一个伟大的女科学家,起到了举足轻重的作用,她的名字叫Mica Endsley。这个女科学家,她提出了一个很重要的一个词叫situation awareness,态势感知也叫情景意识。这个词的出现,引发了人机交互、人工智能的一个很重要的发展,她这个科学家非常谦虚,她认为这个词的提出不是她提出来的,是她总结一个中国长者的理论,这个长者就是著名的军事家《The Art of War》, 《孙子兵法》的提出者­――孙子。因为在《孙子兵法》的阅读中,她发现态势感知和情景意识,或情景意识,对整个人机交互的影响非常大。

 

那么什么是“situation awareness”这个概念呢?众说纷纭,莫衷一是。但是1988年,EndsleyHuman Factor年会上,提出了正式的一个定义,并为大家所广泛接受。这个定义就是,所谓的态势感知,情境感知,或者情景意识,它就是在一定的时间和空间内,对环境中的各组成成分,进行感知、理解,进而预测这些成分的随后变化状况,这就是情境感知、态势感知,或者情景意识。好,我们可以看出,在整个人类的发展过程当中,智能科学的发展迅猛有力,这个科学的发展的基础学科,往往是非常多的,这个非常多的学科里边包含了以下几种,包括心理学、计算机科学、神经科学、哲学、语言学等等,这些学科构成的,一个完整的学科体系,总称为认知科学。

 

人机交互、人工智能和认知科学,是非常密切的一对孪生兄弟,正可谓是,以前所谓科学就是分科而学,是把整个大自然的一些事物,分成不同的学科来进行研究,于是,出现了物理、化学、数学、社会学等等。现在有一个趋势,就是通过认知科学,把各个学科收拢在一起,进行综合研究,正可谓分久必合,合久必分,这个中国的一个老话。

 

好,我们可以看一下,在整个研究过程当中,通过研究人、人机、人机环境,来得出一个什么结论?整个的发展趋势,在这个发展趋势当中,人机环境系统工程的发展,最为迅速,也最为全面,它的定义是什么?什么是人机环境系统工程?我们可以看一下下面的这个PPT,它大概是这样说,人机环境系统工程,就是研究在人、装备和环境系统之间,实现最优匹配的一个领域,涉及到信息的输入、处理、输出和控制,以及反馈,人机环境系统的整体设计,及其优化等方面的研究,研究的目的,是整个系统高效、安全、健康、和谐、敏捷等等。

 

好,我们看现在的研究现状,出现了很多的分支,比如说,像人机交互、普适计算、情感计算,这些基本的理论和方法,产生了很多相应的关键技术,比如说多模感知、上下文感知、情感智能、环境智能、认知智能、多模界面、感性界面,来实现一个最基本的目标,是自然的人机交互。在这个自然的人机交互当中,大家一定要关注,一个很重要的概念,就是数据。所有智能的产生,与刺激和数据密切相关。所谓刺激,就是人感知到的外部的映射。所谓数据,是机器接触到的外部的输入,通过这两个来产生相应的融合、理解,进而进行什么?相应的反应和规划。

 

其中,对于计算机来说,数据空间是起着非常重要的作用,如何研究数据?如何研究数据的多指向性?是人机一个难点和瓶颈,比如说,我说两个数字“2”和“3”,“2”和“3”这两个数字大家司空见惯,如果把它整合在一起23,一般人来说很难理解它表示表征什么意思。如果我再加一个概念,再加一个数据,篮球,大家很容易指向了迈克尔乔丹。所以这个数据的多指向性,是人机的区别的一个最重要的方面,人可以理解一个数据的多指向,多含义,而机器不然,机器它有规范,有规则,它只能从一个角度,来看待这个数据,所以,人机的区别就此拉开。

 

另外,大家可以看,最近的人工智能的三大主要标志是什么?是深蓝、沃森和Alpha Go, 这三个系统里边都是和数据有关,它们都是在处理过去的大量的数据,过去的很多的规则,过去很多的规划,但是这三个最顶级的系统,都有一个很重要的问题,一个瓶颈问题,就是它只能得形忘意,它不能够得意忘形。

 

大家知道最近一段时间,有一个搏击高手,挑战了太极大师,然后他20KO他,然后他说了,武术只是一个什么?只是一个花拳绣腿,实际上当然了,他这个语言里边,有很多不妥之处,但是他说了一个很重要的问题,就是说,武术也好,搏击也好,最重要的一个方面是得意忘形,得到意识,忘掉它的形式,就是要去掉它的形式化,得到它的意向性。任何一套拳术任何一套搏击的手段,都要临机而断,都要根据实际的对抗来进行调整,而不是按照套路去打。真正的人的智能,恰恰就是这样的,是临机决策而不是按照套路,像计算机一样,像人工智能一样,按照套路去运算去计算。人是算计,算计要比计算灵活的多。

 

 

读书人简介:

作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!

读书人简介:

作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!