人机交互与智能的研究（2）--刘伟

查看全部内容介绍：

......更多详情>>

收起内容介绍：

武术也好，搏击也好，最重要的是得意忘形，得到意识，忘掉它的形式，要去掉形式化，得到意向性。任何一套拳术任何一套搏击的手段，都要临机而断，都要根据实际的对抗来进行调整，而不是按照套路去打。真正的人的智能，恰恰就是这样的，是临机决策而不是按照套路。

我们来梳理一下人工智能的科学起源，大家司空见惯的是人工智能的技术起源，是从1956年的美国那个学校那个人那群人开始的，但是它的科学起源，是从剑桥大学的这一群人开始的，这群人第一个当首推，查尔斯・巴贝奇，这个人是机械计算机的鼻祖，他做了一台机械的计算机，用来算Sin和Cos这种数值的大小，用来航海，从此以后人类拉开了计算的帷幕。

另外，他的一个很重要的搭档，就是阿达，第二个阿达这个女性，她是剑桥三一学院，拜伦的女儿，也是大名鼎鼎的诗人――拜伦，她是世界上第一个编程的程序员，所以大家记住第一个程序员不是男性。

第三位，是剑桥三一学院的大名鼎鼎的伯特兰・罗素。罗素他的哲学思想和他的数学功底，使他创立了一个很重要的哲学分支――分析哲学，但是分析哲学的至高点，这个顶峰的站立者不是他，也不是他的朋友弗雷格，是另外一个很著名的――维特根斯坦。2013年的时候，全世界的哲学家投票，排第一的就是这个分析哲学的最高者――维特根斯坦，刚才提到的哈耶克是他的表弟。他是整个分析哲学集大成，他提出了两个思想，在他的前半期写了一部很重要的书，叫《逻辑哲学论》。在这部书里边，他提出语言是哲学的重要的工具，也是哲学的切入点。在此之前，大家知道，哲学的发展有两个里程碑，第一个是关于世界本原的问题，是物质的还是意识的，这个讨论了一千多年，后来出现了一个重要的人物叫笛卡尔，他开始研究方法，用什么样的方法来认识世界，是物质的还是意识的，二元论的提出。

在此之后，大家找到很多方法来研究哲学，但是收效甚微，直到维特根斯坦，他的出现又改变了哲学的轨迹。他研究语言，大家知道，现在自然语言处理，在人工智能里边非常火，大家不知道的是，它的起源就是维特根斯坦。他前半生研究的是关于语言的人工性，所谓人工性的语言，就是标准化的语言，格式化的语言，是这种流程性的程序化的语言，而他的后半期，主要否定了自己前半期的工作，开始研究生活化的语言，自然性的语言。他认为，真正的哲学，就是通过这种生活化的“你吃了吗？喝了吗？”这种最简单的语言里边，来体现出哲学的深奥和哲学的意义，这个思想影响了他的学生――阿兰・图灵。阿兰・图灵后来在图灵测试，和图灵机的这种思考当中，把维特根斯坦之间的交流，作为一个起始点，提出了很多匪夷所思的一些理论，让大家感觉到，人工智能有可能从科学转到技术。

最后一个也是剑桥三一学院的一个毕业生，他的名字叫David Marr,他是计算机视觉的鼻祖，从他开始，计算机视觉就从理论变成了科学技术，随后在美国生根发芽，然后影响全世界，大家公认他是第一个开创者。

所以这几个人，都和剑桥三一学院密切相关。剑桥三一学院，就是牛顿的学院，也是伟大的物理学家，麦克斯韦的学院，三个伟大的物理学家它有两个。爱因斯坦也曾经到过该学院，曾经说过，因为爱因斯坦拿到诺贝尔物理学奖的时候，是剑桥三一学院的一个毕业生（爱丁顿爵士），当时验证了他的相对论是正确的，所以他为了感谢，那个三一学院的毕业生，特地来到了剑桥三一学院，他说过，我不是站在牛顿的肩膀上，我是站在麦克斯韦的肩膀上，拿到了物理学的最高奖。

大家可以看出，在人工智能，在智能科学的发展的科学历程中，剑桥大学起到很重要的作用，那么现代的人工智能的发展，剑桥大学也起到了，非常重要的作用，其中有三个代表性的人物，第一个就是阿兰・图灵。阿兰・图灵他是维特根斯坦的学生和朋友，他提出了图灵测试和图灵机的思想，然后影响了整个世界。后来大家设立的图灵奖，就是为了纪念他。第二个人，就是大名鼎鼎的“深度学习之父”――Geoffrey Hinton。他是剑桥大学心理学的本科生，他后来到了爱丁堡，到了加拿大，继续做关于人工神经网络的研究，再后来，提出了“深度学习”这个概念和方法，于是整个的人工智能界，因此而得到了复兴，得到了繁荣。

第三个近代影响的是大名鼎鼎的Alpha Go之父――哈萨比斯，他是剑桥大学计算机学院的本科毕业生，所以剑桥大学对人工智能的发展，起着非常举足轻重的作用。

谈起人机交互，非常有意思的是，它和剑桥大学也有密切的关系，大家不知道的，人工智能的起源在何处，在何时？我对这个问题，进行了偶然的研究。是我在2013年访问剑桥的时候去了一个酒吧，在这个酒吧里面，我找到了人机交互的起始点，这个照片是剑桥大名鼎鼎的Eagle Bar，老鹰酒吧。在二战末期的时候，这个酒吧里面人声鼎沸，非常热闹。因为在美军和盟军轰炸欧洲大陆，和德国本土的时候，剑桥大学周围有好十几座机场，其中美国第八空军，就驻扎在剑桥郊区，他们的飞行员经常到这个酒吧来喝酒，然后第二天去执行作战任务。在执行作战任务的时候，他们发现一个非常有意思的现象，他们发现他们损失的很多的飞机，不是德国人打下来的，而是他们起飞和降落的时候，出现了各种故障。于是，盟军和英国皇家空军，委托剑桥大学圣约翰学院的Gordon Iles和Kenneth Craik，这两个伟大的工程师和科学家，来研究为什么会出现这个现象。在研究过程当中，他们发现在飞行员起飞和降落的时候，经常操作一些按钮，和控制一些显示器，在这些里边往往很多设计是不合理的，很多人把起落架的打开和放下，这两个按钮经常掰错，尤其在执行紧急任务的时候，所以他们就展开了世界上最早的一个现代人机交互的一个实验室，这个实验室，当时起名为应用心理学实验室，这个实验室里边，伊莱斯和克雷克是正副主任，他们在这里边，找到了大量的关于人因工程的工作，也就是人机交互的问题，后来美国人二战以后就把这些工作整理完，移到了美国著名的航空航天工程NASA里边，美国的登月里面有大量的人机交互问题，所以人机交互成为世界上越来越重要的问题。再后来，日本人从美国把人机交互问题，移植到了家电里面，形成了索尼等著名的一些家电公司，它的产品为大家所熟知。这个照片就是著名的剑桥座舱，就是二战末期，研究人机交互的座舱，这就是伊莱斯和克雷克，这两个伟大的先行者。

我们可以看一下，人机交互它的起源诞生于哪里呢？航空航天。咱们中国也涉及到一个人机工程、人机交互问题，它的起源点是在北航。当时钱学森先生，在创立航空航天这个部门的时候，当时就提出了，人机环境系统工程的想法，再后来，我的导师袁修干先生，在钱先生等老一辈科学家的指导下，来具体的，做了一些具体的工作，在北航成立了第一个博士点，叫人机环境系统工程，然后主要是研究一些关于飞机里面飞行员和飞机之间交互的问题，后来浙江大学、清华大学、北京大学也有一些研究者，纷纷的做了相应的工作。另外，我想给大家强调的一点是，最近的人机交互里边，有一个伟大的女科学家，起到了举足轻重的作用，她的名字叫Mica Endsley。这个女科学家，她提出了一个很重要的一个词叫situation awareness，态势感知也叫情景意识。这个词的出现，引发了人机交互、人工智能的一个很重要的发展，她这个科学家非常谦虚，她认为这个词的提出不是她提出来的，是她总结一个中国长者的理论，这个长者就是著名的军事家《The Art of War》，《孙子兵法》的提出者――孙子。因为在《孙子兵法》的阅读中，她发现态势感知和情景意识，或情景意识，对整个人机交互的影响非常大。

那么什么是“situation awareness”这个概念呢？众说纷纭，莫衷一是。但是1988年，Endsley在Human Factor年会上，提出了正式的一个定义，并为大家所广泛接受。这个定义就是，所谓的态势感知，情境感知，或者情景意识，它就是在一定的时间和空间内，对环境中的各组成成分，进行感知、理解，进而预测这些成分的随后变化状况，这就是情境感知、态势感知，或者情景意识。好，我们可以看出，在整个人类的发展过程当中，智能科学的发展迅猛有力，这个科学的发展的基础学科，往往是非常多的，这个非常多的学科里边包含了以下几种，包括心理学、计算机科学、神经科学、哲学、语言学等等，这些学科构成的，一个完整的学科体系，总称为认知科学。

人机交互、人工智能和认知科学，是非常密切的一对孪生兄弟，正可谓是，以前所谓科学就是分科而学，是把整个大自然的一些事物，分成不同的学科来进行研究，于是，出现了物理、化学、数学、社会学等等。现在有一个趋势，就是通过认知科学，把各个学科收拢在一起，进行综合研究，正可谓分久必合，合久必分，这个中国的一个老话。

好，我们可以看一下，在整个研究过程当中，通过研究人、人机、人机环境，来得出一个什么结论？整个的发展趋势，在这个发展趋势当中，人机环境系统工程的发展，最为迅速，也最为全面，它的定义是什么？什么是人机环境系统工程？我们可以看一下下面的这个PPT，它大概是这样说，人机环境系统工程，就是研究在人、装备和环境系统之间，实现最优匹配的一个领域，涉及到信息的输入、处理、输出和控制，以及反馈，人机环境系统的整体设计，及其优化等方面的研究，研究的目的，是整个系统高效、安全、健康、和谐、敏捷等等。

好，我们看现在的研究现状，出现了很多的分支，比如说，像人机交互、普适计算、情感计算，这些基本的理论和方法，产生了很多相应的关键技术，比如说多模感知、上下文感知、情感智能、环境智能、认知智能、多模界面、感性界面，来实现一个最基本的目标，是自然的人机交互。在这个自然的人机交互当中，大家一定要关注，一个很重要的概念，就是数据。所有智能的产生，与刺激和数据密切相关。所谓刺激，就是人感知到的外部的映射。所谓数据，是机器接触到的外部的输入，通过这两个来产生相应的融合、理解，进而进行什么？相应的反应和规划。

其中，对于计算机来说，数据空间是起着非常重要的作用，如何研究数据？如何研究数据的多指向性？是人机一个难点和瓶颈，比如说，我说两个数字“2”和“3”，“2”和“3”这两个数字大家司空见惯，如果把它整合在一起23，一般人来说很难理解它表示表征什么意思。如果我再加一个概念，再加一个数据，篮球，大家很容易指向了迈克尔・乔丹。所以这个数据的多指向性，是人机的区别的一个最重要的方面，人可以理解一个数据的多指向，多含义，而机器不然，机器它有规范，有规则，它只能从一个角度，来看待这个数据，所以，人机的区别就此拉开。

另外，大家可以看，最近的人工智能的三大主要标志是什么？是深蓝、沃森和Alpha Go，这三个系统里边都是和数据有关，它们都是在处理过去的大量的数据，过去的很多的规则，过去很多的规划，但是这三个最顶级的系统，都有一个很重要的问题，一个瓶颈问题，就是它只能得形忘意，它不能够得意忘形。

大家知道最近一段时间，有一个搏击高手，挑战了太极大师，然后他20秒KO他，然后他说了，武术只是一个什么？只是一个花拳绣腿，实际上当然了，他这个语言里边，有很多不妥之处，但是他说了一个很重要的问题，就是说，武术也好，搏击也好，最重要的一个方面是得意忘形，得到意识，忘掉它的形式，就是要去掉它的形式化，得到它的意向性。任何一套拳术任何一套搏击的手段，都要临机而断，都要根据实际的对抗来进行调整，而不是按照套路去打。真正的人的智能，恰恰就是这样的，是临机决策而不是按照套路，像计算机一样，像人工智能一样，按照套路去运算去计算。人是算计，算计要比计算灵活的多。

人机交互与智能的研究（2）

http://dushuren123.com/lecture222530055.mp4

读书人简介：

读书人简介：