2016年7月17日,以“大数据与人工智能”为主题的“第五届中国大数据应用论坛”在北京大学英杰交流中心成功举办。本次论坛由北京大学信息化与信息管理研究中心和中国新一代IT产业推进联盟主办,北达软、数美时代和章鱼大数据协办,CIO时代网承办。来自业界的相关专家学者、CIO、媒体朋友等近200人参与了此次的大数据盛会。北京大学教授、原工业和信息化部副部长杨学山发表了题为《认识人工智能》的主题演讲。以下为演讲实录:
各位来宾、各位老师、各位朋友,大家上午好!十分高兴来参加大数据应用论坛,我就“认识人工智能”这个主题与大家分享自己的看法。讲三个部分:一是人工智能的发展;二是人工智能和人的智能;三是对于人工智能下一步发展的几点思考。
人工智能的发展
今年是人工智能的60周年,大概是在60年前,在美国的一个会议上产生了一堆在人工智能界的技能人物,只有十几个,但几乎都是名人,其中有五六个人获得了奖项。从此之后人工智能就正式的登上了人类历史舞台。早期的时候,五六年的代表是通用问题求解逻辑的一个系统,到后面就有了突出的作品。到了60年后期至70年代中期就有了专家系统和知识工程。到了80年代,神经网络开始出现,然后到了90年代就有了人工智能和国际象棋的比赛,再往后我们就看到了IBM的“深蓝”和人在美国的超级智能游戏里“深蓝”和人的博弈,结果“深蓝”是赢了。再后来大家就清楚了,有了AlphaGo和最近在杭州的人和机器对人脸识别的比赛。
从技术的角度来看,有人把它总结为从符号主义、连接主义到行为主义。差不多从60年代后期一直往后,一直到AlphaGo之前,人工智能始终处于备受责难的境地,因为人工智能始终很难兑现五六年以后所承诺要达到的功能,实际上它始终跟时间表不断地推迟,或者有的事情根本完不成。到了90年代,人工智能在很多国家的支柱很少或者就没有了。然后到今天,大家对它热捧,我们在讲这个过程的时候完全是学院派的,忽略到了另外一条路径,就是真正实践的路径。
究竟什么是智能,什么是人工智能?这个问题到今天依然有不同的定义。实践的路线就是说在实际的生产生活中已经有了很多的智能系统在替代人的功能。只是因为这些系统不全是人脑的,不仅仅是精神的、脑力的,而且还有身体的、行为的。在认知科学里早就在研究这个问题,有那么多的智能系统,从智能制造、智能电网、智能交通、智能医疗都在讲智能,那么这些东西是不是人工智能?不管用什么定义,它都属于人工智能。但是学院派从来没有去考虑过这个序列的发展,其实任何自动化系统,不管它是生产的还是管理的,只要是自动化系统它就是智能系统。只是说,这个智能系统是闭环的还是开环的,这个系统里面的行为是已经给定的还是在发展过程中是有开放的东西。自动化系统就是闭环的,但是这个自动化系统是智能的。一条自动化的生产线原来有多少人,而且是经过培训的人、有专门技能的人才能承担的事情,你能说它不是智能的?
去年沈阳机床厂开发出来的i5,基于智能机床的领先水平、先进水平,它已经不是一个或者几个高级的机床操作工或者能够做这样产品的人的能力所能达到的,也就是说它比任何一个自然人的能力智能都要强很多。但是我们在讲AlphaGo的时候是如此的兴奋,是人工智能伟大的成绩。那AlphaGo也仅仅是一个人在转,但是i5是任何自然人都不能达到它的智能水平,更不用说它的实际操作水平。
所以人工智能的历史发展应该从两个角度看:第一条线就是60年前开始讲人工智能的发展。第二条路径就是在生产生活中的实践中来看人工智能。确实是人做出来的可以替代人的智能、身体功能。不要以为人的身体功能不是智能,大脑里的重要部分是控制人的身体功能的。从下丘脑到小脑,主要功能是控制人的物理功能。这是第一个问题,主要是讲我们不只是重概念或者标签去看人工智能。
人工智能和人的智能
1、人工智能发展历史过程中,人工智能究竟有没有智能?
从人工智能诞生的第一天起,我们就在说智能究竟是谁的。所以几千年来有一条主线就是只能是人的特有的东西。不列颠百科全书和中国的主要辞书,可以看到智能是人的一种能力。不管是从定义还是到哲学都是如此,但是也有把智能定义为一种中性的东西。来看MIT认知百科全书关于智能的定义,就是中性的定义,它就把智能定义为对环境适应、改变和选择的能力,这是MIT认知百科全书对智能的定义,它把智能定义为中性的。还有另外一种观点,依然是认为今天所有的人工智能系统都是按照程序来做的,而程序给定了一个行为空间,你把它看作智能、意识、理解,它这就划不上等号了。也就是说,程序决定的系统给定的行为空间永远不可能产生意识、理解,这就是一种很有影响力的观点。
刚才在讲60年历史的时候,人工智能碰上几次低潮,在每一个低潮的时候都有代表性的人物在提出很强烈的反对意见。79年的时候,一本书叫《人工智能极限》,讲人工智能不可能真正具有智能。89年的时候有个十分有名的物理学家,他是霍金的合作伙伴,他的这本书叫《皇帝的新脑》,是从《皇帝的新衣》演变过来的,说“皇帝的新脑”是不存在的,人工智能作为新知是不存在,说的十分的清晰。当然了还有另外一些人不断努力,认为机器比人还厉害。那么这就回到人的智能和人工智能应该怎么看?我想我们应该跳出人的智能和人工智能的直接比较,而是从智能角度看如何来解决为社会的发展、科学的发展来做出新的贡献。麻省理工学院的定义比较清晰了,中性的,是适应、改变环境的能力。
2、我们一定要把认知科学进展和人工智能的进展融合起来看人工智能的发展。
智能主要是干什么?第一是解决问题,不管是生产、生活还是社会的,我们要有方法来解决;二是提升智能主体的能力,这个可能是机器或者一个系统,我们要把解决问题的能力提升出来;第三我们希望能够探索未知,就是一般意义上的创新,通过它加快发现和发明的历程。所以不管是人的智能还是人工智能,都要共同的来为这些问题服务。所以我说,不是说人工智能和人的智能去怎么比较、有什么不同,而是如何在相互学习对方成果基础上使得智能的发展能够持续达到一个新的水平,这才是我们真正需要的地方。
当讲到专家系统和知识工程这样一个阶段过去以后,我们进入神经系统、深度学习这种过程的时候,人工智能的研究在不断的吸取我们对认知科学的研究。认知科学研究有两个主要分支:一个是从生物学的角度去研究;一个角度是从心理学的角度去研究。无论从哪个角度去研究,它的研究成果和研究方法对人工智能的研究和发展有着很重要的影响。
大概是6月的时候有一个论坛,认知科学的学者提出了一个问题:人研究人脑,这个问题可能不可能?这确实是一个很严肃的话题。牛顿力学阐述的很清楚,但是产生牛顿力学的心理过程你研究的清楚吗?人工智能的研究是借鉴认知科学研究的成果而不是模仿。即使认知科学今天研究的成果对我们研究人工智能有很多借鉴的意义,但是从今天对人工智能看到的进展看,我们借鉴的还远远不够。譬如从认知角度看,两个方向:第一个方向,认知神经科学。从认知神经科学的研究我们看它如何感知信息、传递信息、形成集成的学习后的记忆。人脑是一个极其复杂的系统,它的复杂性远超出今天计算机解决的问题,计算机系统架构和能力和大脑之间存在着巨大的差距。现在一个人的大脑大概有几百亿到千亿的神经源,每一个神经源大概有成千上万个突触。一个人的大脑有多少个连接点,这是超越计算机的。
3、人工智能和人的智能是具有本质的不同。
看上世纪末研究的成果,人从受精卵两周之后到两岁这个时间里面,平均每秒钟生长180万个突触。一秒钟180万,大脑的处理能力确实不是我们今天的计算机所能比拟的。更重要的是,它的体系架构和今天计算机的体系架构完全是两码事。简单的说,信号的传输是由生物电到生物的化学物质再到生物电这样传输,而这个传输和计算机里面的信息传输模式完全不一样,它既有不同的方式传出,还不是0和1,是完全不同的。我们要把这样的认知神经科学的成果拿过来,但是还要把认知科学另外一个方面,从心理学角度来说,从心理学来看有两个分支:一个是人的认识是不断发展的。人的智能是有不同类型的。前一个主要代表是发展心理学;第二个典型的代表是多元智能理论,从7个增加到8个,现在又增加到9个。不同的发展过程和不同的类型构成了智能。第二条,新知。究竟怎么抽象成一个模型。新知的模型究竟是什么?表征计算的统一模型来讲新知的架构。但是我还没有看到,今天究竟如何来把这样的成果和人工智能真正有效的结合起来?为什么人工智能从来不把自动化系统到军工那么多机器人作为人工智能的科学体系中去呢。
我们看新知,他把社会性质等问题都作为认知科学的重要组成部分,除了这个模型之外还有一个模型,新知下面是计算机人脑。人工智能研究确实需要融合起来。人的智能和人工智能具有本质的区别,因为人的智能是生理的、生命的,人工智能是物理的、信息的。如果我们把这个本质不同忽视掉了,而不去考虑人工智能如何围绕着智能的本意目标去做,而是一味的模仿人的智能,我可以坦率的说:不走弯路那是见鬼了。因为根基不一样、基础不一样,你要去模仿、你要去学、你如何把大脑里面的十种不同的化学物质在计算机你模拟出来,问题是你为什么这样模拟、模拟它干什么?这些都需要我们认真考虑。
人工智能的未来发展
1、我们一定要围绕智能要解决的问题出发,而不是简单的模仿人的智能,也是最重要的一点。
我们很可能会由于不同原因陷入到始终去模仿人的智能。尤其是随着遗传基因工程的发展和认知神经科学的发展,我们对基因和脑的认识越来越多的时候,会受到这种科学进展的不良影响。好的影响、好的东西我们是要借鉴,但是因为它越来越科学,它的解释能力越来越强了,破解了人工智能和人的智能本质上的不同。而不是一味的模仿,这是一定要避免的。
2、人工智能始终有理论研究、学术研究和实际应用。
特别是学校、科研机构和单位应该把精力放在解决问题上。北大很强,但是我们很难说真正的关于人工智能的理论创新会由谁提出来,不是说你在这里面研究就可以。人的发展、人类社会的发展,需要有越来越多的智能系统来替代人、解决人所不能从事、做不到的事情。所以人工智能不管是在广义上还是深度上,在未来一个阶段,必将会进入百花齐放而且是起着十分好的经济效益的时代。这个学科将会为人类社会创造出十分大的价值,将超过今天很多学科的贡献。
为什么这样说?因为我们已经到达了这个转折点。即使在讲人工智能60年的不同发展过程中,始终忽略了一件事情,好像以为他们不如今天Google的厉害,其实不是。根本的原因是,在那个时候人工智能不仅是为通用问题解决这样的系统,还是后来的专家系统,那个时候他们面临着一个极其重大的困难就是处理模型。那个时候要有今天计算机的处理能力,我相信刚才说得那几个人做出的贡献和成就会大很多。今天一个单一计算机和人脑相比还有很大差距,而且和人脑的处理模型是完全不同的。但是我们可以通过一个系统,把不同的处理器、不同的功能来构成更加强大的处理能力和解决智能问题所要的那种架构。我们可以用一群处理器来调整架构问题。
还有一件重要的事情,我们具备了信息获取的能力、学习的方法、学习的理论。我在刚才讲的时候,隐含的说了一个问题,认知科学已经把人的个体认识的发展和社会人质连接在一起,和环境认知连接在一起,也就是说,我们学习是在社会环境、家庭环境和其他物理环境下实现的,学习只看作算法问题是对学习问题的误解,所以我们要看的是学习的成果是什么。我们先不要急着在理论上去做更多的事情,而是通过实践来看人工智能究竟该怎么做才能真正在智能发展的道路上有它自己的地位,然后这个时候你再做基础理论的事,你就不是冥想。
我们确实要把智能的不同类型分分类,不同的类型要有不同的方式解决。当我们讲问题求解的时候,其实很多问是闭环的。生产、管理、生活,它是一个闭环系统。在这个系统里面只要达到了足够的知识和所有问题的处理方式,那么这就是一个完美的智能系统,我始终说今天重新定义系统有多么重要。在今天的技术条件下来重新定义系统,这个系统如果由机器实现而不是由人来实现,这就是人工智能。当我们讲到实用的时候,我们再看50年前,因为那个时候他既是封闭的一个很小的系统,所以做成了,是诊断一种病,但是只要稍大一点就不行,因为那个时候无论是信息获取的能力还是处理的能力都不大,所以闭环做不出来。但是在今天的情况下,我们构造出具备智能功能的闭环系统有很多这就是今天各种各样的智能和机器人大量涌现的前提。为什么?就是因为我们根据问题的本身构造闭环系统。除了闭环系统之外还有半闭半开的系统,其实系统有的系统可以封闭,有的封闭不了。封闭不了怎么办?其实很简单。人是很容易犯错误的。我们说看到的就是真实的,这句话是不真的。如果从逻辑判断来讲这句话本身就是非真理。人在很多问题处理上是经常后悔的,为什么后悔?因为你没有考虑清楚就决策、就行为了。但是在人人都在犯错误的时代,大家都很容忍,那为什么不容忍人工智能出错呢?所以对半闭半开的系统,只要有一个概念说它在大体上把这样的系统做出来。当然我们有全不封闭的系统,需要探索很多的未知。
一个最重大的责任就是认识未知。认识未知一定是全开环的,对全开环的东西怎么办?其实也可以有很多办法应对,其中最主要的要素是,不要期望人工智能得出的每一个结论都是准确的,而且尤其在探索中,99%的正确又有什么关系?没有关系。当我们这样想以后,就可以发现,人工智能可能会比人有很多优势,人的智能和人工智能最主要的一是生命的、一个是物理的。生命的永远摆脱不了生命的约束,而物理的可以无穷的叠加。当人类社会发展到今天,即使不管对哪一个已知,我们都只做了很少的部分。对于什么是生命,生命怎么构成的,今天没有办法知道。因为我们今天的智能没有办法指导出一个最简单的细胞。任何简单的活体,今天人都造不出来。基因组已经把遗传基因信息解剖了很多,其实依然是未知远远大于已知。也就是说,我们只是对2%的遗传基因里面部分结构已经知道。我可以十分坦率的说,这2%里面还有很多结构我们依然未知,遗传基因结构是隐含的,只知道部分的结构,更不用说还有98%的基因是干细胞的,我们几乎只有猜测。
对于大脑,即使我们今天的手段只能看到表面的,而深层的大脑结构,就是我刚才说的,如此多的神经源和神经突出在干什么。我们没有办法通过黑箱或者灰箱这种方式感知到大脑还在干什么,在生命这个领域我们知之甚少。在物质这个领域我们只对5%的物质大体上弄清楚,还有95%的物质基本上处于无知状态。但是我们人的大脑是不是能完成这样的任务?有人说可以啊。弄个芯片、感知设备连接起来,把人和机器连接起来,确实技术上没有问题,可以实现。但是人是生命体,今天的大脑已经占用了20%的人的能量,如果我们给它增加10%,再增加10%,也许我们人体通过调解把它解决,但是要增加50%的,人就不是今天的人了。人的进化是以千年万年为单位来计算的,我们要把人占全身能耗20%-30%的话,我相信没有一千年一万年的进化是做不到的。所以这就是我们想说的人工智能在开环的问题上有很多的办法解决,一定能够超越,但是我们必须容忍它犯错,其实科学发现是犯错才能不犯错。
3、对于人工智能的学科或者技术架构或者它的一般技术问题,要从过去走过的历史回归到人工智能主要的适用范畴和主要使命的本源上。
研究人工智能的人都是逻辑能力特别强的成年人。当把这两个抽出来之后,它只是智能中的一种类型、一种能力。实际上智能不是这样一群认为高智商、逻辑能力特别强的人这才是智能,看看加拿大的八种智能类型我们就知道。所以我们一定要回归到问题本源去理解智能、人工智能究竟应该做什么。不管是符号主义、连接主义、行为主义还是神经网络、深度学习、复杂的算法,它都是我说的那一类人想象的人工智能该是这样。可以坦率的说,只有极少部分人工智能是需要这样的,绝大部分的人工智能不需要这样。
所以往后我们看到一个十分重要的现象:越是水平高的人工智能系统它的逻辑链环越短、算法更简单,而不是逻辑链环更长、算法更复杂。
谢谢大家!
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:杨学山
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。