杨学山:走向通用人工智能

2019-08-19 21:55:17

来源:CIO时代学院

  2019年8月16日至17日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,CIO时代APP承办的"第五届中国行业互联网大会暨CIO班14周年年会"在北京隆重举办。北京大学兼职教授、工业和信息化部原副部长杨学山发表了题为《走向通用人工智能》的演讲。以下为演讲实录:
 
\
北京大学兼职教授、工业和信息化部原副部长   杨学山 
 
  尊敬的各位来宾、各位CIO的同仁,各位朋友,大家上午好!很高兴参加第五届中国行业互联网大会暨CIO班14周年年会!CIO班14年的学员们像一颗颗种子在全国各个地方和各个行业开花结果,所以我在此表示祝贺!
 
  根据会议安排,今天讲讲通用人工智能。我本人是不太喜欢通用人工智能(AGI)这个词,所以在我的书里面,没有用到这个词。但是大家对这个话题感兴趣,而且这个概念大家也都熟悉,所以还是用这个概念来讲。讲三个部分:一是讲历史,我们对通用人工智能的追求;二是讲一下人类智能,因为通用人工智能必须理解人的智能,不理解的话做不出来;三是讲一下通向AGI的一种路径,这个路径就是我从《论信息》到《智能原理》到现在正在写的第三本书《智能工程》,一直想描述的一个理论和一种实现方式。
 
  维基百科关于AGI这一段英文大概是三个意思。第一,通用人工智能是什么?通用人工智能就是能够完成一个人所有智能行为或者是智能任务的一个机器系统;第二,它既是人工智能研究者,也是我们写科幻小说的人和未来学研究的人共同使用的一个概念,这句话很有意思;第三,通用人工智能和其他相关的几个智能概念的关系。
 
  确实,我们人类对通用人工智能的追求有着漫长的历史。莱布尼茨应该说是我们走向机器智能的一个奠基者,他是二进制创造者,是符号思维符号逻辑的创立者,也是机器思维的创立者。所以应该说从他开始往后,我们在持续追求一种机器,这种机器能够像人的思维,有人一样的智能。
 
  在这个过程中有很多的努力,但是很多都失败了。其实前面两个我们都熟悉,通用问题求解器,五代机谁也知道,当然美国国防部的DARPA项目我们了解的不多,但是它也是想追求通用人工智能,但是他也失败了。
 
  尽管莱布尼茨1640年前后到现在350多年了,我们依然没有找到解。这里面有说人工智能不可能在近期有重大突破的这样一些观念,这是左边。右边讲的是为什么通用人工智能不行,主要的反对意见,所以说我们到今天为止没有找到解。
 
  尽管没有找到解,但是努力依然没有放弃。到现在,大概全世界还有40多个项目在做着通用人工智能,都在进行中。美国2019年的人工智能战略里面,六项任务中的第四项依然是要找通用人工智能究竟怎么实现。所以还有40多个项目在今天依然活跃在通用人工智能领域,但是十分遗憾的是,所有的这些项目到今天为止,连他们自己在内都不可能认为他已经找到了走向通用人工智能的路。只是说他们在努力,没有放弃。
 
  原因就在于我们所有的通用人工智能的努力,都没有真正把人的智能究竟是怎么回事儿弄清楚。维基百科的定义很清楚,通用人工智能就是一个机器系统,能够完成一个人所有的智能行为,能够成功地完成所有的智能行为。这个定义告诉我们要追求的目标本身就应该是如何理解人的智能,然后才说通用人工智能怎么做。人的智能是怎么回事儿?我们确实自己不了解自己。我始终说,我们最不了解的是自己,知己知彼百战不殆,其实最难的不是知彼而是知己。几乎所有的失败,找找原因几乎都是自己是主要原因。
 
  怎么理解人类智能呢?要有很多维度。第一个是多样性,这是教育学和心理学的研究成果。人的智能是有多种类型的,代表人物是加德纳,《多元智力理论》,有中译本,你们可以看一看。他根据智力与大脑的关系及在人类知识和实践体系中的不同部分将智力分为9类:语言、音乐、逻辑和数学、空间、体能、人际、内省、自然、存在。这本书第一版提出来了七个,到第二版再版时在前言里面加了第八个。他在20年后的一篇论文中加了0.5个,存在。他自己都没有确定这个存在究竟算不算,所以这是多样性。智力和智能是同一个英文字,只是在不同的语境下翻译成智能或者智力,但英文词是统一的,所以我们说人的智力是不同类型。为什么心理学和教育学要研究它呢?说明我们人的不同类型的智能或者智力它是有不同方式的。所以今天始终以为智能就是逻辑和数学,这确实是我们认识人工智能到今天最大的困难。以为数学和逻辑是智能,其他的都是在数学和逻辑之上建立起来的,其实不是。
 
  想想我这一辈子走过来,数学什么时候用的最多?小学、中学、大学。大学之后走向工作单位,数学用的越来越少,几乎不用。到超市去买东西,你不算帐,你现在可以自己结账,扫一下就OK了,所以不计算。即使在人的智能任务中,数学计算的任务是很少很少的,而且人的计算能力是极其弱的。我们很多人两位数的加减法都想用笔算,都想用计算器,所以说明我们的计算能力有多弱,更不用说算法了。想什么呢?你怎么可能做得到?
 
  第二个发展性,人的智能是逐步发展起来的,不是一开始就十分完善。所以这是我们的心理学,特别是发展心理学研究的成果。皮亚杰是著名代表人物,所以从胎儿开始,受精卵第三周开始就开始智力发育,一直到成为社会的独立主体,我们才开始行使我们的能力、责任。
 
  第三个结构性,这个结构有时空两个概念。发展心理学就是一个人在你的一生中,不同的时期对不同的智能敏感,这是发展心理学的主要成果。其实还得看时间,我们的智能是一代一代传下来的,而不是一个时间平面。就是你的一辈子不是你的一辈子,而是说一代一代传下来的,同时它的空间结构是所有的智力,它在人的所有的认知功能体系的结构中是稳定的,从感知到传输到脑的记忆和使用,它都是固定的结构。这个固定的结构是生下来就有的,结构之间的关系,结构之间哪个先启动哪个后启动都是生下来就已经定了。
 
  再就是遗传和生命。正因为它有时空结构,所以遗传和生命是人的智能的重要构成部分,没有遗传、没有生命、没有智能。遗传是从什么时候开始的?不是你父母的过程遗传了你,而是你遗传了从人类生命的第一个生命开始,所有的基因都在这个遗传过程中。所以我们才说人的基因原来和一条小虫子、一个细菌、一头猪、一个猴子的有如此多的基因相象性。当然这还不够,为什么还不够?因为我们今天所谓的人类的基因组的研究只是解释了在一个人生命过程中使用的2%的基因,还有98%所谓的暗基因或者不活动基因还没有研究。如果再把这98%没研究的基因放进去,就知道几乎40亿年来进化的都在基因中成长。所以遗传和生命是理解人类智能的重要内容。
 
  这一点是我们计算机界最大的错误。计算机界以为信息是符号,所以机器学习、深度神经网络努力想尽一切办法把符号变成含义。其实这是跟人的智能相比,这是错得离谱。因为人从一开始感知信息开始就是含义的,不是符号的。所以不管是很多听到、眼睛看到、鼻子闻到这些感觉到,所有的从一开始都是通过特定的细胞结构来确定是什么东西,然后经过一个结构化的整合和传输过程到大脑里面,所以你感觉到痛就是痛、冷就是冷、热就是热,看到的这个光就是这个光,这个东西就是这个东西,没有计算过程,没有任何计算过程。这是我们的神经系统。所以人所有的信息都是含义的,绝不是符号的。符号是在人生活和发展过程当中为了交流所以才有了语言有了符号,有了符号大家相互之间都是知道的,大家知道这个东西是什么含义,但是这中间进行记录以后,但是别人不知道,所以就有了重新认知的过程,然后我们的计算机学家以为信息是符号,其实错了,信息它的根本是含义而不是符号。
 
  我们把一代一代的知识通过学习过程来积累到今天的大脑里面。所以往前推一千年、三千年,你得到的知识和能力是不一样的。同时他是从胎教开始,一直到我们工作过程都是持续的交互过程。
 
  同时我们再把这样的东西合起来看到,人的智能一个重要的特征就是主体性(意识、自我、存在、生命),没有存在、没有生存,哪有智能。没有自我保护,智能就玩完了。生物进化的第一要义是生存、自我保护。在这样的过程中,我们才有了意识、自我。自我和意识不是人独有的,是生物在长期进化过程中逐渐逐渐进化过来的。同时是整体的,人的行为要实现从感知到传导过程到记忆到使用到行为,动用了人的生物体各种功能系统,缺任何一个功能系统都是不行的,所以独立的通用人工智能要从里面切出一块那是不可能的。正是因为是通用人工智能,你能够承担人的智能任务,所以承担着社会的角色和责任。
 
  把这些东西合在一起,不同的智力和他的形成和发展的特征放在一起,才是人的智能的整体的视图。这样的整体视图我们怎么样来实现它?我们要实现它首先得回答四个问题:第一个问题,定义清楚你要做的是什么?所以AlphaGo不是通用人工智能,因为它从来没有说我要做通用人工智能。沃森也不是通用人工智能,他从来没有说过他要做通用人工智能。所以首先要定义清楚你究竟要做什么;第二个问题,定义完以后能实现吗?第三个问题,能使实现的话,给出一条路径来;最后一个问题特别重要,真能做到了,你做不做?该不该做?这就是今天我们人工智能威胁论的主要需要回答的问题。
 
  为什么我的第三本书原计划这个月要封稿的,但是到今天没有完成。是我写的过程中越来越忐忑。这本书到底该不该写,该不该出?这是我今天最主要的纠结。我定义的是非生物智能体,在《智能原理》这本书里明确定义了,这个东西就是非生物智能体。有自我和意识,能够拥有、调用、控制、维系其生存和发展的所有逻辑、物理资源。所以计算资源不是别人的,这个动力不属于别人的,是自己管理和控制的,所以才能成为社会主体。能够完成社会交给他的任务,履行社会职责,同时跟人一样,从一开始处理的是含义而不处理符号。符号只是他处理不了的时候临时放在那的,但是只要进到智能体内部一定是含义,不是符号。
 
  怎么做呢?这个路径就来回答怎么做。这个“做”大体上要满足一个独立的社会的跟人一样的智能体得有相应的功能和约束。所以首先一个原则,他和人一样,有相应的功能。而这个功能是由一个一个功能体系来实现的,同时他要担当社会角色,承担社会责任。在这里面一个重要的事情是人的智能40多亿年,不要以为我们可以把最早的原始生命体的基因去掉,去掉以后对不起,人就是残缺的。所以从40多亿年第一个生命体开始,他所有的故事都是我们今天智能的重要的构成部分。这几百年构成了我们今天在人类社会行为的主要的知识体系,但是不要忘了,没有前面的就没有后面的。但是怎么办呢?我们这个智能体不能有多少年,不可能的,必须要比较短的实现它,所以我们用空间换时间。我们用多少亿的并发来实现时间的年代的迭代,所以这是一个最基本的原则。我们用大规模并行自我生长,一个一个独立的很小的,既有独立的智能功能的小的东西在一个总的架构下持续的生长,来用空间换时间。
 
  人的功能,通用的非生物智能体他有11个功能体系。从感知开始到描述、记忆,通过连接计算,和我们相应的行为生成交互,来完成人的全部的东西。我的第三本书《智能工程》大体上分成两个部分,一个是11个功能系统,第二个部分是一个生命周期。两个内容构成了第三本书的框架。
 
  它的功能体系,我就先不展开讲了。人有生命周期,智能有生命周期,非智能生物体同样有生命周明,它的起点是初始赋予,这个遗传的过程依靠人给它赋予,所以初始是由人来赋予。赋予之后成长,成长的过程就像孩子从怀孕一直到成为独立的法律主体之前,需要大人的监护。所以说是在人创造的环境当中成长。那么长大了,18岁了,就得履行职务,要承担社会中的任务而不是科研的任务,是真正承担社会中人承担的各种各样的事情,不是科研而是承担社会责任。最后,是复制和终止,也就是说你可以传承下去,这个跟人不一样,传承不等于原来的灭亡。可以并行的一个一个的生出来,所以这是它的生命周期。
 
  刚才讲了功能系统,一个个功能系统都是由四个层级的,最低层级就是微处理器,上面是功能组织,再上面是功能子系统,最上面是功能系统。功能系统有11个,下面有子系统。所以构件最基础的是微处理器。微处理器,我说的非生物智能体要达到一个人的能力的微处理器有多少?大概10的12-13次方,是如此大量。功能是万亿、十万亿微处理器。微到什么程度?微到一个字就是一个微处理器。而且这个微处理器是这个字的百科全书,比百科全书还要厉害。为什么?它是直接跨界到所有的应用场景中去。所以不是一句话一段文字一篇文章是一个微处理器,而是一个字,任何字母,世界上只要有文字的所有的字母,一个字母就是一个微处理器,只有这样才经过描述、连接、记忆变成真正智能体理解的东西,而不是符号。只要进来绝不是符号,他就是他,只要进入智能体就是含义,绝不是符号,跟符号没有任何关系。
 
  感知处理器十分复杂,感知处理器怎么做?存算一体,类似于FPGA,每一个微处理器有它的操作系统,而这个操作系统用FPGA格式来实现。每一个微处理器都有自己的操作系统、存算体系,都有一个独立的功能。总而言之,就是所有的相关都进来了。功能组是一组微处理器构成的,变成一个功能组,上面就构成功能子系统,所以一个词、一句都是一个功能组。智能体说了有11个功能系统,一个功能系统下面大概有几万到几十万个子系统,有百万到千万级的功能组,有亿到十亿量级的功能系统,所以微处理器将是百亿甚至更多。
 
  其实构件还有一个东西就是客观对象,客观对象需要不同功能系统来处理的,所以我们还有一个逻辑的构件体系,就是所有的认知对象。比如说苹果,其实苹果已经是一个集成的智能单元,下面还有一组智能单元把各个功能系统里面相关的东西集成起来。
 
  那么怎么实现?其实很简单,我始终说,这个东西的实现几乎就是持续的1+1+1+1……,而所有的“1”今天已经存在,也就是说我们在座的人一个人都可以做很多很多的“1”。比如编一个 “狄”字,从微处理器到百科全书形成起来,它的音形意、变体、主要使用上下文都集中起来。只要智能体有各种接触环境或者任务触发它的时候就可以用它了。有音形意,有变体,有场景,我们就可以用它了,所以每个人都可以做很多的基本的构件。
 
  路径就是0-1、1-n、n-N的过程,所谓0-1就是一个具体构件从起步到基本运转起来;1-n,这个可以工作了;n-N就是这个构件完备了,可以遗传可以复制。当然这里面1-n不仅仅是指一个微处理器成熟程度往前走,还指微处理器构件数量不断增长,增长到10亿到万亿这个量级就可以工作了。到N就是完备的了。比如说 “狄”,不同音形意,今天都存在了,当你用到“狄”这个字的时候,通过连接进到这里面都能完成,没有任何的困难,这就是它的发展过程。
 
  我们来看苹果,沿着它逐步的增长,从基本认知到拓展认知、延伸认知、归纳演绎、艺术、抽象、逻辑、科学、空间、发散思维,都在这样的过程中来做。这个“做”只要在记忆中完成有效连接,任何任务的触发和这个东西实现有效的连接,那么所有过程都可以往前走。当然,这个写的很简单,真正要变成记忆的话,是一个极其大量的东西。极其大量太复杂了,你做完苹果再做梨、桃、枣,都可以解决。这个程序稍微变一变就变成梨、桃、枣,而且有很多描述都可以变过来,实际上当你做的多了以后,同类之间的工作量会快速下降。如果只要做一个的话,这一个就够一个人用机器做上几年。
 
  所有启动的构件都是今天人类智能已经有的,而且做的人能够实现这个转换过程。当然大家会说到高层怎么处理?其实不复杂,完全通过连接和结构来实现。当然要有原则、要有逻辑,那是另外的事。同时成长环境的要求是必须有的,就像我们从婴儿到能够独立行为的一个主体之前,需要家长和社会的呵护一样,需要环境。这个环境必须得存在,否则这个智能体要么夭折要么就变成坏人。今天人类社会里也有坏人,有遗传的也有环境的。不好的东西,遗传的我们不要传进去,所以不能设置恶意路径,遗传不能有。当然环境也不能让他夭折,而技术上不存在算法、算力的任何可能,因为是叠加的。一个微处理器,如果我们没有存算一体的芯片,不要紧,因为一个微处理器它的计算量不大,还是用并行来解决所谓算力的问题。技术复杂性主要在于总体架构、成长路径的规则化及规则的成长。采用交互、容错、渐进的原则,技术上没有雷区。
 
  我从去年到今年一直在算,做成一个比我们在座所有人都更加聪明的东西需要多少钱?大概千亿美元到万亿人民币,需要6-8年时间。而如果我当项目负责人或者总设计师的话,大概6-8年可以完成,但是我肯定不当,所以团队是最大的困难。
 
  谢谢大家!
 
  备注:想收看杨学山老师视频或下载杨老师PPT,请登录CIO时代APP。