2017年才刚过了两个月,国内就上演了两场人机大战,先是小度判案,后是汪仔答题,机器人的战斗力似乎像越来越强了。
那么,实际情况果真如此吗?机器真的已经能从眼神、听力、智商上秒杀人类了吗?下围棋、识别嫌犯、百科问答,这些技能背后的实现原理到底有多高深?人工智能离超越人类到底还有多远?现在究走到哪一步了?
近期,爱分析在对iPIN创始人兼CEO杨洋进行调研访谈的过程中,无意间获知了关于以上问题的一些“真相”,与您分享如下。
iPIN是国内依靠认知计算提供智能情报分析和信息匹配的典型代表,它基于庞大的社会经济图谱和认知分析框架,一方面为人和企业的发展提供情报分析,通过完美志愿等生涯规划产品直接服务广大用户,另一方面向各行各业输出大数据分析的标准化技术,提高信息匹配效率,目前已经在招聘、法律、建筑等领域实现商业化落地。
Q:有人说,通用智能需要解决知识表示的问题,而知识表示又依赖知识图谱的成熟,您认同这种观点吗?
A:首先通用智能现在不存在,最后会以怎样的形式存在,我觉得是一个很大的疑问。
知识怎么表示?我们距离通用智能到底有多远?我觉得这里面最大的问题不在于知识图谱,而在于现在AI到底什么地方比人差。
毫无疑问,深度学习解决的最大问题就是在分类计算上能够做得比人好。《最强大脑》上小度所做的事情就是一个图像判断的分类问题,语音识别做的也是分类问题。在这块,机器人已经做得比人好了,这点毋庸置疑。
我们说人工智能,就是希望机器能比人强,那现在它哪点比人弱?其实就在于推理,推理跟知识图谱肯定是相关的,但是推理现在还没解决的一个更重要的问题,是逻辑。
但关键是什么逻辑这个问题就有很多学派。人工智能早期在八九十年代陷入困境,就是因为在逻辑这块突破不了,现在逻辑还是没有突破。那逻辑到底该怎么去克服?这个问题不同学派有不同意见。
拿我自己来说,我自己有两个小孩,他们的出生非常适合我去观察人的学习过程。Babylearning也是人工智能很重要的一个环节,就是看人如何去学习。比如我的儿子是先会叫“爸爸”,然后会叫“妈妈”,但是它叫“爸爸”是需要帮助,叫“妈妈”是饿了,也就是说他叫的时候并不知道什么是“爸爸”,什么是“妈妈”,它对这两个词的理解跟我们是不一样的,只有随着以后沟通多了,它才会慢慢修正对它们的理解。
我们平时判断一个人聪不聪明,主要是看他对信息分析的逻辑能力强不强,IQ测试里面很多都是逻辑测试题。那小孩的逻辑到底是什么时候形成的?说实话,他们最开始都是浅逻辑。
有一次我去我女儿幼儿园给他们教课,我就给他们讲了一个故事。讲完之后,我就问所有小朋友:你们从这个故事里面得学到了什么?结果,那些基本都是5岁的小朋友里面,只有一个小朋友告诉我,他从这个故事里面学到什么,其他小朋友都是把故事重复了一遍。这其实就是一个归纳总结的能力。
我们之前说小孩子在5岁智商发育成熟,其实从这个事情上看来,不是的,他的一些高层次的逻辑推理和归纳能力,基本上还是很弱很弱,或者不具备的。我们说现在AI的智商相当于2岁半的小朋友,那5岁的小孩儿都还不具备这种推理逻辑的话,机器就更远了。我们现在所做的推理分析,基本都还是跟行业专家一起做的。
Q:AlphaGo不属于逻辑推理吗?
A:不属于,它其实就是算法,他算的是获胜的概率。我所说的推理有两点,一个是归纳总结的推理能力,另外就是跟人对话、像人一样思考的能力。如果它不具备这样的能力,它只会自己下,但没办法跟人解释,就还是不行。
Q:iPIN的社会经济图谱和普通的知识图谱有什么区别?
A:我们的社会经济图谱本身也是一种知识图谱,只不过它更复杂、更深。社会经济图谱,首先跟这个社会紧密相关,其次所有数据都是量化的,这是普通的知识图谱所不具备的。普通的知识图谱不是用来做计算分析的,而我们是用来做计算分析的。BusinessIntelligence里面要用到一个数据仓库,这个东西就属于数据仓库的升级版,它是整个社会的数据仓库,目的是为了做高精度的可量化分析和预测。我们这里面全是量化数据。因为你要你要解释,就必须要量化。
Q:非量化数据为什么不能做解释呢?
A:这个问题涉及到人对信息的处理。人的大脑只能做加减法,不能做乘除法。一般来讲,人对信息理解透的话,大脑一定要做理解记忆,而理解记忆很重要的一点,就是要把外部信息跟内部认知计算结合。
大脑对信息的存储是以一种memoryschemata(图式记忆)的方式去存储。要让机器模拟人的认知计算过程,就必须要让机器通过量化信息去做逻辑推理,通过逻辑推理实现对信息的理解,才能实现认知计算的过程。
Q:iPIN产品中也涉及到问答,基于数据分析的问答跟客服类问答区别在哪?
A:问答是一种形式,它背后包含的技术是多种多样的,包括对话背后的技术也是千差万别的。客服问答相对来讲是最简单的一种,所以现在做客服机器人的公司很多,而且客单价低,就是因为它的技术门槛并不高。它本质就是训练一堆FAQ(常见问答),然后根据你问的问题找出最接近的答案,或者告诉你找不到,或者转到人工。我们也用的是问答形式,但我们的问答输出的是分析结果,背后的技术比客服问答更复杂,门槛更高。
Q:要让机器对话和问答更自然、更准确、更像人一些,需要在哪些方面努力呢?
A:问答涉及到三大环节,首先是对问句的理解,然后是答案的检索,最后是答案的输出。
理解方面,我们之所以做社会经济图谱,就是为了提升机器的理解能力。客服问答基本都没有对句子背后深层次的意思去做理解。
比如为了让机器人理解什么是华为,我们给华为建了一个模,包括华为做什么、有哪些人、每个人有哪些特点、某个部门的教育和工作背景、客户信息等等。这是我们社会经济图谱的一个可视化的部分,其实整个图谱远远比这个复杂。做这个的目的,就是为了让机器理解华为,下次遇到华为这两个字时,它就能自动回溯到这里,去提取它所需要的信息。
第二步是查找答案,包括主线和辅线的查找,这里面也涉及到一些复杂的技术。第三步是输出,要让机器用人类的语言去组织,也就是说人话。这三步都不容易。
而且这里面甚至还涉及到大量的transferlearning(迁移学习),就是当机器遇到一个问题,这个问题在这里没出现过,但是在别的领域出现过,这时候机器该如何去自动去解决这个问题。
对话系统只是一种表现形式,但它所涉及到的技术基本覆盖了AI的所有领域。所以一家公司如果说他们做对话,其实并没有回答其背后所用的技术。对话这个东西绝对是可大可小的,比如Google所做的对话肯定涉及到上下文的理解,我们的对话会涉及到大量的认知分析,其他某些公司的对话可能就是从一个答案库里面去找答案。
Q:如何看待AI+在各行各业的应用?
A:我们所做的AI+应该跟Watson是一样的,Watson是从医疗切入,然后逐渐延伸到金融、法律等领域。我们是从生涯规划切入,然后发展到招聘、法律、建筑建筑等各个方向。未来在其他各个行业的应用我认为是一个自然而然的过程。
因为我们做的是情报分析,从信息层面上看,每个行业的信息通用性比较强,比如智能情报检索,各行各业都会有这个需求,所以比较容易落地。
但是像那种用AI简化工作流程、升级工作方式的应用模式,我觉得相对来说可能会稍微缓慢一些。
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:liuhan
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。