北京时间10月11日消息,国外媒体今天撰文指出,近年来人工智能(AI)取得了飞速发展,谷歌、Facebook和微软等科技巨头在语音和图像识别等AI领域都获得了重大突破,甚至有人认为我们正生活在一个“以AI为先”的时代。但是,在AI的前进道路上,目前仍然有三个巨大的障碍需要跨越。
机器人与人类牵手
以下为文章全文:
在上个月于伦敦举行的深度学习大会上,有一个特别值得关注的主题:谦卑,或者说需要谦卑。
包括谷歌在内的许多公司都信誓旦旦地宣称,我们正生活在一个“以AI为先的时代”,机器学习也在语音和图像识别等领域取得了突破,但是身在AI研究最前沿的人经常指出,人类在这方面仍有大量工作要做。仅仅因为我们拥有了听上去像电影中会说话的虚拟助手,并不意味着我们距离创造真正的人工智能更近一步。
我们在人工智能研究领域还面临着诸多挑战,比如需要海量数据来支持深度学习系统;我们还不能打造出不止擅长一项任务的AI;我们对这些系统的工作原理缺乏认识。2016年,机器学习创造了一系列极为出色的工具,但这些工具难以具体解释,训练费用高昂,即便对创造者来说,它们往往也像是谜一般的存在。下面就让我们来详细阐述一下我们在人工智能领域面临的三大挑战。
数据、数据,还是数据
众所周知,人工智能需要数据来了解世界,但我们往往会忽视数据多少的重要性。英国谢菲尔德大学机器学习教授、亚马逊人工智能团队成员尼尔·劳伦斯(NeilLawrence)指出,若想理解概念或识别某项功能,这些系统不仅需要比人类更多的信息,而且需要的信息数量更是多出人类数十万倍。
劳伦斯说:“如果你看一看深度学习在哪些领域的应用取得了成功,那么会发现这些往往是我们需要大量数据的领域。”例如,在语音和图像识别领域,谷歌和Facebook等科技巨头都拥有海量数据(如安卓设备上的语音搜索),令他们可以轻松开发有用的工具。
劳伦斯称,当前,数据就像是工业革命早期的煤炭。他还以汤玛斯·纽科门(ThomasNewcomen)为例来说明这一点。纽科门是英国人,在1712年发明了以煤为燃料的原始蒸汽机,比詹姆斯·瓦特(JamesWatt)发明先进蒸汽机早了大概60年。纽科门发明的蒸汽机并不太好,相比瓦特蒸汽机,效率低,费用高。这意味着,它只能在煤田使用——煤田有足够多的燃料来克服蒸汽机的诸多不利条件。
Facebook开源的图像识别工具
劳伦斯表示,如今世界各地存在着数百个“纽科门”,他们正在开发自己的机器学习工具。这些工具可能具有革命性,但没有数据来支撑它们,所以我们将永远无法知道结果如何。谷歌、Facebook和微软等科技巨头就好像是今天的“煤矿”。他们拥有丰富的数据,也有经济能力来运行效率不高的机器学习系统并加以改善。
规模更小的创业公司可能有不错的创意,但如果没有数据支撑,他们就无力跟进科技巨头在这个领域的动作。如果看一看你难以获得数据的其他领域,会发现问题甚至更严重。以医疗保健为例,人工智能正被用于机器视觉任务,如识别X光片中的肿瘤,但这个领域的数字化数据却很少。
正如劳伦斯所指出的,问题的棘手之处就在于,“迫使人们不厌其烦地去获取数据,被普遍认为是不道德的事情”。劳伦斯表示,这里的问题不是寻找分发数据的途径,而是如何让深度学习系统变得更高效,可以在数据更少的情况下使用。就如同瓦特蒸汽机相比纽科门蒸汽机有了巨大突破一样,人工智能的研究若想取得突破,可能也需要60年。
需要具备多任务处理能力
深度学习面临的另一个重大挑战是,当前所有的AI系统基本上就是“纸上谈兵”。据谷歌DeepMind研究小组科学家拉伊亚·哈德塞尔(RaiaHadsell)介绍,一旦经过训练,它们可以极为高效地应对一些任务,比如识别猫咪或是玩Atari游戏,但是,“目前世界上没有神经网络或任何方法在经过训练后,可以识别物体和图像,玩《太空侵略者》游戏,听音乐。”神经网络(Neuralnetwork)是深度系统系统的基本组成部分。
实际上,问题比实际情况还严重。谷歌DeepMind团队去年2月份宣布,它已经开发了一种能在49个游戏中胜出的系统,虽然这肯定是巨大的科学成就,但每次击败某款游戏,该系统都需要再次进行训练,以便在下一次的较量中胜出。正如哈德塞尔所指出的,你不能同时试着学会所有不同的游戏,因为不同游戏的规则会相互干扰。你可以一次学习一个游戏规则,但最终会忘了前几个游戏的规则。“若想实现通用型人工智能,我们就需要一种能学会多任务处理的东西,”哈德塞尔说,“但是,我们现在甚至不能掌握多个游戏规则。”
解决这一问题就需要一种称为“渐进神经网络”(progressiveneuralnetwork)的东西——这意味着要将不同深度学习系统连接起来,令其可以传递某些信息片段。今年6月份,哈德塞尔的团队就这一话题发表了一篇论文,称他们开发的渐进神经网络可以适应规则略有不同的多款《Pong》游戏,而且适应的速度远超正常的神经网络——后者必须从零开始了解每个游戏的规则。
渐进神经网络的基本结构
这是一种颇具前景的方法,在最新实验中,它甚至可以应用于机械臂——将机械臂的学习过程从过去的几周,缩短为现在的一天。然而,这种方法也存在诸多严重的短板,哈德塞尔称渐进神经网络不能持续地在“记忆”中增加新任务。她说,如果你将几条铁链子连在一起,那么整条链子迟早“变得过于庞大,难以驾驭”。到那个时候,我们正在管理的不同任务基本上都是相同的——打造一种智力相当于人类的系统,可以写诗、解决微分方程、设计椅子,这种系统也将成为与众不同的东西。
缺乏对AI内部机制的了解
另一个重大挑战是,理解人工智能如何得出它们的结论。对于外行人来说,神经系统通常是谜一般的存在。虽然我们了解了如何将它们连接起来的办法,也了解了经过这些系统的信息,但这些系统为何会作出某些决定,原因往往是我们难以理解的。
弗吉尼亚理工学院的一次实验,就充分展现了这一挑战。研究人员给神经网络开发了一种眼部追踪系统,将计算机最先看到的像素记录下来。研究人员将一张卧室的神经网络照片拿给该系统看,然后问:“盖住窗户的是什么东西?”他们发现,该系统并没有看窗户,而是朝地上看了看。
接着,如果发现了一张床,它会回答“窗帘盖住了窗户”。该系统碰巧给出了正确答案,但这只是因为它接受训练时的数据有限。根据研究人员向它展示的照片,神经网络得出了这样的一个结论,即如果是在卧室中,那么窗户上一定要窗帘。所以,只要看到床,该系统就不会再看第二眼了——它已经看到过窗帘了。当然,这合乎逻辑,但却是很愚蠢的做法。许多卧室根本就没有窗帘!
眼部追踪只是一个揭示AI内部机制的方法,另一个方法可能是给深度学习系统注入更多的连贯性。伦敦大学帝国理工学院认知机器人科学教授莫里·沙纳汉(MurrayShanahan)表示,实现这一目的的途径是,重新采用一种名为“有效的老式人工智能”(GOFAI)的传统机器学习方法。这种方法是基于一个假想提出的,即脑海中发生的东西可以缩减为基本的逻辑,让世界由众多复杂的符号来定义。通过将这些表示动作、事件和物体的符号结合起来,你基本上可以形成自己的看法。
沙纳汉建议,我们应该吸取GOFAI的符号描述方法,然后与深度学习结合起来。这些系统将成为人工智能系统了解世界的一个起点,而不是不断提供数据,等待其识别某些图像。他说,这种办法不仅可以解决AI的透明度问题,而且还能解决哈德塞尔提出的转移学习成果的问题。
沙纳汉说:“可以这样说,《Breakout》类似于《Pong》,因为它们都得到了桨和球,但堪比人类的认知能力将它们以更大的规模连接起来,就像是原子结构和太阳系结构之间的连接一样。”沙纳汉及其团队正在开发一种新的方法(他们称之为“深度符号增强学习法”),并且公布了一些实验成果。
这项研究目前仍然处于初级阶段,发现它是否可以应用于更大的系统和不同类型的数据,将更加具有说服力。但是,它很有可能会演变为更多的东西。毕竟,在研究人员近年来开始挖掘廉价数据和大量处理能力之前,深度学习本身就是AI当中一个不受垂青的部分。也许,现在到了AI迎来再一次爆发,在新环境下大展身手的时候了。
(文章来源:凤凰网科技)
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:houlimin
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。