最近人工智能很火,一头雾水中写了这个小文,一定是挂一漏万、有不对的地方,敬请批评指正,并希望在讨论中自己有所提高。欢迎转载,请注名出处。
“我们所知道的东西很少;我们所不知道的东西很多”
--皮埃尔。西蒙。拉普特拉斯(1749-1827)
写下这个题目,不是对自己不学习的推脱,而是真遇到困惑、真地不懂,特别是遇到各类算法时,以自己的数学功底理解起来还是有相当难度的。但也是因为需要用到相关的内容,就偷懒把数学问题“黑箱化”了,理由也很偷懒:在餐馆吃饺子或许只需要知道的是能点什么、得花多少钱、饺子是否名副其实,而不用自己到后厨包饺子,更不用知道麦子是怎么种出来的。基于这个有点偷巧的理由写下这篇小文,更多结合自己遇到的问题、产生的困惑自问自答,供日后对比、提高。
大概在16年前,由于做课题的缘故开始接触人工智能(AI,Artificial Intelligence)领域的一些东西。当时感觉AI的基本的思想是成体系的,但受当时的芯片、存储、通讯能力的限制,人工智能更多处在探索阶段,或者简单地说是“硬件不支持某些想法的实现”。面对如今AI的火热,我更倾向于认为原理的变化不多,更多是技术支持能力强了,能够支持部分想法的实现,因而也给了包括科学家在内的很多人以希望。但如果把希望变成现实,似乎还有很长的路要走。
动笔之前,除了通过搜索引擎进行学习,还特意花了两天时间读《世界科技史》,试图在在科学技术发展的脉络中得到启发,也因为不懂,所以想先明确问题、寻找方法,再深入学习。我想,这也是研究或应用AI的基本逻辑吧。
一、对人工智能的认识
(一)必要的铺垫
1、对解决问题一般过程的铺陈
解决问题的一般过程可以简要描述为:发现问题、定义目标、调查研究(收集信息)、提出解决办法、尝试解决、结果反馈与修正。不管是人的智能,还是人工智能,要解决问题基本上是按照这一逻辑过程进行。
结合个人了解的人工智能的现状,人工智能目前还不能有效地自主“发现要解决的问题”,这是讨论人工智能和人的智能的大前提之一,因为不能有效自主“发现要解决的问题”就意味着对于“人工智能会超越人类智能”的讨论还为时尚早。此外,人的智能也好,人工智能也好,解决问题都会遇到全部解决、部分解决、没有解决等情况,因此,在本文的讨论中,不关注主观期望和客观实现之间是否能100%符合,或者简单地说,人有做不到的事情,人工智能也一样,就不在效果上纠缠了。
2、对人的智能的简要铺陈
谈到人工智能,似乎有必要先说说人的智能。根据《现代汉语词典(第五版)》的解释,智慧是“辨析判断、发明创造的能力”,智能是“智慧和能力”。基于这个解释,排除情感等方面的因素、不太精细地说,智能大致上由知、行两部分组成:知是大脑的活动、行是躯干四肢活动,理想的状态是“知行合一”。
对于“知”,从知识的来源看,粗疏分为来自于直接经验、感性认识,以及来自于间接经验、理性认识;从知识的形成看,粗疏地分为构建基本数据库、构建二次与多次自主知识库(每一次加工都有其特定的目的和意义)、形成运用能力三大部分;从知识的运用看,粗疏地分为对已掌握知识的模式化应用、创新性应用、创造性提出三类。
对于“行”,主要是头脑和躯干四肢的行动能否协调,会不会出现行动跟不上脑子的情况。
结合对人的智能的简要铺陈,按照“仿生”的方法,这里也想从知和行两部分讨论人工智能,并在各部分的分析中,加入和人的智能的粗浅对比。
(二)从“知”的角度看人工智能
1、从获取信息的角度看人工智能
从直接经验、感性认识的角度看,“色、声、香、触、味”等显性的信息,以及通过传感器可以被识别、记录的数据与信息,都是人工智能的来源。比如最近出现频率比较高的“机器视觉”、“语音识别”、自动驾驶技术中的雷达回波、物联网中大量用到的传感器采集信息,等等,这些都是对人感知过程的模拟和延伸。
从间接经验、理性认识的角度看,就是以“机器可读”的形式,向计算机系统“喂”、或者允许计算机系统自己“读”各类已有的信息,比如银行系统、快递系统等存储的各类信息,比如棋谱。
借用大数据领域4V(数量Volume、多样性Variety、速度Velocity、真实性Veracity)的概念,人工智能领域的数据和信息同样可以视为具有这个4V的属性。在单体的角度看,与人获取直接经验、间接经验相比,人工智能的优势在于:只要不断电、不死机,可以不知疲倦地采集、存储数据和信息,采集的信息类型、存储量可以远远超过人类个体的生理极限。同时,和人可以持续地接收多样化的数据和信息相比,人工智能目前更多是接收、处理特定的信息,超出此定义的数据和信息,即便是同时出现,人工智能也是不采集、或者在处理过程中“过滤”了,在此我个人武断地将这种特征简化为“不定义、不采集”。也正因为“不定义、不采集”,在遇到超预期使用的情况时,人工智能系统中的信息在使用时可能会打折扣。
2、从形成知识的角度看人工智能
数据、信息经过加工才能成为可用的知识。这个加工的过程,可以简化为“映射”的过程,比如听到几个音符就想起这是哪首曲子、看到蜜蜂可能会联想到蜂蜜的美味也可能会联想到被蜜蜂蛰伤的痛苦,比如中国人看到“RMB”三个字母、美国人看到“$”这个符号海中就会浮现出钱的样子……呱呱坠地的婴儿是在长期的生活、学习中形成由简单到复杂的映射,形成自己的知识库,成为一个具有一定智力的人,人工智能也是一样的逻辑过程。
基于这个逻辑过程,人工智能和人的智能在当前阶段似乎有两个重要区别:
(1)从单体的角度看,人工智能形成的知识是基本上是专门知识,而人往往是专门知识、综合知识一起形成。比如“深蓝”形成的是国际象棋的知识,AlphaGo形成的是围棋的知识,读CT片的深度学习机器形成的是CT影像知识。但卡斯帕罗夫先生、李世石先生、借助CT进行诊断的医生,其知识是远远超出国际象棋、围棋和医学影像知识的。基于这一重要区别,至少会在讨论“人工智能是否可能替代人”时可以有所帮助。
(2)从数据量、信息量来说,无论是单体还是群集,人工智能所能够采集、存储的信息量的理论值,都能够轻易超过人的生理极限。这点上不需要过多说明,关于一张光盘能存下多少本书等有趣的对比,以及有问题问搜索引擎,有需要首先想到“查一查”,已经是大家的共识。
3、从模式化解决问题的角度看人工智能
武断地说,解决问题最简单的情况是模式化处理。模式化处理常见于单领域解决问题,并有两个基本前提:一是有够用的数据和信息、二是给定处理的模式。模式化能否成功的重要判据之一是“赢在速度”,赢在用超越人调取数据并模式化处理的生理极限。数据和信息越丰富,甚至按照“大数据”的说法能够在海量数据的前提下实现“数据样本=全部数据”,对模式化解决问题越有帮助。与人的智能相比,人工智能在客观存在可用的数据和信息、特别是具有大数据4V特征的信息的情况下,比起人的智能就有很大优势,因为其数据库、知识库能够远超人类。但同时,不可否认的是,目前人工智能算法中的模式,更多是人给定的模式、规则,以及机器通过自学习对这些规则的简单、有限的变异,限制条件还很多。以下棋为例,机器更多胜在对棋谱的掌握(海量历史数据)、基于走棋规则的快速穷举与推理(模式及其有限衍生),赢在超越人的生理极限的数据存储与调取、模式的穷举性应用与最优化选择、通过自学习产生对模式的补充和变异,以及可以“不知疲倦”所带来的稳定发挥,但如果改变下棋的规则,结果可能不同。类似的,日常生活中,类似语音识别、汽车导航等,也有具有模式化应用的特点。
4、从创新应用的角度看人工智能
创新性应用的角度,某种意义上是模型化解决问题和创造性提出的过渡地带。创新应用与模式化解决问题的主要不同,是对不同领域的数据、信息、模式的组合应用,比如把A领域的模式用到B领域,或者说取几个领域的模式进行组合应用。比如,CT影像是西医的诊断方法,基于CT影像,使之与中医某种诊断理论建立其关联关系,并形成治疗方案;比如自动驾驶,综合不同渠道的信息动态决策驾驶策略;比如,要设计一个医院,输入医院的等级(如三甲医院)、专业方向(如心脑血管、骨外科)、床位数量、所在地块平面图等信息,设计系统能够综合既往方案、实例,给出参考设计方案和重要提示项共设计人员参考(这个例子,其实我自己都笑了--好像有点太美好)。
5、从创造性提出的角度看人工智能
个人理解创造性提出,就是提出以前从来没有的理论。需要特别说明的是,发现以前没有发现的规律,也是创造性提出的一类,但为了避免和大数据中的关联关系分析、预测判断因理解的不同而出现争论,在本文中暂时不放在创造性提出这一类。
创造型提出新理论,牛顿的三定律、达尔文的进化论、门捷列夫的元素周期表、麦克斯韦的电磁理论、爱因斯坦的量子力学和相对论都是例子,各种创造性尝试也都是例子。从这个角度看,尽管假以时日,人工智能或许能走到这一步,但目前,我还是无法展开想像的翅膀想象出人工智能自主提出类似牛顿三定律的理论。
(二)从行的角度看人工智能
讨论了知,还有个行的问题。假定人工智能具备了基本的“知”的能力。在行的方面,大致有两种模式的考虑:
1、从是否包括物理执行部分看,分为两种模式
(1)只输出数字化结果,没有物理执行。这种情况在当前很常见,比如深蓝、AlphaGo和人的对弈,人工智能可以只输出数字化结果,告诉棋手在哪个位置落子;比如CT影像识别,告诉医生大致判断。
(2)不一定输出数字化结果,但需要物理执行机构执行。这种情况,多见于工业领域,目前比较热的仿人型机器人、无人机、自动驾驶领域也有这方面的应用,比如,Atlas仿人型机器人、各种无人车。
不管是哪种模式,都会有时延方面的考虑。如果时效性要求不高,出现秒级、分钟级甚至是更长时间的等待,是容易被接受的;但如果时效性要求高,就需要区别对待了。特别是在需要物理执行机构同步执行的情况下,“知行合一”是否能够协调,可能直接决定了整个系统的综合成本、研发进度,也直接决定了用户是否能够接受。一个极端的情况是,当用户认为“慢”、“不协调”时,前期99%的努力都很可能仅仅是探索,被认为是“不成熟”,而不会转化成为应用。
2、从人工智能和人的关系看,分为两种模式
(1)人工智能强自主。这种情况下,人的干预很少、甚至没有干预。比如AlphaGo和李世石先生的对弈、Atlas的仿人型机器人执行任务、无人驾驶汽车在完全自主价值模式下,都是自主执行。
(2)人-机协同型。这种情况下,是“人在回路”的协同工作状态,比如辅助残障人士的智能器官,需要残障人士参与其中;比如“外骨骼”,需要人发挥重要的操纵作用;比如埃隆·马斯克(Elon Musk)先生提出“人机生命共同体”概念,希望将微小的脑部电极植入人体,并希望未来有朝一日能够实现对人类思维的上传和下载。
三、对现实性、人工智能伦理等问题的思考
前面用了很大篇谈了自己对人工智能的看法,站在用户而不是研发人员的角度看,归根结底还是要在用上下功夫。自己肤浅的认识如下:
1、人工智能是个大概念,需要结合目标分层次看。人工智能是个很大的概念。用穿衣打扮作为不甚恰当的例子来说,从很廉价的街边货到一线品牌都是“衣服”,尽管大多数人都喜欢“好衣服”,但并不是一提到衣服就是特指一线品牌。人工智能也是如此,需要结合特定的应用场景、应用目标、经济能力综合考虑采取什么方案,毕竟“效果图”、“工程图”、“建成的房子”之间不一定是一致的,毕竟“最先进的”、“最前沿的”、“最好的”、“当前可用的”、“当前能够保证使用的”、“自己能接受的”、“用户能够接受的”这些形容词之间,似乎并不能画上等号。
2、人工智能是复杂系统,些微的提升可能意味着巨大的难度、巨大的投入。例如网上能够很容易搜索到的Atlas仿人型机器人的视频,我个人觉得非常震撼,但如果有人吹毛求疵说这个机器人和人相比“有点慢”,我也真不知道该说什么,只知道有一点可以确定:如果要进一步提高该仿人型机器人的反应速度、灵敏度,其技术难度、资金投入可能更为巨大。即便不用Atlas机器人作为例子,仅从医学影像诊断这类可以不包括物理执行系统的人工智能系统来说,其前期研发的成本、向其中“喂”数据的成本、初期用户的建设成本也是相当大的。因此,不管是研发还是应用,是否都需要在投入-产出上有个难度、投资非线性增长、甚至是指数级增长的心理准备。
3、人工智能系统不是万能的,需要结合目标做适当的选择。结合自己有限的视野、有限的思考,觉得当前阶段人工智能更多处在模式化应用的领域,在创新性应用、创造性应用领域还比较少。现阶段,人工智能也更多在数据的采集、存储、处理等方面用其超越人类生理极限的优势发挥作用,赛的是记忆力、试错的能力,承担稍微复杂些的工作,目前看还有些实现上的难度。因此,现阶段,或者说在比较长的时期内,人工智能还做不到万能的,在运用人工智能的时候,还是需要发挥人的作用,让人、人工智能做各自擅长的事情,而不是非此即彼、简单替代,特别是在涉及物理执行机构时,定个合适的目标。
4、重视科技伦理,造福而不是毁害人类。《骇客帝国》、《人工智能》等影片虽是科幻片,但其中描绘的人工智能等技术对人类的冲击不容小觑。科技能够极大地赋予人类能力,能力或许是中性的,但运用能力的人有正义与邪恶之分,核能可以造福人类、也可能毁灭人类的场景其实就摆在眼前。且不论人工智能会不会发展出、发展到具有情感、替代人类的阶段,仅从目前成指数发展的态势看,人类是否也需要理性地判断和控制发展的方向,毕竟技术无情,人有情。
(文章来源:谦尊而光)
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:houlimin
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。