AlphaGo Zero的启示:企业正在创新游戏中失败?
AlphaGo Zero的启示:企业正在创新游戏中失败?
2017-10-30 10:50:41 来源:亿欧网抢沙发
2017-10-30 10:50:41 来源:亿欧网
摘要:科学是一种比体育运动更深入、更混乱的实践。我们必须继续把时间、空间和资金投入到更大、更危险的飞跃上。企业在关注人工智能技术在应用层价值的同时,也该对科研能力引起重视。
关键词:
创新游戏
网易科技讯10月27日消息,据金融时报报道,我们很难不对人工智能(AI)产生深刻印象,甚至有点儿警惕。1997年,当IBM超级计算机“深蓝”击败了世界上最伟大的国际象棋选手加里·卡斯帕罗夫 (Garry Kasparov)时,它还是非常昂贵的硬件设备,并需要人类的密切关照和指导。
而对于计算机来说,围棋是比国际象棋更难掌握的游戏。可是,当AlphaGo在2016年低调地出现时,并经过短短几个月的训练后,它轻松地击败了世界上最优秀的围棋选手。上周,AI研究公司DeepMind推出了AlphaGo Zero。它的速度更快,使用更少的硬件,曾以100:0的绝对优势击败其前身AlphaGo。更值得关注的是,它完全是自学成才,而且只经历了72小时的练习就取得了这样的成就。
AlphaGo Zero的研究取得令人震惊的进展,已经引发了人们对机器人导致大规模失业的担忧。然而,这种焦虑与美国、英国令人不安的高就业率和令人失望的生产率息息相关。虽然目前还有大量的工作存在,但显然没有太多创新。对于这一悖论,有多种可能的解释,但最简单的解释就是:AlphaGo Zero是个异常值。与其相关的生产力和技术进步都是毫无意义的,因为AlphaGo Zero背后的研究并不是我们试图创造新想法的典型方式。
卡斯帕罗夫对这个问题的看法让人着迷。他在最近的着作《深度思考》(Deep Thinking)中,引用了已故计算机科学家阿兰·珀利斯(Alan Perlis)的名言,即“优化过程阻碍了进化!”在计算机象棋的例子中,珀利斯的格言可以解释为:研究人员选择实用的捷径方式来获得快速结果,而更深入、更危险的研究却被忽略掉。IBM“深蓝”的重点不是获得知识,而是取得胜利,但胜利的终点在科学上往往意味着进入“死胡同”。
这是一个耻辱。像阿兰·图灵(Alan Turing)和克劳德·香农(Claude Shannon)这样的计算机先驱们认为,国际象棋可能是一个可以在更有意义的领域发展AI的研究课题。这种希望很快被残酷的力量所排挤,这种方法只会教我们很少的知识,但却在国际象棋中表现得很强大。
很容易看出,为什么商业公司对如今由AlphaGo所提炼的早期模式识别技术几乎不感兴趣的原因。卡斯帕罗夫描述了在国际象棋中使用这种模式的方式:机器认为,当它们牺牲了自己的皇后时,很快就赢得了比赛。这台机器由此得出结论,争取每次获胜机会都要牺牲自己的皇后。
然而最终,这些模式识别技术已被证明,远比最好的象棋程序所使用的方法更加强大和普遍适用。问题是,我们是否希望改变自己的世界,或者仅仅是想要赢得一场国际象棋比赛。这不仅仅是一个关于国际象棋的警示故事。在其他方面,企业似乎也正在收敛野心。企业研究实验室曾经资助过许多最重要的基础研究,比如曾在索尼和IBM工作的江崎玲于奈(Jack Kilby)赢得了诺贝尔物理学奖,德州仪器的杰克·基尔比(Jack Kilby)也是如此,通用电气公司的欧文·朗缪尔(Irving Langmuir)赢得诺贝尔化学。贝尔实验室有太多的诺贝尔奖得主,还有香农本人。
这是一个公司敢于投资基础科学的时代。然而,这种情况已经改变了,正如三位经济学家阿希什·阿罗拉(Ashish Arora)、沙隆·莎朗·贝伦佐(Sharon Belenzon)以及安德烈·帕塔科尼(Andrea Patacconi)研究报告所显示的那样:企业仍在大力投资创新,但重点放在实际应用上,而非基础科学上。研究往往外包给更小的机构,而这些机构的知识产权很容易被买卖。
企业研究人员提出更多专利,但在学术期刊上却不那么显眼。正如阿罗拉教授所言,研究和开发已经变得“研究更少、开发更多”。他说,AlphaGo的研究是一个例外。这很重要,因为大多数基础研究最终都被应用在商业上。我们喜欢“金蛋”,但我们可能会饿死“金鹅”。
如果像大学这样的研究机构填补了这个空白,所有这些都不应该是灾难性的。然而,这并不是理所当然的事情。正如经济学家本杰明·琼斯(Benjamin Jones)所记录的那样,新的想法很难找到。其中一个迹象就是研究团队的复杂性,他们的规模更大,充满了越来越专业研究人员,而且成本越来越高。
或许,简单地劝说公司在基础研究上投入更多资金是幼稚的,但总得有人去做。一个有趣的方法是政府为“创新突破”提供奖励。这样的奖项调动了公共资金,制定出公共目标,同时也调动了私营部门的灵活性和多样性。但是这种奖励只在特定的情况下起作用。
举例来说,职业体育已经成为“边际收益”的流行趋势,即快速优化以寻找最微小的优势。事实证明,几十年前,企业研究也出现了同样的转变。边际改善并没有什么错,但决不能允许它们进行更多的投机研究。科学是一种比体育运动更深入、更混乱的实践。我们必须继续把时间、空间和资金投入到更大、更危险的飞跃上。
第三十四届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:yulina
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。