2016-07-22 13:31:25 来源:CSDN
人工智能就像孩子一样,需要合适的教育来激发他们的潜能,也需要合适健康的饮食——高质量的数据。
业务的快速增长亟需人工智能加快判断能力,但是在人工智能的黑盒子里,要考虑的东西很多。人工智能所做出决策的质量和数据质量息息相关。有一句老生常谈的话——“废料只能出废品”,对人工智能来说再合适不过。
为什么呢?比较一下下面两种方式的区别就知道了。一般的分析方案会提供一个特定顺序的结果关系图表。如果你问一个分析程序,为什么北方的销售业绩变差了,你就会得到一系列可能因素的列表:供应链问题、人口变动、社会媒体倾向等。然后需要人工评估这些结果,最后确定到底是哪一个因素。而人工智能给出的答案将会更直白,如果你问人工智能这个问题,你将会得到唯一一个确定的答案。就这样,非常简单。
人工智能的方法将会实现很多商业用户的梦想:问一个问题,得到一个确定的答案,然后自信地采取下一步行动。这将会节省时间,带来更快速、更优秀的商业决策。
但如果人工智能是错误的呢?更重要的是,商业用户如何才能知道人工智能出错了?因为这个原因,依赖人工智能要比依赖分析方案付出更多的信任。对首席数据官或数据科学家来说,训练一个人工智能是莫大的责任。
用来训练人工智能的数据必须要干净、有相关性、可追溯数据来源。人工智能要保持“膳食平衡”,需要满足一下几点:
人工智能不能喝掉一个数据湖里面所有的水,这些数据是未经清理、打包和结构化的。根据CGOC(Compliance,Governance and Oversight Counsel),公司产生的数据中,有将近70%是没有业务关系、没有价值的,所以你必须开发一种方式,来理解和确定数据的范围,和人工智能所能接受的数据标准。使用什么样的数据?什么样的类型?数据之间有什么样的联系?谁来为决定负责?
一旦确定了数据资源,你就需要确保数据的质量。为了提高人工智能的可靠性,你需要了解数据的可靠度、真实性和内容对数据集合的贡献。这些可以通过热图和可视化完成。
因为数据通常都是由多个资源复制过来的,数据科学家和项目专家必须有一系列的处理过程,包括确定数据位置、审核和跟踪。
一旦确定了数据资源,你就需要确保数据的质量。为了提高人工智能的可靠性,你需要了解数据的可靠度、真实性和内容对数据集合的贡献。这些可以通过热图和可视化完成。
因为数据通常都是由多个资源复制过来的,数据科学家和项目专家必须有一系列的处理过程,包括确定数据位置、审核和跟踪。
你需要对数据进行标记和分类,以确保数据可以被正确地理解。由于人工智能的特殊性,元数据比其他数据更有价值。如果你 在关注市场数据,那么你得到的元数据会包括社交媒体网站的图片、物理位置、时间戳、相机类型和一系列数字。在医疗方面,元数据包括病人的身份证生日、数据时间戳和必要的隐私内容。
最后,你必须有控制系统的能力,能跟踪使用信息并据此进行更新。
对人工智能莫大的讽刺是,这看起来是一项完全自主的计算过程,是数据自我处理的一个过程。实则需要人类在某一特定方面的知识来训练人工智能。只有认识到人类工作的重要性,才能让人工智能作出正确的决策,避免过度自信。作为“父母”,我们必须不断的、有耐心地训练人工智能,直到他们能非常优秀地满足我们的需求。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。