CIO时代学院院长姚乐:大数据的行业应用策略

2016-11-08 10:50:30  来源:CIO时代网

摘要:近几年,互联网行业发展突飞猛进,“大数据”技术瞬间变得炙手可热,当然,对于发展中的大数据技术而言,很多行业都不会错失良机。近日,CIO时代学院院长、中国新一代IT产业推进联盟秘书长姚乐在“2016CIO时代中国行深圳站”活动上发表了题为《大数据的行业应用策略》的主题演讲,他从大数据发展趋势、整体的应用策略、不同行业的应用策略三个方面详述大数据时代行业的应用策略。
关键词: CIO 大数据 行业应用策略
  近几年,互联网行业发展突飞猛进,“大数据”技术瞬间变得炙手可热,当然,对于发展中的大数据技术而言,很多行业都不会错失良机。近日,CIO时代学院院长、中国新一代IT产业推进联盟秘书长姚乐在“2016CIO时代中国行深圳站”活动上发表了题为《大数据的行业应用策略》的主题演讲,他从大数据发展趋势、整体的应用策略、不同行业的应用策略三个方面详述大数据时代行业的应用策略。

\
  CIO时代学院院长、中国新一代IT产业推进联盟秘书长   姚乐

  以下为演讲实录:

  尊敬的各位领导、各位专家、各位学员,大家上午好!在台风中我们相聚在此实属不易,在这里感谢大家从外地赶过来。我与大家分享的主题是“大数据的行业应用策略”,第一是谈一下大数据的发展趋势,因为很多报告都在谈大数据的趋势,我就简单谈一下自己的看法;第二是谈一下整体的应用策略;第三是谈一下不同行业的应用策略,医疗、政府和制造业;最后是结束语。

  第一方面,大数据的发展趋势。

  以我个人的观点来看,我认为有三个趋势值得我们关注,这也是我自己的想法。第一个是数据资源鉴权的问题。我们有各种各样的数据产生,但这些数据属于不同的机构,或不同机构来采集。如何使这些数据的所有权得到保护,是很重要的一个问题,如隐私没有得到保护,信息安全得不到保证,数据的利用就会大打折扣。目前,我们已有用户的鉴权和系统的鉴权,但下面还应有一个数据的鉴权,这个数据归谁所有,谁可以被授权访问使用、但没有所有权。现在很多地方在建数据交易所,但这是很难做的。因为目前的数据交易没有解决数据交易中的所有权问题。数据应该在新的机制下规定他可以用,但是不拥有,只有使用权。我们过去一直在寻找这样的方案,我觉得区块链的技术可以帮我们解决这个问题,帮我们的数据进行加密,通过加密和授权来规定谁可以访问它、使用它。

  第二个与云计算的深度融合,未来的大数据服务越来越多,如果我们每需要一个大数据的服务就需要建一个大数据系统,这是一个巨大的浪费。现在的大数据更多的存在于物理系统上,以后会更多地存在于云上。还有各种各样的分析服务,如一些以SaaS的方式提供算法、模型等。不管是底层的大数据基础平台服务,还是上层的应用分析服务,我们都可以以云的方式去提供。

  第三个是与人工智能的深度融合,人工智能发展到今天,为什么我们却看到春天忽然来临?因为有了大数据技术,越来越多的数据可以进行处理和关联分析。根据这些数据,我们可以总结出规律和模型,还原事物本身的规律。特别是加了机器学习,机器可以自学习,通过数据不断地训练优化。这时的人工智能可以说即将迎来发展的春天,各个领域进入到人工智能的时代。但这时的人工智能是依赖于数据的,每个领域里面产生大量的数据,数据做什么?即最后为我们智能的决策和服务。所以各个领域中的数据与人工智能是深度融合。

  第二方面,行业大数据应用的整体策略。

  整体策略中我分了两个部分,一个是业务策略,另外一个是技术方面的策略。我们在技术方面开源的路线是一个方向,为什么要开源?开源实际上是竞争引起的。现在我们已经有大数据这个领域,其中大量的好东西基本都是开源。另外选择开源还有一个好处是不被厂商绑定。特别在大数据这个领域里面新的东西很多,因此,我认为开源是一个重要的策略。还有一个是从技术团队来讲,早期的实践者应该要有自己的技术团队。我们说一个领域成熟之后,你就不需要自己去做了,买服务就行。但是大数据如今还处于早期阶段,你要应用大数据就需要有自己的团队,完全依靠第三方是很难持续的。这里还需要敏捷开发与快速迭代,不是说一个项目做完就完了。

  在业务方面,一个是业务驱动,首先我们要找到业务的价值,如医疗给临床也好,在制造业给生产领域也好,我们要让业务深度参与进来,如果没有业务的深度参与,大数据的项目可能就流于形式。第二个是持续运营,从项目到运营,大数据一般不能当作一个短期项目来做,因为大数据的价值发觉是持续不断的,你作为一个项目来做的话,项目做完了就完了,我们一定要持续挖掘业务的价值。

  第三方面,不同行业大数据的应用策略。

  首先我们看一下政府行业,我们都从SWOT分析开始。从政府行业来讲,政府行业做大数据,它的强项是什么呢?政府有数据资源,很多机构都会产生大量的数据资源。还有其业务本身是数据密集型的。但是它做大数据的弱点是驱动力不足,不像企业为了做一个精准的决策可以花很大的代价去做。政府做大数据本身的驱动力是非常弱的。另外它的机制不够灵活,各种数据分散在各个部门,如何将数据共享、多维度整合,这也是弱项。机会是什么呢?国家互联网+战略和国家大数据战略、国家的重视和推动。它的威胁是什么呢?威胁就是权利与利益的阻碍,政府要做大数据,大数据分割在不同的部门,用数据来说话一定会影响到很多人的权利和利益的问题。另外是政府形象工程也是一个威胁,没有一个很明确的推动力,没有来自实际业务需求的驱动,那么项目可能是形象工程。

  政府做大数据的策略,我认为管理监控和市民服务是应用的重点。因为政府很大程度上就是做这两件事,我们说大数据目前在互联网公司,包括风控、金融,对政府而言也有很多数据分析场景,如何基于数据发现问题。前段时间我与一位深圳国税局的局长聊,他说通过大数据发现深圳税收的很多问题,偷税漏税等问题通过大数据来发现,还有很多的例子。还有一个是市民的服务,有了大数据,我们便有了人的行为数据,我们为老百姓做精准的推送服务,一个孕妇还没有生小孩,你就知道他生小孩需要什么样的服务,生了小孩之后需要什么服务,真正把被动变成主动服务。第二,政府做大数据要找好运营的合作伙伴,包括购买服务。政府过去都喜欢做大项目,在大数据上政府要找到好的合作伙伴,并且购买服务。第三是做好公民隐私保护和责权利划分。

  第二个行业是医疗行业,先看它的SWOT分析。它的强项也是有大量的健康数据,医疗服务主要是基于数据,包括问诊,做各种检查,这些都产生大量的数据。它的弱项是数据被割裂在不同机构,我们在不同的机构看病,我们的信息都被割裂了,这是不利于我们做大数据分析的。还有数据与医学的融合问题,医学还是一个很专业的领域,每一个病种都不一样,甚至同样一个眼科还分很多类,要做好大数据的建模、算法、判断,这里没有医学人员的深度参与是很难做的。不像别的领域,如电商、政府,我们随便想几个算法就可以搞点应用出来。但是在医疗领域涉及到的范围广阔精深,因此,数据与医学的融合是一个弱项。机会是什么呢?电子病例与电子健康档案建设,还有可穿戴设备,这些都在实时产生数据。这些数据有了,但准不准、全不全是另外一回事。它的威胁是什么呢?患者隐私的泄露,隐私不仅仅是我们的身份隐私、电话号码等,还有一个隐私是我们的健康状况,一旦具体到人都存在很大的社会问题。还有一个是连接带来的安全问题,我们为获取数据,会利用可穿戴设备或可联网的医疗设备,这会带来很大的安全隐患。

  医疗行业大数据的应用策略,我也想了三个,第一个是辅助诊疗和个人健康服务,这是应用的重点,辅助医生的诊疗是大数据应用最好的领域,我们每个医生都需要大数据。第二个是建立以个人或患者为中心的健康相关数据关联,我们国家建立电子档案也是出于这样的目的,建立以人为中心的全生命周期的健康数据,但这个没有真正实现。如果未来要真正实现对人的精准健康服务,这种数据是非常重要的。第三个是建立隐私保护与数据利用相结合的机制,一方面我们要保护公民的个人隐私,不知道这个数据是谁的,第二要利用这些数据,这些数据不仅对我们自己,甚至对所有同类的人而言,我们能发现、预防什么疾病,因信息的关联性,大数据可以告诉我们其中存在的关联。由于隐私得不到保护,这些数据都被分割在各个机构,这些数据没办法得到利用。区块链可能给了我们一个很好的解决路径。通过区块链的连接,加密和授权,患者可以授权医疗机构使用自己的健康数据,同时,我们还可以在保护隐私和防止泄露的情况下对数据进行分析和利用。

  第三个是制造行业,也是先看SWOT分析。它的强项是有大量机器传感数据,工业化阶段已经走到自动化的水平,自动化是我们下一步走向智能化的基础,下一步如何实现智能化?即通过大数据的采集进行最优的决策,便可发现问题。其弱项就是设备数据格式的非标准化,如今各种各样的设备采集的数据都是非标准化的。以及现场全流程数据的实时采集、存储和利用,真正的智能化无人工厂,那就需要在工厂中进行全业务、全流畅的数据采集、存储和利用,发现存在的问题。其中涉及到流程的分析及需要什么样的数据做什么样的决策。机会是中国制造2025和互联网+制造,还有机器替代人、机器所做的工作。人是智能的,在什么样的场景下做什么决策,如果机器人替代人,简单的劳动已没有问题,但相对比较复杂的、需要进行决策的,那就要依赖于数据,它会根据现场不断地学习、不断地建模做算法。它的威胁是替代工人和专家的阻力,要替换这些人,要让他自己搞一个算法将自己替换掉,这是有阻力的。以及早期使用的高昂成本,当这些东西还没有成规模、仍处于早期探索时,成本是很高的。因此很多企业都有可能在这方面的投资是很大的,但效果是很小的。

  制造行业大数据的应用策略也有三个,第一个是设备维护与智能工厂,这是应用的重点,设备没坏之前可预先知道它存在的隐患,即设备的异常检测。第二个是充分利用大数据云服务降低成本。第三个是将积累的算法和模型作为核心竞争力,未来工厂如何做到效率最高,逐渐会变成算法和模型,这是我们的核心竞争力。

  最后,谈一下结束语,今后应该没有大数据和小数据之分,它们都位于一个统一的数据处理平台上,不论是结构化还是非结构化的。同时,也没有交易数据与分析数据之分,数据产生的同时就在进行实时分析。目前这两件事基本上是分开来做的,随着数据处理的效率大大提高,未来做大数据分析,我们不可能等待着业务产生完之后再去进行分析,而是业务发展的同时数据就在实时计算、实时决策,在实时场景之中做分析。可以说,一个全面的基于数据的人工智能时代正在来临。谢谢大家!
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:姚乐

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。