首页 > 推荐 > 正文

鲁四海:大数据技术与医疗卫生应用

2019-04-02 10:27:44  来源:CIO时代网

摘要:2019年3月31日,由黑龙江省卫生健康委员会主办,CIO时代学院承办的 "黑龙江省卫生健康信息化建设培训班 "在黑龙江省医院成功举办。近400名医疗领域的专家与信息化负责人参加了本次培训,现场座无虚席。
关键词: 大数据 医疗卫生
  2019年3月31日,由黑龙江省卫生健康委员会主办,CIO时代学院承办的"黑龙江省卫生健康信息化建设培训班"在黑龙江省医院成功举办。近400名医疗领域的专家与信息化负责人参加了本次培训,现场座无虚席。北京大学信息化与信息管理研究中心技术顾问鲁四海发表题为《大数据技术与医疗卫生应用》的主题演讲。以下为演讲实录:
\
鲁四海
北京大学信息化与信息管理研究中心技术顾问

 
  很高兴能来到黑龙江和大家一起探讨大数据技术,及其在医疗方面应用。我的PPT和前面各位专家比起来就简洁很多,而且图表偏多。因为大数据的最终价值,不是在于数据量巨大、数据种类复杂,而是在于挖掘出简单的易于应用的知识,常常就是一个值或者一个图表。
 
  今天讲大数据技术与在医疗的应用,我们先看大数据技术的发展,实际上就是一个IT技术不断发展,分工不断细化的过过程,也是技术越来越进步的过程。在信息技术刚开始兴起的时候,硬件、软件都是捆绑在一起的,没有数据独立的管理系统,也就无从谈起数据分析应用了。
 
  数据挖掘的出现在上世纪90年代,是因为前一阶段数据库技术发展到了一定的程度,能够实现把数据从系统里分离出来并实现集中,所以很多的挖掘方法、模型都是在那会儿开始快速发展起来的。而进入大数据据发展阶段,得益于互联网技术与应用的快速发展,数据越来越多,处理要求越来越高,原来的方式不再能满足,所以催生了更细化的大数据技术的发展。逐渐形成了今天看到的大数据技术五个层次--数据准备、数据存储、数据分析、数据挖掘、人机交互(可视化)。
 
  讲到这里,大家应该看明白了,大数据的价值最重要的是结合业务进行科学的挖掘和易用的人机交互。因此,我们认为未来大数据的发展一定是自主分析。其实今天上午很多专家也提到了,医院里面有很多专家,也有很多数据,但是数据挖掘却做得不一定好,为什么呢,少了数据工程师,专家没法去解决数据准备、数据存储、数据分析的工作,但如果有一个自分析平台,专家们可以实现所见即所得的挖掘,那是不是能大大提升数据利用率。
 
  说完技术的发展,我们看看大数据对行业的改变。我们注意到大数据对传统行业的发展主要是三个层次,第一个层次是提升竞争力;第二个是业务创新;第三是模式变革。在提升竞争力这一块,很重要的是决策支持和安全保护,大数据让原来被动的安全防护变成主动防御成为了可能。被动防御,那是发展一个安全隐患弥补一个,这样的问题就是你永远落后了攻击方。主动防御是什么,根据用户的访问行为去做预警,简单说每个系统都有设计的用户访问路径,不按套路出牌的就进行进一步分析,将攻击行为拦截在未开始之前。
 
  下面我们看看大数据在医疗行业应用情况。这是我们之前做的一个调查发现,区域医疗平台方面应用起步较早,发展也比较快,主要得益于政策的推动;紧接着是基因数据这块发展较早,起初速度也很快,主要是资本的推动,但近一两年开始放缓,主要是应用场景的问题。还有就是健康管理,健康管理一直处于探索期,很多人都认为这是一个很大的领域,但是应用落地不多,毕竟大家都希望以预防取代有病了再治。
 
  另外,辅助决策是一个快速发展的领域,又分为运营管理、辅助诊疗两个大的方向。
 
  医疗数据很多是在医院,那我看看医院数据应用面临的挑战都有哪些。第一数据难以集中。第二,各种数据挖掘算法难以自学。第三缺乏数据模型和分析模型,这一点可能有人要反驳了,说我现在医院里面有很多数据标准,但是我想告诉你,那个不是用于挖掘的数据模型,数据的模型是说我这一个主体,它能够衍生出第一体指标有哪些数据项,然后在这个数据项再从这个视角深挖下去,这个才能被最终利用的。第四,数据科学与医学融合困难,两个学科,主要是在人才上面。第五,数据分析需求离散,每个科室要的点是不一样的。第六,没有专门的数据工程师,有好的想法,却拿不出数据来分析。
 
  这些问题现在已经可以得到有效解决。其实数据我认为不能共享集中在一起很大的一个问题在于我们的视角不正确。我们应该要站在数据资产的角度去看,把数据资源的血缘关系理清楚、生命周期搞清楚,然后从业务应用视角确定数据模型和质量标准。第二点,一定要让非技术人员能够用数据,很简单的用起来。怎么用起来?我们给他呈现的数据,不能是没有意义的标签,而是直接的按照他能够理解的业务语言去描述。让他们通过拖拽和点击配置就能实现数据获取。
 
  再有一个,离散需求,那能不能发动业务人员自己来去做分析呢?答案是肯定,比如万山数据的自主分析平台,简单易学,非技术人员半天的培训就能上手。
 
  我觉得能够长足发展的一定是模型积累,我们知道数据挖掘这块取决于模型的好坏,好的模型需要多方的协作验证,要在平台上实现多方共同参与。另外通过引用外部模型(比如R、Python开源社区已有不少经典模型)直接引用修改,将能大大提升数据挖掘的效率。
 
  简而言之,我们要做好数据价值挖掘,需要构建一个敏捷分析系统,对数据进行有效管理、治理,能够实现一次建模,多次使用。同时能AI等技术实现数据、模型的主动优化。
 
  我们研究出了数据挖掘的五步迭代方法,数据的挖掘是一个迭代的过程,随着应用的深入应该不断优化。而传统的以模型上线部署作为结束的方式存在的主要问题是:模型是根据当下数据和业务而定的,数据和业务都是发展变化的。
 
  从这个方法里,我们可以看到,数据挖掘项目的成败关键是对业务的理解,业务理解不对,再好的数据和模型也未必有价值,所以在这一个环节我们提出用产品的思维,基于影响地图作分析,将能很好的识别业务问题,并将期投射到数据分析项上。
 
  我今天的汇报就到这里,谢谢。

第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:baiyl

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。