2019-04-29 15:11:39 来源:亿欧网抢沙发
2019-04-29 15:11:39 来源:亿欧网
在这个新组建的部门成员中,既有OCP(Oracle数据库认证专家),也有C#.net、Java、PB开发程序员,还有高工级网络工程师,更有科研项目组织能手,全都是身怀绝技的业务骨干。但是,一开始大部分人还不知道下一步具体该干什么、怎么干,自己能发挥什么作用。用“深感茫然”来形容,一点也不为过。为了给并肩战斗的小伙伴们鼓劲,我确定了八字方针“居安思危、迎难而上”,并勉励大家如果不想被时代淘汰,那就搏击潮头、改变自己,不断提升未来20年职业生涯的核心竞争力。
言归正传,作为一名“初出茅庐”的医疗数据探路者,我谨谈谈医院后信息化时代,如何让数据驱动新一轮医院信息化建设。
传统信息管理人员的核心能力在于对管理流程和数据流程的深入理解,在此基础上,准确把握用户需求,科学顶层设计,并优选适宜的技术开发或产品加以实现。而数据管理人员的核心能力在于对数据逻辑和相互关系的理解,以及掌握整个数据处理的技术链条,包括数据抽取、清洗、标准化、结构化、语义识别、存储、分析和开发等。这两者并非完全割裂,而是相辅相成,相互促进。这也是我们从信息管理岗位向数据处理应用岗位转换的优势所在。
然而,从信息管理走来的我们,劣势也不少。在上述整个链条中,有太多我们不熟悉的领域知识需要补课。譬如,拿最基础的数据抽取来说,抽取的方式、ETL工具、同步频率、一致性校验、字符集转换等细节都需要考虑。医院极其多样化、复杂的数据来源和类型,给数据汇聚与利用带来很大难度。下图从数据来源、数据类型、存储位置这三个维度体现了医疗相关数据的概貌。
做医疗大数据研究,正是要将这些分散的数据通过患者主索引(EMPI)等方式关联起来,通过大数据架构进行存储、处理,结合临床、科研、管理的需求进行统计学方法或全样本分析。
举一个我们在数据抽取过程中的小例子:由于历史原因,军队医院HIS数据库都是采用AMERICAN_AMERICA.US7ASCII英文字符集,因各系统间错综复杂的联系,绝大部分医院都没有转换成当前主流的中文字符集。于是问题来了,要想在数据中心采用中文字符集以兼容各种数据来源,就必须完成转换。我们采用了Oracle Golden Gate(简称:OGG)技术进行业务库实时同步和字符集转换,采用开源ETL工具Kettle进行数据抽取,在这一过程中遇到了一些问题。譬如:OGG要求归档日志必须延续一致,Oracle的SID不能发生变更,如果环境变了,前面的工作都可能要重来。对于大容量数据仓库来说,这就是“噩梦”。Kettle数据抽取工具的原理是,将英文字符集的数据表映射迁移至中间表,再写入中文字符集数据库。但是,对数据库字段中的空格等特殊字符的处理经常发生错误,处理blob等大对象类型的数据也存在问题。在数据开发过程中,如主流的Tableau、FineReport等报表工具完全不支持英文字符集,而有些实时数据的分析仍需要从英文字符集的生产数据中心直接得到分析结果。
这只是一个很基础、很小的技术障碍,可能有好的解决方案,只是我们暂时还没掌握。而这只是数据处理分析“万里长征”的第一步,还有无数“拦路虎”在前面埋伏着。我们深刻地感到,知识更新时不我待!
究竟还有哪些知识领域需要我们潜心学习?下图是我总结的一张大数据知识体系图:
术业有专攻。面对如此庞杂的知识体系要求,一个人精力有限,难以全面掌握和精通。但既然专业研究大数据,必然要求一专多能。所以,每位团队成员多少都要了解一些,并且要按这个知识体系逐步把团队打造好。
“互联网+”促使数据以前所未有的速度数量级增长,大家又开始讨论“数据思维”了。那什么是数据思维呢?
个人认为,数据思维是当数据积累到一定程度后,发生了量变到质变,用数据产生知识,进而反过来影响工作流程、业务模式和决策方式。有句老话说:“船到桥头自然直”,正是时代发展到现阶段,数据量、算法、算力这三要素共同催生的结果。用数据思维思考问题、解决问题成为当下各行各业变革的方向,这也是为什么数据产生的价值越来越大的原因。数据已成为智能化和人工智能的基础。大数据方法促使传统的统计学抽样转变为全样本分析,数据越大,得到的结果可能就越好。同时,大数据不再追求个体数据的“精益求精”,而转变为对效率的关注,快速采集、快速分析、快速决策、快速预见、快速创新和快速应用。当然,数据质量永远是一切数据利用的基础。
那医院又如何运用数据思维呢?
首先,要数据化。从患者就医到医护工作、物资设备管控等,绝大部分医院业务流程都可以通过信息化手段实现数据化,特别是运用物联网技术使人和物成为信息网络中的数据节点,这一重要趋势日益彰显。数据化有助于建立业务规范,并为后期精准管控创造基础条件。譬如,对于医院不容易管好的高值耗材,一些医院正在构建SPD体系(SPD是Supply-供应、Processing-加工、Distribution-配送,这三个英文单词的首字母缩写),通过信息化技术和智能设备,在供应商、医院各科室、患者之间建立全程追踪、全程质量监管、高效运营的医院供应链体系。
其次,要工具化。数据挖掘分析是一门精深的专业,数据并非人人想用就能用。要想让更多人享有数据红利,就必须将数据分析应用工具化。操作越简单、功能越强大的数据工具越受欢迎。譬如,过去我院医生要找一些临床研究用的病例资料,一般只能去病案室先查基本信息,再翻阅病案资料。不仅费时费力,还找不准、找不全。自从构建了医院临床大数据搜索引擎后,许多医生临床科研的小宇宙顿时爆发了。因为我们提供的是一个类似于百度、Google一样的工具界面,医生几乎不用经过任何培训,就能在几秒钟找到所需资料。
三是要善用数据解决方案。很多时候,惯性思维导致我们对一些问题一筹莫展,数据思维有助于解决很多问题。在重庆举行的2019 CHINC会议上,听了浙江省建德市第一人民医院相鹏副院长介绍的智能病案质控系统。他介绍,为解决医生在书写病历过程中滥用复制的问题,参考了论文查重的经验。医生在书写病历时,计算机系统自动进行大数据检测,如果某段病历相似度达到一定值,超越了常理,那么计算机系统会认为这是一份不合格病历,并且不允许保存提交。这应该是一个典型的引入数据思维的好办法,也是将大数据和AI技术应用在医院信息化基础环节的典型案例。
要用好大数据,不能闭门造车。我们中心成立以后,已到全院20个科室进行大数据服务介绍和临床需求调研。有些还是被院士领衔科室、排行榜王牌科室邀请去的。除了倍感荣幸、责任外,确实感觉到越是发展好的临床科室,越是对大数据、智能化的要求更迫切。
在与科室的交流过程中,我发现,医学专家和IT人之间的鸿沟并不容易逾越。有些需求,他们认为很简单,但在我们看来实现起来会比较复杂,还有一些则刚好相反。譬如,两年前我们就开始给乳腺中心做一个小型的基于临床指南的乳腺癌CDSS(临床决策支持系统),到现在还没完成验收。当时,我们认为很简单,先将指南结构化,建立规则知识库,然后结合患者诊疗过程中的各项指标推荐指南建议。然而,由于疾病的复杂性、人机交互的便捷性、数据接口的可用性等问题,导致系统难以真正落地和发挥应有价值。
究竟怎样才能让大数据中心成为医工结合的专业化枢纽呢?我认为应该关注以下三个方面:
一是加强学习,注重复合型人才培养。共同语言是有效沟通的前提,工科人去理解医生的思维方式是比较困难的。所以,对于医院信息专业人员要理解临床思维,就必须加强医学领域知识的积累学习,至少对医学基础常识应有所了解,少“开黄腔”或完全沉浸在自己的世界里异想天开。同时,着力构建医学大数据开发应用团队必备的人才结构,一般应包括:数据库工程师、大数据处理软硬件工程师、数据分析师、大数据与AI开发工程师等。其中,数据分析师最好有医学统计学专业背景,熟练掌握常用医学数据处理的模型、算法和工具。如果能有临床和科研经验的医务人员加入,那就如虎添翼了。
二是技术引导,价值推动。让医学人员及时了解可能在医学上应用的最新信息通信技术,是产生思想碰撞火花的重要条件。大数据中心人员在自身学习的同时,可将相关领域进展与成果的情报信息分享给医务人员,不断用新视野、新方法、新事物去“熏陶”启发他们。此外,医院总有一批对大数据与AI等特别感兴趣的医务人员发烧友,把这类“积极分子”的作用发挥好,至关重要。在日常工作中,大数据中心可以重点协助他们进行项目课题申报、论文撰写、定制化软件研发等服务,形成互相依赖、互相促进的共同体,把大数据中心的能力和价值充分释放、快速体现出来。
三是促进大数据服务职能化、规范化。过去几年,在医院开展大数据、AI应用都是锦上添花的事情,能做更好,不能做也问题不大,因为医院信息中心对常规需求都应接不暇、难以兼顾。而现在这一状况正在改变,以医疗大数据和AI等为核心的新兴领域竞争,不仅是医疗信息化发展水平本身的竞争,更是临床医技学科发展的竞争。医院大数据中心应该明确职能任务,把相关工作流程化、常态化。譬如,大数据平台构建维护、数据质量监管、临床科研数据服务、大数据与AI产品落地推广、定制化大数据应用开发等,应该成为大数据中心的常规任务。有任务就得有考核指标,这样才能有序良性发展。此外,随着大数据应用常态化,经常会有临床科室要求我们协助数据利用和导出。为此,我们制订了《医学大数据临床科研使用管理规定》,从患者隐私保护、数据安全、审批流程和医学伦理等方面进行了规范,促使我们提供的数据服务不再是“人情”活儿,而是规范操作,有章可循。
对于军改缩编形势下的医院来说,成立十来人的队伍专门从事大数据相关工作,可以说支持力度已算不小。但与目前旺盛的需求和如火如荼的行业发展态势相比,仍显势单力薄,要形成自己的特色优势和核心竞争力,需要精心谋划。充分借力发展,优势互补,特别是促进跨学科交叉融合,是个人摸索出的重要经验。
目前,我们中心已和中科院重庆院、中科院北京软件所、重庆大学、电子科大、北京大数据研究院等高校和科研院所建立了稳定的合作关系,有的合作已经产出了实质性成果。通过近三年跟这些单位合作,我们共同承担了多个大数据、AI、“互联网+医疗”等方面的重大、重点和面上科研项目。
值得一提的是,2018年,我们中心联合中科院等组织一批单位,联合申报并获批了一项国家重点研发计划项目——“基于人工智能的危重症事件追踪预警及决策支持服务”,这是2018年我院唯一一项获批的国家级项目,这也是我们多年来坚持学科交叉不断磨合结出的创新硕果。
该项目的主要研究内容是,采集和辨识手术中临床监护大数据,智能分析异常监护数据与主要危重症事件;融合HIS和EMR临床数据,并基于遗传算法、进化算法、深度神经网络,构建神经进化危重症不良事件预测模型;基于自动推理与认知技术,构建主要危重症事件人工智能决策支持知识图谱,实现监护期间主要重症事件的实时追踪、早期诊断和预警。
项目由我院临床专家主持,大数据中心人员从IT技术方面全力配合。虽然我们这个小团队对医学层面的专业贡献有限,但在组织研究团队、项目总体设计、数据治理、促进学科交叉方面,发挥了较好的支撑和桥梁作用。
基于多年的学科交叉合作经验,我也有一些心得体会与大家分享:
虚心求教,要充满求知欲。看似不太相关的学科,实则可能存在许多潜在关联。合作并非是完全依赖对方,而是建立在相互理解的基础上。通过广泛接触各类相关知识,融会贯通后形成新的创意。
善于思考,灵感来自碰撞。知识的学习是基础,在需求中探索技术,在技术研究中挖掘需求,这些都是灵感的来源。一次又一次的碰撞,总会产生思想的火花。
要有耐心,成果需要积累。学科交叉合作并非一蹴而就,更不是合作就一定很快有成果,要有足够的耐心。三人行必有我师,多结识些不同领域的专家学者,多了解些跨领域知识,机会总是留给有准备的人。
一吐为快!就算是一个大数据研究的入门者,或许还是门外汉,跟大家唠叨唠叨转型过程中的一些感悟吧。
活到老,学到老。路漫漫其修远,吾将马不停蹄去求索!
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。