杜力名:敏捷大数据助力智慧政府决策支持
杜力名:敏捷大数据助力智慧政府决策支持
2018-07-26 15:53:49 来源:CIO时代学院抢沙发
2018-07-26 15:53:49 来源:CIO时代学院
摘要:2018年7月8日,由中国新一代IT产业推进联盟指导,CIO时代学院、光明网主办,清华大学国家治理研究院、北京大学软件工程研究所联合主办,北达软、政府采购信息报协办的 "第十二届中国电子政务高峰论坛 "在北京大学隆重举行。
关键词:
敏捷大数据
智慧政府
2018年7月8日,由中国新一代IT产业推进联盟指导,CIO时代学院、光明网主办,清华大学国家治理研究院、北京大学软件工程研究所联合主办,北达软、政府采购信息报协办的"第十二届中国电子政务高峰论坛"在北京大学隆重举行。万山数据创始人杜力名在论坛上发表了“敏捷大数据助力智慧政府决策支持”为题的主旨演讲。
万山数据创始人 杜力名
首先杜力名为大家剖析了我国电子政务已经发展到了第四阶段。第一阶段办公电子化,主要是说我们利用一些电脑、打印机以及相关的办公软件,提升办公效率。第二阶段专业领域的信息化,是各政府的相关职能部门根据自己需要构建信息化系统,进一步提升工作效率。第三是公共服务信息化,是说政府部门面向服务对象提供各种各样的在线服务平台,为服务对象带来极大的便利。经过三个阶段的发展我们拥有了大量的数据,加上近年来互联网飞速发展带来数据激增,导致数据爆炸但知识贫乏的现象。具体怎么讲呢?就是政府部门缺乏挖掘数据背后隐藏信息和有利工具和相关的有效的方法。目前是难以发现数据中存在的关系和规则,更不能根据数据内容预测未来发展趋势。所以第四阶段目标以科学决策为基础的数据驱动智慧政务的方向,其重点解决异构数据特别是半结构和非结构化数据融合分析,并让非技术人员随时随地可以自助的获取数据,让非技术人员随时随地的自助进行数据挖掘等相关工作。
随着政务信息化更高层次的发展,我们应该需要一套决策支持系统来进行支撑。决策支持系统应该具备集成化、智能化和敏捷化三个特征。其中最重要的是敏捷化,从原来的业务人员提需求、IT人员实现的模式,转换成业务人员直接接触数据、直接在系统上进行相关的数据分析。
我国电子政务经过了多年建设发展,但还无法根据现有数据对未来趋势进行相应的预测,缺乏挖掘数据背后隐藏的知识的手段,所以才导致数据爆炸但是知识贫乏的现象的发生,其原因主要有以下几方面:首先是业务存储的分散化。主要指的是过去我们信息化的系统构建的方式多为根据特别具像的业务主题,所以业务流程架构等方面都是分散存在的,甚至有可能形成数据孤岛。信息私有性、安全性、规模性以及各个系统不兼容等原因,对所有数据源进行集中式管理并深度挖掘是不太现实的。第二是现行的电子政务系统不能对非结构化数据进行有效管理和利用。尤其是我们政府相关的办公的文件,很多常用的格式是word、excel、PDF等。这些数据有权威机构做了统计,这个占了政务核心数据的90%,但是这部分数据在传统分析角度一般是无法做分析的。第三是不能及时动态地对数据进行分析。这个主要体现在目前政务系统中统计功能基本都是固定报表,业务部门提需求,IT部门来响应。但是很多业务需求非常的紧急重要,很有可能某一个舆论的产生,如果不能第一时间把这个数据捕捉到,那这个时机就错过了。所以及时性存在很大问题。第四是分析结果和知识无法有效管理和传递。现在各部门综合数据分析还主要是将业务系统里面的数据导出成excel再进行二次分析,但是生成的文件在传递和修改过程当中会产生多个分支版本,并且数据会有一些缺失,所以这样的情况是比较普遍的。第五是缺少有效的面向业务的分析模型。基于这样的现象,政府应该建立一套能够快速反映经济运行状况的智慧政府决策支持系统。通过多种形式收集数据,及时反映重要生产生活资料等经济情况,对比不同渠道得到的信息所产生的分析结果的差异,确定一个准确的结论,帮助政府在合理的时间点上出台一系列的调控政策,并且能够根据情况的变化判断政策效果的滞后周期,提前结束一轮调控,而不是看到调控之后再停止某些政府政策的出台。
怎么解决这些问题?我们设计了一套基于敏捷大数据分析的智慧政府决策支持解决方案。首先我说一下方案的亮点。刚刚提到了面向用户方面我们一定要做成操作非常简单,所有人都可以参与的平台。面向业务场景,这个是基于数据了,基于数据我们做什么样的场景都是可以的。实时计算,如果结合互联网数据一定是海量数据的模式,至少达到千万级数据秒级可以响应。基于探索式分析,业务用户通过简单的数据配置组合,在一分钟内进行简单的拖拽就能实现内容非常丰富的数据分析文档。异构数据的关联分析,这个即便是数据比较分散,物理地址比较分散,存在各自的信息孤岛里面,但是依然能够融合,进行逻辑集中,最后让我们的用户人员可以集中来分析,还可以做KPI管理。从技术架构上来看的话,这个是数据整合的流程,首先要把结构和非结构化的数据进行第一轮的抽取,先放在基于大数据技术构建的数据缓存区域中,并为数据仓库建模做好准备。存的大量的数据和海量的数据,这部分数据主要是从各信息系统或者是某些数据源中汇聚到一起,这些数据是海量且杂乱无章的。我们要进行第二轮清洗,清洗之后形成数据仓库,在数据仓库里面针对不同业务主题,每个主题有各自的数据集市,再到上层做敏捷分析工具的数据分析。
有了数据,那还要结合数据模型以及数据挖掘的分析方法,还有要做数据分析的相关的工具。我们创新性地提出了基于影响地图的政务决策模型,解决了传统决策支持在技术与业务之间的断层。基于影响地图的政务决策模型是什么呢?影响地图是全球一线互联网公司极为推崇的一种产品的决策方法。将影响地图引入到政府决策里面来是可以根据要实现的预期目标,研究分析出需要从哪些方面入手、具体要做什么、原因是什么,同样根据结果与目标的差距分析判断出是哪些环节出了什么问题,为什么出问题,具体的问题是什么。
数据挖掘方法主要分为几个部分,它们形成了一个完整的闭环。数据挖掘是决策支持的核心。而且这个过程绝不是说单一的动作,它应该是持续的,一直在不断优化下去,所以会有闭环的动作。
数据挖掘、决策支持都需要敏捷的平台来支撑,我们认为敏捷数据平台至少要具备作为决策支撑系统来说,至少要具备三个大的特征,第一是融合各类异构数据,第二是可跨数据源进行探索式数据查询。第三面向非技术人员也可以进行自助式相关的分析。万山数据提供敏捷数据分析平台正是在这样的指导思想下设计研发完成的,目前已支撑了国家部委、省、市、县多个电子政务决策支持系统。
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:liukai
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。