随着物联网、社交网络等技术的迅猛发展,大数据时代已经到来。大数据的应用涉及到经济、文化、教育、医疗、公共管理等各行各业。2017年4月15-16日,由中国新一代IT产业推进联盟指导、CIO时代学院主办、CIO时代APP承办的“第二期政府CIO”论坛在北京宽沟会议中心顺利举行,北京市信息资源管理中心总工程师穆勇在活动中发表了题为《“互联网+政务”之道:大数据、平台及其应用》的主题演讲。以下为演讲实录:
北京市信息资源管理中心总工程师 穆勇
各位领导、同学、朋友,大家好!非常高兴能与大家一起交流有关大数据平台、应用等方面的工作。分享的内容主要包括四个方面:第一,把一些理念和想法与大家讨论,形成一个初步共识;第二,如今大数据炙手可热,不管是电子生活还是智慧城市,已达到了以信息资源开发利用为核心的阶段,此过程中信息资源的管理与使用方法;第三,怎样进行一体化体系的设计,与互联网+政务相关,通过外部公共服务,倒逼政府内部一体化整合,内部的协同等工作;第四,平台在云计算、大数据、人工智能、移动通讯等新技术的环境下,怎样重构和重组,与大家分享实际案例。
一、电子政务概念的理解
首先,大家对电子政务的概念应该有新认识,很多人认为电子政务是办公自动化,但广义的电子政务,是将其扩展为政府的信息化。
(一)电子政务应用进入新阶段
电子政务发展过程可分成三个阶段:
一是起步阶段,业务系统建设;
二是普及阶段,信息共享与业务的协同;
各部门分别建立自己的系统,形成一个逻辑集中、物理分散的一个有机体。从2006年到2008年之间,各地政府都在做共享交换平台和资源目录体系,通过设施,将各自独立建设的各种机房、设施集成在一起。在数据资源的逻辑集中,通过目录体系将其统一管理,存储和计算是分布式的,分布到各委办局、机房和物理机上。
三是深化阶段,互联网+政务。
其核心有两个方面:
一是以公共服务为中心,电子政务一体化体系的整合和建立。更多转向以服务为核心的一体化转型,转型有两种模式:一种模式是解决一个出口和入口问题,或在原来所有公众部门的审批服务上,包一个外衣;另一种是进行内部深层次的整合,把这个阶段叫做一体化整合阶段。
二是数据资源物理集中,逻辑分散。在这个阶段中,数据资源是开发利用的核心,它的特点发生变化,特别在新技术环境下,数据资源物理集中,逻辑上分散。例如,北京已经做到这步,市级委办局所有的新建系统必须上政务云,政务云指定一朵或两朵,现在六里桥有一朵,通州正在建设第二朵。委办局搬过去后,原有的机房,除了个别的数据(公安的或安全的)全部上到政务云,以此形成了2+1模式,两个云平台,加一个灾备。数据资源从设备、机房、数据等整体看,物理上是集中在一起的。
逻辑分散的原因有两方面:一是虽然数据统一在一个机房上或一朵云上,但数据的主权、管理权和责任是分散的;二是数据物理上集中在一起,实施时是分散的,它的存储、并行计算、分步式都是分散的。很多人不认可这样的新观点,但它可能是一个阶段,现在和未来会有一个长期并存的阶段。这是第一点认识,供大家批判。
(二)国家治理体系变革和经济转型的新要求
一体化转型过程中既有挑战也存在机遇,国家对治理体系变革、经济转型和社会转型既提出了新要求,同时创造了条件。例如北京,前几年,在全国范围内,北京的电子政务是排在领先的,包括区县,朝阳、海淀等。近期,在实施信息惠民和公共服务的时候,北京的排名靠后了。
过去,政府采用的是自己的业务系统,面向内部使用,但面向老百姓时,老百姓的体验的效果不是很好。对于一体化整合,惠民服务,强政和兴业做的好,但信息资源管理中心的惠民服务相对较弱。
(三)技术的快速发展带来的机遇和挑战
这些新要求需要我们将旧系统进一步整合,同时新技术提供了新环境。在新的环境下,原有的很多东西需要升级和重构,其中最重要的是思维方式的转变。
例如电子政务的建设模式,要借鉴互联网思维。对于互联网+政务服务,首先应是思维的变式。在建设互联网+政务的过程中,还存在很多问题,整体绩效不高,重复建设严重,与社会和企业的信息化比较,政务是滞后的。十年前,专家认为,整体国家信息化是电子政务,国家信息化先行,然后带动和领导社会和企业信息化,但当前的结果是反过来的,社会信息化和企业信息化,特别是互联网信息化,走在了政府的前面。
(四)电子政务建设模式的改变
我们做了很多年的电子政务和信息资源管理,过去也进行了数据资源开发利用和数据处理,现在讨论政务大数据,两者间的关系是在不同的阶段,处理数据的特点不同。过去在处理政府数据时,集中在结构化报表、文档、统计等。政务数据按分类有三类:第一是业务类的,过去处理的很好;第二类,统计报表也处理的很好;第三类,相当于环境数据,实施来源于物联网实时数据。由于当时的技术手段和采集能力有限,对数据重视不够,到了大数据阶段,三类数据统称为大数据。在这个阶段,要用新的思维、技术、方法和模式来处理数据。因为数据本身的含量变了,处理的手段、方法、思路也就变了。例如并行计算和关联分析,过去数据的处理并不是大数据。
(五)政务大数据及其应用
大数据在政务领域的应用,无论是在数据多样性还是需求复杂性上,相对于电商和互联网企业,政府的处理是更加复杂的、覆盖面大、难度大。
1.领导辅助决策
现如今,对于大数据的应用,领导决策是最重要的。但领导决策是有条件的,要有意识,方法与过去也是不同的。能做到这一步,相信发展肯定是没问题的,如果做不到,领导决策系统是达不到理想的效果的。2006年,北京做了市领导决策系统,将政府所有相关的数据系统接到市领导的桌面,然后进行服务。这样进行下来,最后发现实用性不是很强,效果也不是很好。因此,大数据应用并不是那么简单,从使用到发挥作用是有一个过程的。
2.政府精细化管理
对于政府的数据精细化管理,大数据与过去数据的结合是至关重要的。例如,信息资源管理中心的疾控中心做疾病统计时,艾滋病患者的统计报表采用传统方式,但会加一些新数据,包括互联网,百度的搜索引擎数据,通过它会发现某个地区,某个时段,突然查询检索相关数据人员增多。在这个阶段,该地区可能会出现艾滋病相关患者增加的状况。
这种数据与传统数据相互比对、相互印证、相互完善,将原有的报表进一步完善,混在一起应用才是最有价值的。但这并不意味着百度能取代传统的东西,也不是只保留传统的东西,不采用新技术和数据,应将它们结合在一起,新旧数据结合。对于政府而言,传统的统计报表还是最主要、最核心的,当然也不能排斥新技术和新手段。
3.服务方式产生的影响
在新的环境下,平台建设发生了很大变化。在平台整合时,思路是不同的。过去做一个系统,从数据采集到平台搭建,再到上面的应用,从上到下有很多应用都只是做自己的小应用,平台层和底层共采用最好的技术设施,共性组建平台。
(六)推动电子政务转型升级的关键
电子政务进入了互联网+阶段,以信息资源开发利用为核心,借鉴互联网思维、商业模式和成功经验,倒逼政府信息化的改革。变革提供了强大的需求和动力,也突破了原有的体制机制障碍,创造了条件。新技术的使用,需要我们重新反思电子政务的体系和技术架构,真正做好转型升级,需要以下几个方面的努力:
第一,做好数据资源的基础工作。用点工匠精神、绣花精神,将我们的核心业务和数据做好,梳理清楚。当到达信息资源开发利用为核心的阶段时,如果你自己的家底搞不清楚,是无法做大数据的。
第二,进行一体化服务体系的整合。需要落地顶层设计方法,原来的顶层设计很多停留在概念层和逻辑层,很宏观,很战略,但要采用它来指导或做架构整合时,发现它是不够用的。
第三,在新思维、新技术环境下,共性形态的重构。将原来物理分散的共享交换平台、基础库、移动平台和物联网平台放在云上后,共享交换平台在云中,数据的交换问题与很多变化需要我们思考的。
二、建设数据资源管理体系
(一)数据资源管理需要解决的问题
信息资源做起来并不复杂,过程中待解决的问题归结两大类:第一类,管理问题。在管理上,包括数据的采集、加工、共享开放,最后进行使用,管理责任的开放等问题。第二类,可用性问题。数据开放后的使用问题,信管局2006年建立了系统,进行了数据共享,但数据口径、标准、格式、质量、系统存在一系列问题,并不能使用。
在数据的管理责任和可用性问题解决后,数据管理体系的建设基本完成,便需要好的系统来支撑管理使用,最后找到了信息资源目录。做信息资源目录时,并不是按照目录原数据要求把数据填充好,而是希望通过它解决数据管理责任和数据可用性的问题。
(二) 业务梳理与目录编制
做信息资源目录时,如果不是以解决问题为出发点,端正态度,最后的结果一定是失败的,它已经被实践证明过。在2007年和2008年,国信办组织了七省八市和一些部委做信息资源交换体系和目录体系的试点,没超过两年,基本上是没办法使用的。因为部分单位认为编目录很简单,导致两个问题还是没有解决。通过反复研究,把资源目录作为业务的基础工作,数据管理的基础工作和信息化的基础工作来抓,进行梳理业务和数据分析。
(三)工作目标
从数据采集、采集责任、数据共享等方面解决管理问题,数据在哪个系统、哪个数据库中将其进行整合。以此为原则来做工作,情况明、数据准、素质高,配套信息资源目录体系的建设,将数据梳理清楚后,将数据资源以目录的形式体现出来。第一大类问题,数据管理的责任确认问题便解决了。在数据的采集、共享、开放、使用和位置的问题解决后,在此基础上进行第二项工作,解决数据的质量标准问题。
(四)政务信息资源目录组成与分类
目录的制作过程包括前期准备、目录梳理、目录生成和目录运用。在整个过程中,思想和方法与过去是不同的,先通过业务和数据调查,并不是通过资源目录的调查表直接形成目录,而是根据业务流程关系,业务的先后、岗位关系来确定采集责任和管理责任,再根据数据的需求、前后关系和业务前后关系确定数据是否向下一个单位进行共享、开放和使用。
(五)目录工作推进思路
目录不是直接填充的,而是通过业务的梳理,数据的梳理,最后生成出来的。很重要的一条是,在原业务流程中,例如一个串行的,经过梳理后业务变成并行,再进行了优化,数据关系应在优化后跟随业务形成的。在信息共享管理办法中,在进行公共服务时进行业务梳理和优化,在此基础上进行数据共享和交换。原数据关系数据采集完后,供给他人使用,优化后变成并联,数据便可同时共享,数据的共享关系发生了改变。
(六)工作过程
当时目录生成后,进行管理责任和管理属性的确认,最后形成部门目录。首先确定,经过领导确认部门的共享目录、开放目录、决策目录后,实施相关的共享开放操作。
第四步,重点解决它的可用性问题。数据在哪个单位负责,其它单位需要共享,解决共享问题后各单位是否能使用的问题,于是需要解决它的标准化、口径一致性、质量等问题。第四步重点做数据的标准和操作规范。同时,为了保证数据很容易通过系统,按照需求给到各单位进行有效使用,还需要将系统进行有效的整合,构建出目录系统和交换系统。
在目录制作过程中,背景和含义是需要认清的,目标是为了解决其管理属性问题和可用性问题,以及系统调用问题。要保证做出来的东西是有价值的,否则一切都是徒劳的。
(七)目录编制方法
目录编制的梳理办法有很多,可以从职能业务和系统方面进行梳理。有些软件做系统梳理,有些工具是从这方面梳理。对于调查业务调查表,主要分享几点。每个岗位要梳理自己的业务,每个业务前面有前置业务,对岗位业务进行梳理后,不同岗位的前后业务关联在一起形成了业务线。不同业务线的业务在不同处室业务线关联后形成了业务域,这个是很重要,需要每个人将自己业务梳理清楚后相关联。
在梳理过程中,业务产生数据、产生资源、建立数据关系,办理业务必要进行数据的提取,在梳理完业务后梳理数据,包括它的管理责任、共享范围等一系列工作。画出它的流程,并进一步进行优化,优化后再生成它的目录,做数据标准和操作规范。最后生成一套东西,将数据能够有效的从采集到共享使用串下来。
三、一体化服务体系设计及平台重构
(一)政务服务信息系统体验感觉
解决了入口和出口问题,内容是根本问题。由于重复提交数据,体验差,便提出了一体化整合的需求,要以公众为核心进行一体化整合。整合不是一步到位的,是一个过渡阶段。在军事上,国外也在做,包括美军一体化作战。它要将分散的系统从内部整合成一个有机整体,而不是只解决一个出口入口问题。所有政府业务审批,放到服务大厅和网上后,体验还是较差的,真正体验方法是要有一个顶层设计的法则,形成一个架构,然后一体化的实施。目前,架构停留在概念层,国内电子政务的方法很多,但真正落地的很少。在此基础上,信息资源管理中心经过多年的实践和探讨,有一套自己的东西,是基本上可以落地的。
(二)系统一体化整合
在新技术环境下,原来各自建立起来的各种平台,包括共享交换平台、移动平台等,进行有机的整合和重构。首先,云平台的建设是大势所趋,各委办局自己建机房是不被允许的,除特别的许可外。后续的整体数据存储架构,物理集中,逻辑分散。分散这些按领域,按使用来进行分散,各委办局在它使用范畴之内按照物理集中,逻辑分散的概念处理数据。
对于平台的整合,在底层整合后,机器变成了虚拟的计算和存储,还包括一些共性的组件和平台,应将它们整合在一起,然后各委办局在平台上只做自己小的应用,可以向第三方开放,向社会开放后继续开发。开放数据时应尽可能将数据共性统一,各委办局要做好自己负责的区域。这个过程分为三个阶段:第一,是原来自己各自为战的阶段,第二是将基础设施、存储和计算的环节云化阶段。第三是应用阶段,包括中间层,云化。目前,资源中心正在构建通州的政府市级中心的大数据平台,共性组建放在上面。根据各委办局的情况,个别会建设独立的机房,独立的物理机,现如今,大多数委办局处在第二阶段,直接将系统搬到云上,用我们的云存储和计算。
四、政务大数据应用案例
原来是从上到下,从树根到树干,再到树冠全是各委办局自己来做,将来可能只需要做树冠、树干、树根,像存储、计算中间等很多是共用的,当然也存在部分有特色东西的保留,这将是一个趋势。
采用大数据、云计算的新架构后,其可靠性加强,成本大幅度降低,通过比较实验、物理集中是大势所趋。进入大数据环节,采用传统思维、传统技术、传统模式来处理是做不好的。
这里有两个案例,一是公交车的卡数据,有GPS数据,然后对北京市的吃住行进行分析,在住行分析的基础上做北京的疏解方案。比如疏解哪些学校、医院,电办在做方案的时,将这套系统做了一个支撑,按照现有的方案,疏解完后效果才是最重要的。二是汽车分析,过程中采用了统计数据,运用了互联网等方方面面数据来共同对汽车产业进行分析,对京津冀各地的汽车产业进行分析,只靠大数据是不行的,要新旧信息结合,实实在在的进行分析。
谢谢大家。
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangxuefeng
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。