首页 > 推荐 > 正文

胡小明:区分两种数据使用模式

2020-04-13 09:59:30  来源:CIO时代网

摘要:描述基本概念的词汇其表达的内容富有弹性,其含义会随着场景不同而发生变化,“数据”通常用来表达计算机所处理的各种数字化内容,但是当数据与数据集并列时,数据只代表着具体的数字而数据集是数据的集合。准确理解基本词汇不同场合的不同含义是深入讨论的基础。
关键词: 信息型应用 数据型应用
一、信息型应用与数据型应用
 
  概念清晰是降低系统复杂性的基础。
 
  1.1数据与数据集
 
  描述基本概念的词汇其表达的内容富有弹性,其含义会随着场景不同而发生变化,“数据”通常用来表达计算机所处理的各种数字化内容,但是当数据与数据集并列时,数据只代表着具体的数字而数据集是数据的集合。准确理解基本词汇不同场合的不同含义是深入讨论的基础。
 
  1.2两种数据用法
 
  政府与企业的规范化业务大都是直接处理数据的业务,计算机替代人的工作也是直接处理具体数据,数据处理可视为是一种计算,计算方法是确定的,算出什么结果要由输入的具体数据而定,这是数据的一种用法;另一种用法是要获取信息,信息存在于整个数据集之中,必须通过统计分析数据挖掘才能将其凸显出来,信息是数据集的属性,信息获取主要是对数据集进行数据挖掘。
 
  1.3两种名称的界定
 
  本文把直接使用具体数据的应用称为“数据型应用”,把对数据集进行挖掘提取信息的应用称为“信息型应用”。
 
  二、知识获取与操作应用
 
  认识世界与改造世界是两个不同的应用方向。
 
  2.1 知识获取需要信息型应用
 
  知识获取是人脑行为,计算机数据处理辅助人脑获取信息,单独的数据包含着极大的偶然性,并不能反映事物的本质,反映本质的信息存在于数据集整体之中,需要通过统计分析、数据挖掘等手段剔除偶然性,挖掘出能够反映问题本质的信息,才能用于增长知识改进决策。这种信息是对数据集分析处理的结果,是高于数据层次的产品,政府决策需要这种信息型应用。
 
  2.2 操作业务需要数据型应用
 
  服务型业务流程规范化才能实现有规模的服务,规范化才能保证处理结果的一致性,政府的公共服务与业务管理都是标准化的数据型应用,只依当事人数据照章办事,没有操作人自由量裁的空间,不需要信息概念,由自动化系统处理数据,数据型应用模式不仅保证了结果一致性,还有很高的处理速度。
 
  三、模糊处理与精准处理
 
  模糊处理调用的是数据集,精确处理调用的是具体数据。
 
  3.1 信息型应用对数据是模糊处理
 
  信息型应用模式是对数据集进行处理,以获取数据集包含的深层次信息,为此必须要排除偶然性,各种统计分析、数据挖掘措施都是在排除偶然性,因此信息型应用不在意个别数据的误差,尤其是大数据处理完全能够驾驭混杂的数据,大数据对数据误差不敏感是降低数据处理成本的有利因素。
 
  3.2 数据型应用是对数据的精准处理
 
  数据型应用的是当事人(物)的有关数据,数据是规范化流程的处理依据,容不得半点差错,数据型应用使用的数据常是业务连续处理的记录,每项具体服务与管理业务的数据不可替换。数据型应用是对数据的精准使用。幸好数据型业务涉及的数据量有限,使数据维护的成本不至于高到无法接受。
 
  四、一次性业务与连续性业务
 
  信息型业务只是为人脑获取信息做准备,数据处理产生结果后任务就结束了,数据型业务则是连续的服务,为响应外部需求系统不能停止运行。
 
  4.1 信息型业务是一次性的
 
  信息型业务是人与计算机共同合作的业务,数据集包含的信息是多维度的,从什么视角来挖掘信息是由人脑决定的,这是信息获取行为必然带有的主观性。信息型应用是对数据集的信息挖掘,获得的结果需要由人去理解,理解的内容才能成为人脑中的信息。数据挖掘的结果一旦交付信息型数据处理任务就结束了。
 
  4.2 数据型业务是连续性的
 
  数据型业务系统的服务由外部需求驱动,外部有需求系统就要响应,因此数据型业务是连续不断的服务,例如手机支付的服务系统就需要不停顿工作,保持对外服务的流畅性。政府为用户办事的自动化系统也需要连续地运行,以满足社会的服务需求。为适应外部连续的需求,数据型应用系统会设计成高度自动化的流程。
 
  五、高层应用与基层服务
 
  高层决策面对不确定性问题时,需要获取信息降低决策风险,基层操作处理确定性问题则靠数据型应用提高操作效率。
 
  5.1 高层决策关注信息型应用
 
  高层决策依赖的是信息,大规模的数据必须加工成能够理解的信息才能影响决策,信息型应用的目标是获取信息提高决策质量,所获取的信息与人脑中已有的信息相结合发挥作用。大数据时代信息型应用越来越重要,它能够帮助领导层更深刻认识环境与发展趋势降低决策风险。当然大数据不是万能的,它所提供的信息只是问题的一个方面,还有很多重要信息无法数字化,必须靠决策者去感悟,没有数据的决策不科学,全靠数据决策也不科学。
 
  5.2 基层服务依靠数据型应用
 
  基层的业务主要是操作,适合数据型应用模式,流畅的数据型应用系统能够显著提高政府业务操作的效率。现场服务人员亦需要数据支持提高工作能力。如现场交通执法调用交通档案数据会明显提升管理能力,街道服务人员调用居民家庭资料会有助于改进为民服务。
 
  改进基层服务比改进高层决策容易见效,基层业务是确定性的规范业务,易于发挥计算机的自动化优势,公共服务效率提高易于增加公众的获得感,政府把精力投放数据型应用会更有效益。
 
  六、信息共享与数据整合
 
  信息共享与数据整合概念不同,不宜混在同一系统之中。
 
  6.1 信息共享适合信息型应用
 
  信息共享与数据整合混淆使用不利于提高效率,信息型应用关注数据集的自由调用,信息共享则支持数据集共享,与信息型应用目标是一致的。
 
  6.2 数据整合适合数据型应用
 
  数据整合是将政府各部门的数据在逻辑上集中起来,形成有机的整体支持政府业务的精细化管理与服务,是与数据型应用配套的。数据整合是对各部门的数据在逻辑上精准管理,实现语义上的一致性并优化数据结构,提升跨部门数据调用的流畅性,提高公共服务效率。整合数据能及时将数据提供给现场服务人员,能有效提高其办事能力,抑制不法用户违规行为。
 
  信息共享关注的是数据集的共享,数据整合关注的是业务数据的精准调用,单一的数据交换共享平台难以实现两种应用的高效率。
 
  七、资料查询与数据开放
 
  一切从实际出发,具体问题具体处理不必套用固定模式。
 
  7.1 政府资料查询
 
  资料查询是政府经常需要的服务,政府文件的起草经常需要查询上级文件、有关的统计报表及相关部门发布的文件,这是对数据的精确使用,与数据整合服务内容相关。政府领导非常关注兄弟地区的统计数据、政策文件,通过查询直接获取资料作为决策参考,电子政务建立政府资料搜索系统会非常实用,这种既不属于数据挖掘又不属于改进操作的简单资料查询是迫切需要的。
 
  7.2 政府数据开放
 
  在政府信息化系统建设中,政府数据开放是一项重要内容,影响数据开放的因素一是隐私权保护。信息型应用调用的数据集大都是统计数据与大数据,数据脱敏后可以向社会开放。数据型应用涉及个人或企业的数据,其开放的难度很大;二是数据质量维护,质量不好的数据开放会带来太多的麻烦,相关部门会用保密等理由来拖延数据开放,增加数据质量维护经费可以减少数据开放的障碍。
 
  7.3 可视化数据共享平台
 
  开放的数据共享平台会受到社会欢迎,但因受政府保密、隐私保护、商密维护等问题影限制,平台内容难以丰富,若共享平台重点转向可视化数据展示就可以规避多种保密难题,使平台内容丰富起来。企业提供可视化产品比提供原始数据容易得多,政府可以大量采购与汇集企业的可视化产品,丰富平台内容,政府数据也要以可视化形式向社会提供,可视化数据会因易于理解而有更高的访问率。
 
  八、几点感悟
 
  项目少一点简单一点才能集中资源攻克信息化建设的关键难点。
 
  8.1 避免复杂性过于集中
 
  以统一的信息共享交换平台解决信息型与数据型应用的全部共享,效果往往不好。信息型应用是对数据集进行数据处理,数据型应用是对具体数据进行处理,前者的复杂性是处理的数据量大,其便利因素是对数据质量要求不高;后者的复杂性在于数据必须精准,其便利因素是数据规模小;合成一个系统只能使复杂性叠加,便利因素却无法发挥作用,分开处理才能简化系统。
 
  数据整合不必将全部数据组织成统一的系统,部门数据合作自有其业务圈,数据整合宜按业务合作圈推进,避免复杂性集中,小圈子部门合作更有效益。
 
  8.2 早见效益胜过技术完美
 
  政府信息化建设并不是非常成熟的工程,需要不断摸索与反馈调整,早见效益是强有力的反馈引导,成功的应用是从局部效益成长起来的,每项效益都是前进的指路灯。太完美的技术方案会拖延效益反馈,增加建设的盲目性,反馈改进的效率直接影响建设的效率与成功率,先进技术固然有用但不必夸大,其与环境的适配更重要,环境适配需要摸索,及早促成效益反馈才是成功之道。
 
  8.3 有先有后不要齐头并进
 
  信息化建设常见问题是不分先后齐头并进,应在条件成熟的地方先做,有经验后再推广会经济得多,能深入理解信息化的干部是政府的稀缺资源,齐头并进会造成精力分散,方案再好一刀切也没有必要,集中精力把最有效益的事情作为突破点才是上策。
 
  8.4 区分两种应用模式的意义
 
  每种应用都有其难点与方便因素,专用系统可以充分利用方便因素来简化系统,集中资源攻克难点提高整体效率。倘若不同应用合在一个系统之中,系统只能处处按最难的应用设计,并无法借助各应用的方便因素简化系统。
 
  系统开发需要专业化与通用化平衡,如果不同应用难点相同而枝节相异,那么通用系统则有价值,如果是枝节一致而难点需求不同,那么建枝节通用系统就是下策,难点问题的解决受制于枝节的要求必然增加复杂性。研究不同应用模式的区别便于分清难点与枝节,有助于合理选择专业化或通用化方案。

第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:胡小明

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。