不要夸大数据中心的作用

2017-02-20 16:57:41  来源:CIO时代网

摘要:大数据热透全国之时,需要强调数据并不等于真实世界。
关键词: 数据中心
  一、灰色的数据空间
 
  数据空间是灰色的
 
  大数据热透全国之时,需要强调数据并不等于真实世界。将现实抽象为数字需要忽略许多信息,例如必须忽略统计对象间的差别才能进行统计,难以数字化的信息在数据空间中是没有位置的,容易数字化的信息则占据了太大的空间,数据空间无法全面反映世界,靠大数据技术就能认识世界的想法并不靠谱。
 
  认识无止境,不断有新问题产生
 
  互联网之前人们认为决策水平不高是因信息不足、缺乏信息共享,互联网实现了信息爆炸、推动了全球信息共享之后,决策水平依然不高,人们发觉原因竟然是信息过多使人迷惑,信息不足与信息过度后果是一样的。如今人们认为决策水平低是因为缺乏大数据分析,有了大数据分析决策水平一定能提高吗?不一定,过多依赖大数据分析同样会拉低决策水平。
 
  不要迷信工具,工具自带局限性
 
  经验告诉我们不能迷信工具,正如不能迷信包治百病的灵丹妙药一样,任何工具都会带来先天的局限性,大数据技术也是一样,都有其致命的灯下黑,如果不能回避其薄弱点而盲目夸大其作用,会比没有大数据技术更糟,大数据技术的欺骗能力与造福能力不相上下。
 
  不要迷信数据,数据到价值的距离漫长
 
  数据世界并不能替代真实世界,只靠数据决策和只靠地图打仗一样不靠谱。数据本身并无价值,只在对实现目标有贡献时才产生价值。数据价值实现还依赖使用者的眼光、数据处理的能力,从数据到价值的路程太漫长,大部分数据很难实现其价值。外部互联网数据资源日益丰富不断增加对数据中心的竞争力,使政府决策对数据中心的依赖度也不断下降。
 
  二、大数据应用的局限
 
  不是所有的信息都能数字化
 
  大数据技术能够充分挖掘大量数据中所包含的信息以支持政府决策,但是过分依赖大数据会产生另一种片面性。因为并不是所有的信息都能够数字化,在宏观决策中很多重要的信息恰恰是很难数字化的,例如未来趋势、社会的情绪、团队的士气、人们的欲望以及这些因素的相互作用等都难以用数据表达,大数据善于表述某方面精准信息却容易忽略全面的信息,并不比拍脑袋决策强到哪里。
 
  巨大的数据量是以业务面狭窄为代价的
 
  不能以为数据规模大所包含的信息就一定重要,其实数据量越大涉及的领域越窄,因为只有在狭窄的领域中才能形成巨大的数据量,从其中挖掘出来的信息也带有领域狭窄的局限性,其所预测的范围也会狭窄,因此大数据预测适合于局部性、专业性领域。
 
  因数据源缺乏产生的局限性
 
  大数据应用的实际困难经常来自数据源缺乏,因为大数据的收集成本太高,无法像统计调查那样为收集数据而设计调查方案,大数据主要是来自大规模业务工作的副产品,如移动通信的联网数据、互联网搜索数据、电子商务数据、社交网络数据等等,大数据应用对数据源的依赖性限制了应用的普及,在很多情况下大数据应用远不如常规小数据应用方便。
 
  大数据并不适合大决策
 
  大数据应用对优化城市管理有很大贡献,特别在某些专业化领域,如金融风险防范、刑事案件侦破、用户产品推荐、广告效果优化等等,但是大数据技术并不适合于政府高层决策,大数据应用并不能使政府高层决策科学化,高层决策更关注全面的态势,而大数据信息视野太窄只适合具体业务应用,更重要的是,高层决策要面对许多不确定性问题,大数据处理不确定性问题不如有经验的领导人处理得好。
 
  三、数据整合的意义
 
  大数据、小数据整合方法不同
 
  数据整合是数据中心的核心工作,小数据的整合主要是原始数据的整合,数据整合主要是不同部门的业务处理数据,按照处理的对象链接起来,并进行数据核对,确保数据的精准对接,以支持政府的精细化服务。小数据的整合是政府数据整合的重点。
 
  大数据的整合主要是大数据处理结果的整合,大数据处理成本很高,减少使用时的再处理是非常重要的,大数据处理的结果可以浓缩为报表、可视化展示等多种形式以方便后续应用,针对具体目标的搜索数据可以整理成数据库,如信用库、用户库、黑名单等,方便查询。
 
  小数据整合的价值
 
  政府业务数据的整合将有效提升数据的价值,业务数据的产生只反映该业务部门的视角,这对于掌握服务对象(人、企业、项目等等)的全面情况是不够的,如果能够将各部门积累的业务数据整合起来就会产生对服务对象全面、精准的认识,对管理与服务的改进有重要意义。信息本质是事物间的相互关系,关系是多维的、网状的,只有整合起来才能反映关系的全面属性。
 
  政府精细化管理依赖小数据整合
 
  政府的管理与服务工作主要通过各部门规范化业务来实现,而业务数据就是这种管理与服务的记录,业务数据成为进一步服务的依据,相关业务数据整合一体对于政府的精细化管理有着重要意义,数据精准是管理精准的基础,当工作人员对服务对象信息能够全面调用之时,服务会更精准、更快速,用户会少跑腿,用户欺诈行为也会大大减少。
 
  大数据整合的两个方向
 
  大数据整合的目的是降低数据再利用的成本。大数据应用有宏观与微观两个不同方向,其数据整合也有两种模式,统计模式与搜索模式。统计模式对应宏观应用,其目的是挖掘数据整体的信息,认识属性间的相关关系,用于政府宏观决策。大数据应用成果多以报表或可视化态势图来表示。数据中心的大数据整合业务主要是这种模式。
 
  搜索模式对应大数据的微观应用,关注焦点是个体行为信息,如个别用户的消费习性、行为规律等。这种模式大量用于安全风险防范(如反恐、破案、金融安全等)。搜索模式多以数据库形式提供查询(如用户CRM、个人征信库、黑名单等)。以搜索为中心的大数据整合十分复杂,多由专业机构承担,一般不作为数据中心的主要业务。
 
  四、数据中心如何生存
 
  不要夸大数据中心的作用
 
  智慧城市的宣传过分夸大了数据中心的作用,为数据中心设立达不到的标准对其发展是不利的。互联网使数据资源由稀缺变为过剩,宏观决策的信息渠道日益广阔,以提供数据为宗旨的数据中心作用也日益下降,政府决策对数据中心依赖性下降不可避免,数据中心的生存空间被压缩。
 
  政府基层服务主要是业务数据的精确使用,不受互联网信息膨胀的冲击,未来数据中心的价值将更多体现在政府基层服务的精细化改进上,加强对基层的数据服务是数据中心重要的生存之路。
 
  大数据应用是挂一漏万的
 
  依照目前的宣传大数据几乎可以解决政府的一切问题,从经济预测到反恐破案都能胜任,事实并非如此,首先大数据源的准备就是难题,大数据任务很分散,每项任务都是非常复杂的工程,很难用一种规范化流程来降低成本,大数据应用成为挂一漏万的示范项目,很难实现规范化经营,只有找到规模化、重复率高的应用领域,大数据应用才能变为有规模效益的经营。
 
  数据中心成长要借助于规模化业务
 
  数据中心的成长不能只靠初始投资,持续的业务收入更重要,数据中心的业务能力是大量实际任务训练的结果,数据中心需要伴随着业务的成长而成熟,未经大规模业务锤炼的数据中心只是中看不中用的。
 
  大数据、云计算业务的领先公司亚马逊、谷歌、阿里巴巴等,其业务能力都是借助于公司内部业务而成长的,内部应用的锻炼促进了大数据应用技术的成熟,其后才逐步对外服务,形成大数据与云计算服务产业。
 
  站稳脚跟是数据中心的当务之急
 
  城市数据中心最要紧的是先能站稳脚跟,使贡献大于政府的投入,这样才有进一步发展的可能。选择恰当的业务起步非常重要,唯有真实的需求才能锻炼队伍,数据中心才能学会生存,进而求得发展。从专业化的业务起步是有益的,专门做好一件事会容易得多,技术积累效率也高,数据中心不能浮躁,一个领域做好了再拓展新领域不迟。
 
  五、数据中心不要以城市大脑自居
 
  数据中心要有自知之明
 
  数据中心的作用永远达不到媒体宣传的那么神奇,建设者要有自知之明,防止以后的被动。数据中心的资源、经费、人才是有限的,在未来的三、五年内能够在电子政务领域做成几件事就不错了,国家四大基础数据库建设了十五年处境依然艰难,各地小数据的精准化工程推进都不轻松,更不要说大数据整合了。
 
  城市数据中心被媒体捧为“城市大脑”并不妥,历史上的城市是自然而然地发展起来的,沉淀了千年的智慧,不见“城市大脑”何在,城市智慧早已分布式存在着,不是靠数据中心的出现城市才有了智慧。
 
  城市智慧是自组织的涌现
 
  城市智慧存在于城市的机制之中,存在于城市各方面资源的配套与合作之中,城市的高效率来自社会组织的精细配合,来自生产方式与技术的积累,这些都是城市的智慧,而这些智慧的产生并不是政府能操纵的,它是社会自组织创新的结果,城市智慧是广大居民自组织创新涌现出来的新状态,城市智慧是以网络形态、分布的模式渗透在城市的各行各业之中。
 
  智慧是一种生态
 
  聪明、智能是同一层次的概念,它们是具体的工作方式,我们可以更聪明地做好一件事,建好一个智能系统,但这样做并不等于就智慧了,智慧是更高层次的概念,它是大量聪明行为、智能产品涌现出来的整体状态,城市智慧更像是一种生态,是一种有利于产生聪明与智能的生态环境。这种有助于创新繁荣生态环境不是大数据中心能代表的,我们需要从网络与生态视角来认识城市智慧,所谓“城市大脑”其实是一个分布式、网络化的系统。
 
  数据中心要做好自己的事
 
  城市的智慧是城市居民长期自组织创新积累的结果,政府工作的智能化也只是智慧城市大量智能化工程的一部分,政府应当认真集中精力做好自身业务的智能化,数据中心要把份内工作做好去服务他人,正确认识“城市大脑”的网络属性将有助于调动全社会的积极性,共同建设智慧城市。
 
  胡小明   (2017/2/19)

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。