随着以电子政务为核心的城市信息化进程的加快,对政府信息资源共享的需求日益强烈。如何实现政府信息资源最大程度的共享,成了人们关心的热点话题。2017年3月11日下午,由中国新一代IT产业推进联盟指导、CIO时代学院主办、CIO时代APP承办的“2017首期政府CIO论坛”在河南郑州成功举办。政府CIO班学员、政府信息化负责人等聚集于此,进行了深度探讨与交流。郑州住房公积金管理中心信息处处长、第六届北大政府CIO班学员杨凌宇在活动上发表了题为《易经与大数据》的主题演讲。以下为演讲实录:
郑州住房公积金管理中心信息处处长、第六届北大政府CIO班学员 杨凌宇
大家好!今天给大家分享一下易经和大数据。这个题目可能有点远,易经很古老,至少是几千年前的事,一直延伸到现在。大数据是新提出来的信息技术领域概念。其实易经从未离开过数据,根据我学习这么多年的一些经验,我认为易经和大数据之间有着天然的联系。
一、易经的来源
易经的来源,可以说是来源于数据。谈到易经要说两个方面,一个是八卦图,一个是八卦和64卦的内容。八卦图起源于6500年前伏羲时代,是农耕文明的产物。实际上我们对伏羲这个概念是很熟悉的,河南淮阳有太昊陵,伏羲在那里被称为人根祖,传说中认为伏羲是人类起源最早的祖先,但这都有待于考证。通过考古论证,伏羲不是一个人,而是一个部落的首领,经专家论证,伏羲部落兴盛一千多年,共有76代伏羲,从第一代一直到第76代,列表都已经论证出来了,因此这是可信的。在6500年前的旧石器时代和新石器时代,生产力是很低下的,当时解决吃饭问题是当务之急。部落首领伏羲(刚才的画像也是从网上找的)为了掌握农业生产技术,提高生产力,便要掌握冷热交替、寒暑变化的规律,他就测日影,然后就出来一张图,称之为四时八节图,再细化就变成了24节气。
四时八节图
二十四节气图
直到现在我们农耕生产还在用这张图,因此这张图的起源就在6500年以前。伏羲时代绘制的四时八节图,“四时”就是春夏秋冬,“八节”就是24节气中的八个节气:立春、立夏、立秋、立冬、冬至、夏至、春分、秋分。四时八节图是经历伏羲时代1000多年76代人精确的测量测绘计算出来的,因此我们说这张图是来源于数据或大数据。
一般的说法是,八卦是由伏羲发明的,64卦才是周文王续写的。这是一种理解上的错误,现经考证这种说法已不成立,说伏羲画八卦,太玄幻太神化是不可信的。比如,有一种说法是黄河里出来一匹马,马背着一张图,被说成是“河图”,该图刚好被伏羲看到,然后依此创造了八卦。
伏羲“八卦”和文王64卦都是从数据中来的。周文王是在伏羲四时八节图的基础上,根据占卜的需要设计了先天八卦图、后天八卦图,并确立了八卦和六十四卦的内容,把占卜核心进行了系统化处理,这确实是文王的功劳。因为在商周时期,占卜术是很盛行的,包括朝廷也有专门的编制、机构、人员对重大事项进行预测。当然当时的方法是龟占,即用乌龟壳进行问卦,这是一种比较落后的预测方式。文王创立八卦和64卦后,他做的一个最大贡献便是从原来的由象起卦变为由数起卦,象可以是物象、意象、想象,是人们看到听到想到的一切现象,不确定性强,而数具有了唯一性特点。把由象成卦变为由数来成卦,这是一个很大的进步。
文王画出八卦图后就定义了卦象、卦名及卦的含义,八卦就是乾兑离震巽坎艮坤,以现在的思维理解,就是他定义了、或者说将自然界各种物质定义了八种属性。但这些还不足以支撑卦的体系,那么他就把八卦两两相错变成64卦,每一卦有6爻,64×6就是384爻,从而也就有了384条爻辞,再加上64卦自身的卦辞,卦词和爻辞,总共是450条。这些卦辞和爻辞来自官方的档案馆,也可以理解为商朝占筮的档案库。因为在当时,他们每一次占卜都有档案,也就是把占筮结果刻在龟甲上,即如今我们看到的甲骨文中很多的卦辞和爻辞。商朝和周朝加在一起也是一千多年。从这一千多年的占卜档案中挑来挑去,最后将精华挑出来装到64卦、384爻里。所以,我们说这些内容的数据量可想而知。从档案馆中来、一千多年的数据,其量之大可想而知。因此不论是八卦图还是六十四卦的卦辞爻辞,均来源于数据或说来源于一千多年跨度的数据,从某种层面上我们可以理解为是大数据。因此,我们说易经是源于数据。
我们知道国学中有一个重要的概念叫做太极。有一串大家都很熟悉话叫做“无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦定吉凶,吉凶生大业。”两仪即阴阳,阴阳被文王和伏羲用了两个符号表示。我们看到的符号一个是中间有裂缝的(--),一个是没有裂缝的(—),叫阴爻和阳爻。这是两个表示阴阳的基本元素。八卦每一卦是三条线,二的三次方只能出来八个卦符。64卦是每一卦6爻,二的六次方可生成64种卦图。后来人们发现,如果用0和1来表示阴和阳两种符号,以此来替代八卦、六十四卦中的阴爻阳爻,其顺序与德国的哲学家数学家莱布尼茨发明的二进制很吻合。有很多人以此讲计算机是我们老祖先根据易经发明的,当然这肯定有误解。
阴爻(“--”)以“0”表示,阳爻(“—”)以“1”表示;或者阳爻(“—”)以“0”表示,阴爻(“--”)以“1”表示,二者所表示出来的八卦符号的阴阳顺序与用二进制表示十进制的0~7八个数字的“0、1”顺序是一致的。同样,六十四卦先天卦序用十进制的0~63表示,其阴爻阳爻顺序与二进制的“0、1”顺序是一样的。先天卦序是古代占筮家发明的,只用于占筮不用于计数,历史上从没有将卦象对应于十进制计数的情形,更无用二进制计数的可能。所以,先天卦序与二进制有相似的构成和排序规律,不代表卦序本身就是二进制。
二、传统预测、大数据和易经的关系
易经源于数据,但它有预测的作用,它源于卦、扬于道、又传于卦。大数据的核心价值也是预测。这里有三重关系,预测成就易经、易经指导预测、预测成就大数据的核心价值。大数据肯定是用于分析的,但最终的目标是要预测一些走势、未知的一些结果。大数据预测在国外也已被认为是一种职业,一种成熟的商业方式。
象和数实际上在几千年前,东方与西方也在交互。我们刚才说到算卦,即占卜术,由象而数,从象占卜到数占卜,从龟甲裂缝的走势起卦到揲算起卦,是跨了一大步。我们宋朝有个人叫邵雍,他说万物皆有数。无论是什么现象,都可以用数来表示,有数就有卦,有卦便可以分析。在公元前500多年,古希腊一个数学家毕达哥拉斯也说过万物皆数。那时提出来任何东西均可用数字来表示不很不可思议的。那么我们现在这些信息数据实际上全部是数字化。
这个图是传统预测过程示意图,从问卦到成卦到解卦这么一个过程,这个过程算是一种预测模型。图中的“由数起卦”,即蓍卜,是用50根草卜卦,变成由数起卦了。在此之前是“由象起卦”,即龟占,将乌龟杀掉后,对乌龟壳进行加工,问卦时用火在龟甲上灼出裂缝,根据这个裂缝,占卜师讲出这个卦的意思,这太随意了。变成数字化后,其规范程度就高了。
从宋朝邵雍开始,起卦的过程就变的很简单、很规范了。从起卦到成卦到解卦,我们说成卦是入手大数据,成卦是圈定大数据,解卦是分析大数据。起卦最早是通过象到成卦,后来就变了,直接由数到成卦,包括数字、时间、方位、文字等都可以成卦。起卦后就成卦,把用到的数据圈定起来。易经所包含数据大到无外小至无内,根据需来圈定解卦时所用到的数据,然后再根据五行、阴阳、天干、地支、四季、八方来解卦,这是一个很规范的三段式解卦过程。
以八字命理为例,其命理分析的最终落脚点在五行生克方面。有时候找人问命理,卦师会说一串儿顺品溜,什么白马怕青牛、猪猴不到头之类的,这顺口溜很长,实际上就是讲了五行生克的关系,也是最经典的最常见的预测模型。还有一种预测方式为纳甲筮法,也是最常用的一种算卦方法,但其整个预测过程也是这么一种模型,五行生克模型。还有一种占卜方法叫梅花易数,也是基于五行生克的预测模型,就是我们刚才提到的宋朝邵雍发明的预测方式,他也是将卦理变成一个模型来处理的,很规范。自文王以后,他定义的八卦、64卦,后人在此基础上又衍生出来很多预测模型,其实所有预测模型万变不离其宗,包括风水,我们都知道一个顺口溜,前朱雀后玄武左青龙右白虎,也是基于五行生克的预测模型。最玄幻的是奇门遁甲,很多人把它说成是帝王之学,其实它是将天文、历法、九宫、阴阳、三奇六仪等要素,分别做成模型,这些模型相互交叉推演出预测结果。现在有现成的盘用于推演奇门遁甲,这个盘也是一种综合预测模型。
三、传统预测和大数据预测
《大数据时代:生活、工作与思维的大变革》一书中有一个观点,大数据的核心便是预测。大多数据的作用是显而易见的,但是,对发展结果预测、对发展趋势分析才真正体现大数据的价值。《大数据预测:告诉你谁会点击、购买、死去或撒谎》一书也是把预测作为一个数据的核心来处理,这本书也是美国人写的,他在大数据预测领域中集成了自己很多的想法,而且也做了很多软件模型。他写成这本书作为一种分享。我拿这两本书出来,我很认同他们将大数据和预测作用体现出来。实际在大数据预测方面IBM行动较早,成立了专门的部门,并且现在做一些机器人、大数据预测的产品的推广,也很成熟。
百度中对预测的描述,所有的预测基于数据,包括传统的预测方式——算卦,包括大数据预测。实际上我们一说到预测,大家首先想到诸葛亮然后又到刘伯温,再想前至500年后至500年。认为预测很神秘,能解决一切问题。其实不是这样。它有一点点趋势能够展现出来已能体现其价值。美国有一个电影,有个人有预测能力,他能够预知下一个30秒内要发生的事。这个警察就带着他,看哪个人是小偷。30秒就够了。因此,预测的力量是由小及大乃至无穷的。
1.为什么要进行大数据预测
1)大数据预测有益于社会的发展
如广告投放,企业中的精准广告投放是需要预测的。实际上现在这个理念已经很成熟了,我们点开网页时,在淘宝中点击过什么书、商品,马上便会推送出来,这便是一种精准的广告投放。
2)大数据预测可以指导企业生产和经营
如惠普公司,全球30几万员工,通过离职风险预测,如果某个员工可能要离职,提前会有个预测,他们便会采取一些措施。他们这个部门,原来很保密的,现在不保密了,这在企业生产经营中的作用也是无限大的。大数据预测可以使企业脱胎换骨,形成全新的竞争力。对于企业而言,大数据预测可以降低客户流失风险,降低人才流失风险,降低成本浪费风险,提升市场占有率和经营利润。因此,很多企业都在不遗余力地提升预测能力。
3)通过量化的方法预测人们的行为
如商场、医院、银行、保险,特别是银行和保险。如美国有个大通银行,他用大数据预测是比较早的,曾经建立了贷款风险预测模型,把风险高的贷款卖给其他银行。有些小银行业绩上不去,大量的存款放不出去,买贷款节省的是贷款成本,支付的是正常的利息。大通银行通过大数据预测的方式将贷款卖到其他银行,在金融危机爆发时,其损失很小,因为他将风险转嫁了。
4)四是通过大数据预测的规划设计,可以促使预测目标的规范化建设
这里也是涉及到企业、部门及管理层的方方面面。预测目标的规范化建设是一项系统工程,通过规划设计,将促使相关的数据更加规范、信息系统更加规范、信息技术更加规范、业务模式和管理更加规范,同时,对管理部门、工作人员的具体分工也提出了新的要求。
2.传统预测对大数据预测的借鉴意义
在没有大数据预测理念前我们要分析贷款的风险,入手是很困难的。那么大的数据量,怎么能说这个人会产生风险,那个人不会产生风险?传统预测对大数据预测借鉴意义在于如下几个方面:
数据处理条理化。传统预测,面对大至无外小到无内这么一个数据量,首先对数据进行定性,要么是阴性要么是阳性,然后按五行八卦分类便可以对数据进行处理,也包括天干地支。将大量的看不见摸不着的数据化简为繁、变大为小。实际上,不论是传统预测还是大数据预测,不管其数据有多大,最后真正能够起作用的数据是小而又小的。
数据取舍模式化。传统预测中关于数据的取舍,是按照五行生克法则“就近”取舍,即生我者、我生者、克我者、我克者、同我者五类数据。其他无关数据一概不用。
大数据预测面临海量数据,可以参照传统预测“就近”取舍数据的原则进行数据优化,厘清与预测目标最为接近、有直接影响的数据尤为重要。
以贷款业务为例,如果要预防骗贷,加强贷款风险防控,主要用回归分析法,圈定所需数据,建立预测模型。
按照传统预测的取数理念,首先找出关系数据:
“我”为预测目标:是不是骗贷业务。
“我克者”的数据为:真伪识别?可疑材料库特征识别。
“我生者”的数据为:谁来贷款?特征、可疑记录比对。
“克我者”的数据为:政策红线?重点关注指标比对。
“生我者”的数据为:操作员?时间地点可疑特征比对。
预测目标标准化。传统预测确定了基本的预测答案,如《周易》的元、亨、利、贞、吉、凶、悔、吝、咎、厉、孚、眚等。在此基础上,还有一些组合变化,如小亨、无不利、可贞、小吝、终吝、有厉、悔亡、无咎、终凶等等。当然,在解卦时,分析师也会根据具体情况再行发挥补充。这样的规定可以起到万流归海的效果,致使预测的结果相对规范和统一。
当前的大数据预测,其预测的目的性以及所要预测的目标非常复杂,所要求预测结果的精准度较高,这不难理解,但不太现实。大数据分析层面可以对分析结果要求高度精确,但如果对预测结果过份要求精度,则不太符合预测的规律性。这种大信息框架下的预测要求,难免会纷繁复杂,同时增加了预测的难度。如果能够像传统预测那样把所要预测的目的要求标准化,可能会出现事半功倍的效果。
预测模型格式化。传统预测的方法多种多样,每一种比较成熟的预测方法都经过了长期的实践、应用、完善和不断发展,逐步形成了其稳定的预测模型。与此相比,大数据预测方法、模型的多变性,尽管灵活、针对性强,然而却显露出了预测模型、预测目标不好把控的一面。以八字命理、纳甲筮法、梅花易数、堪舆术为例,这些比较经典的传统预测方法,它们的预测模型非常相似,都是基于五行生克制化的数据关系。那么,我们不妨以此为蓝本设计大数据预测的基本数据关系框架。
大数据预测毕竟起步时日尚短,在预测模型的建立方面,还需要多方面进行探索。国外的先进做法值得借鉴,我国传统预测的经验也值得学习。
预测模式多元化。在具体应用中,传统预测并不是单一方法的使用,而是多种预测模式同时使用、相互渗透、相互印证、相互补充。
比如,某人因财运不通而求占,预测时可以通过八字命理进行运程分析,通过查看、了解其家居环境、工作环境的风水进行分析,也可以通过起卦的方式对卦象进行分析,更多情况下,是多种预测方式同时并用进行预测分析,效果更为显著。同样,大数据预测的规则确定、算法制定、模型建立也不是单一性的,而是多措并举。
这是我与大家分享的易经和大数据,主要是从传统预测和大数据预测两个方面进行交互处理。时间太短,有需要交流的问题我们下来再慢慢探讨。
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:杨凌宇
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。