前言
随着新一代信息技术在各行各业的不断渗透,大数据与人工智能发展如火如荼,新型智能技术与产品在不断更新迭代,数据分析已然成为主流。与此同时,市场涌现了一批特色创新型企业。其中,一家全球领先的大数据基础平台软件与AI产品提供商--偶数科技,自2016年底成立以来,逐渐在业界崭露头角。2017年12月22日,偶数科技创始人兼CEO常雷在公司总部如约接受了CIO时代APP记者的专访。
在访谈过程中,常雷给记者的印象是,阳光果断、干净利落,谈笑间透着一种平实而自信的力量。“在计算机领域,一直起起伏伏的趋势与潮流有两种:一是数据,二是算法。主要的核心技术还是会围绕这两大方向在创新。”作为技术出身,并一直专注于大数据领域的他精确而专业的说道。
常雷接受CIO时代APP记者采访现场 摄影/张学凤
没有经历,就没有收获
常雷出生在安徽,作为一枚典型的80后,高中时候的他并不安分,常常醉心于各类小说,也侧重于文学素养。后来他觉得文科在未来的就业中没有优势,继而转战理科。因为成绩优异,本科从山东大学毕业后直接保研,后来他于2008年在北大计算机系深造,成为了博士。毕业后去外企工作了8年,四平八稳、自由自在的生活着。2017年是他接受新东西最多的一年,创业一年,经历了各种酸甜苦辣,多了很多人生体验。“小时候的梦想是成为作家,创业之后,更有素材可写了。”他对记者笑着自我调侃道。
扎根中国、扩展全球业务,是很好的一条路
偶数科技的成立与发展,与常雷在EMC的工作经历有很大的关系。他在北大读完博士之后,加入了EMC公司在中国的EMC实验室,做一些大数据和云计算方面的研究工作。在2008年左右,云计算和大数据的发展刚开始有点势头,Hadoop也是刚出来,可扩展性很好但性能很差,而传统数据仓库性能不错但可扩展性不行,所以他开始研究如何把Hadoop的性能提升上去的一个课题。2009年到2011年的时候,做了一个SQL引擎,是Apache HAWQ的前身,跟传统的数据仓库相比,性能上是一样的,但可扩展性要高很多倍,在Hadoop生态圈里可扩展到几千个节点。
在2011年,EMC收购了Greenplum,Greenplum是一家做MPP仓库比较好的创业公司。也是因为看到了大数据的风潮,他加入了Greenplum部门并把HAWQ的原型系统进行产品化,同时也组建了研发团队。到2015年底,EMC已独立出另外一家公司,专门做云计算和大数据方面的工作,把所有软件产品做到了开源,几乎所有好的大数据项目都在Apache,比如Hadoop和Spark等,所以EMC选择了把HAWQ开源到Apache,这对整个数据库生态系统很有好处。
可以看到,大公司的创新相对来说比较慢一些,小公司创新速度会快很多。比如说在Hadoop领域已经有好几家上市公司,常雷也是基于同样的想法出来创业。2016年底,偶数科技正式成立。在2017年也成功拿到了红点天使轮投资,9月份完成了A轮融资,红杉投资也是看到了偶数科技的市场潜力和新一代云数据仓库技术的前途。
核心竞争力: 第一个支持原生容器云的数据仓库
核心竞争力的识别标准有四个:价值性、稀缺性、不可替代性、难以模仿性。在美国学者C.K.Prahalad和美国学者G.Hamel看来,核心竞争力首先应该有助于公司进入不同的市场,它应成为公司扩大经营的能力基础,它的贡献在于实现顾客最为关注的、核心的、根本的利益。
常雷在谈及偶数的核心竞争力说到:第一,数据库最难做的一点就是性能,包括AI与算法,性能好的话是非常大的一个优势,尤其是在数据量快速增长的阶段。在9月底,偶数科技重新设计和发布了一个全新的极速执行器,使用SIMD等技术,使得性能迅猛提升5~10倍。
第二,偶数在数据库或数据仓库内部嵌入了机器学习算法,一般做数据挖掘的算法时,首先要把数据取出来,然后再去做计算,这样数据和计算是分离的。那在数据库内部做的好处在于,可以利用数据库中的索引,包括本地的数据访问,可使得数据算法得到极大的提高。
第三,传统的云计算是虚拟机来做的,现在随着PaaS平台的流行,大家都使用容器。从硬件的角度来看,传统的数据中心是一台台物理机,而在容器里面,随着DevOps和开发、测试、运维这样一个流程的改造,应用和容器是在一起的。容器必然会导致业界一个非常大的变化。
正是因为看到这种趋势,偶数做到了世界上第一个能够支持原生容器云里面做部署的一个数据仓库--Apache HAWQ,使用存储与计算分离架构,可扩展至数千节点,架构灵活,可以轻松取代传统数仓和Hadoop SQL引擎。 现在依然有人在开源社区讨论Spark集群如何放到容器里面,而偶数早已走在了前面。
今日帘旌秋缥缈,长天飞去一秋鸿
在创业前期,市场、销售、研发等都会有一些挑战。他的时间压缩地很厉害,比如说,公司每天会有一个10分钟时间的晨会,非常简短,来保持大家之间的一些交流与畅通,每周也会有一个大致的规划,他不希望大家的时间浪费在会议上。
生活中的常雷,看书基本是在碎片时间,近期在看的一本书叫《创新者的窘境》,给了他很多思考。一个月至少也会读两本书,领域不限,创业类、经管类、历史类以及人物传记等都感兴趣,“读一些世界史,去了解一些历史进程,那么你看事情可能就不会那么迷惑。也会看哲学,沉下心想一想,做这些事是为了什么?人的一生到底要得到什么?这些经过沉思后得到的感悟还是挺重要的。”他对CIO时代APP记者分享道。
CIO时代APP记者实拍常雷办公室
“这个世界上没有事情做不到,就是看你去做不做!”这是他一直秉持着信念,同时这也是偶数科技的企业文化,并没有一个高端的科技做不到,只不过你想不想做,用不用心去做。除了看书,动手能力也很重要,在计算机行业,不能太专,只会一点点,如果只会低头写程序,问题是非常大的。他也鼓励员工要在各个行业有所涉及,包括数学、心理学、社会学等,把各学科融会贯通,会大有裨益。比如说现在很火的神经网络,是计算机、生物和生命科学的结合,只有通过在各个领域的知识积累,才会自然而然的产生很好的想法。
战略关键词:转型、大数据、AI
传统企业想要运用大数据技术转型,更多的是一个思维的转变。转型意味着它很多的组织架构都需要变动,以前的开发、测试、运维都是一个独立的部门,现在需要变得一体化。无论是做决策、产品开发,还是流程管理,都要做到有据可循。
关于大数据与AI技术的未来发展趋势,常雷表示,一是智能化和数据化。人工智能算法在各行业有很多的应用,比如说在金融领域的风控、智能投顾、反欺诈等等,会取代传统人工做的一些事情;二是云化。公有云在大型企业应用的较少,而各企业都在建自己内部的私有云,偶数的产品也是围绕着这两大模块不断的在做创新,两者的区别在于收费和商业模式的问题。云数据库的本质是什么?通常来说,云数据库与部署在本地的数据库没有太大的差异,无论从产品优化、存储、数据管理,区别在于管理部署和收费。
偶数,世界数据的一半
从技术架构的角度来看,数据库的竞争一直是比较激烈的,尤其是国外巨头占了一个很大的市场份额,基本上是一个垄断的优势,国内自主研发的产品相对来说较少。常雷表示,偶数一直致力于做世界上最快、最好的数据仓库,包括做人工智能的基础架构,通过不断的创新,如何做大市场及创收,彻底打破巨头屹立的姿态,做到平分秋色,是公司未来几年的愿景。
CIO时代APP记者实拍偶数科技会议室环境
谁知冰雪凝寒候,自是乾坤贵育心
创业公司遇到的痛点与挑战是类似的,刚开始的时候都会面对客户拓展问题,可能会没有一些信任感,另外是招聘,都想招到最好的人,然而最好的人总是有无数选择。
在组建公司人才团队方面,常雷也有着自己的考量。最注重员工的才能有两点:一是主动学习的能力,这对于任何一个大公司或者创业公司来说是非常重要的,如果有一个新的技术,你能够很快的学习、掌握。这也是最看重的能力,人生与职场都是野蛮成长的姿态,自学能力要非常强。如果不能主动学习和创新,那么可能你在里面就无法适应;二是说到做到,比如说答应客户的一个项目或工程,如果没有按时完成的影响是非常大的,不管你是否在加工加点,一定要完成。诚信是最本质的,无论是在职业发展、为人处世,还是对待用户的态度以及产品研发的能力。敢做敢当的品质也尤为关键,全世界有80%的人是没有自我驱动力的,很可能是随波逐流、得过且过,有不到10%的人是希望自己能做成一些事的。
要想创业成功,更关键的是在于品质与能力的兼备。他分享说到:一是要拥有自己的技术优势,如果做一件事不能引领潮流,只是跟随,是不可能成就一个大公司的;二是踏踏实实做事,真真诚诚做人。神经粗壮的人比较适合创业,在创业过程中会遇到各种各样的挫折,不顺心的地方很多,如果承受力和解决问题的能力不够,根本不可能创业成功。
这是他的理想
常雷给自己的评价是踏实,并且是想做一些事的人。用自己的力量来改变这个世界,总要留下什么,而不是随遇而安,等到70岁回顾的时候,不会觉得后悔,不会还有做不到的事。
人物档案
偶数科技创始人兼CEO常雷,博士,2008年毕业于北京大学计算机系。Apache HAWQ 创始人,曾任EMC高级研究员、EMC/Pivotal研发部总监,长期专注于大数据与云计算领域,在国内外顶级数据管理期刊和会议(如SIGMOD等)发表数篇论文,并拥有多项国际专利。中国大数据产业生态联盟专家以及中国新一代IT产业推进联盟的技术专家。2017年入选美国着名财经杂志《快公司》“年度中国商业最具创意人物100”榜单。