【干货分享】华中师范李鸿飞:学习大数据深度应用的一个框架

2016-05-11 10:58:45  来源:CIO时代网

摘要:2016年5月6日,“2016北大CIO中国行--武汉站”活动在武汉华中科技大学隆重举行,华中师范大学信息化办公室主任、北大CIO同学会教育科研行业分会秘书长李鸿飞分享了题为《学习大数据深度应用的一个框架》的主题演讲。
关键词: 大数据 教育科研 CIO
  2016年5月6日,“2016北大CIO中国行--武汉站”活动在武汉华中科技大学隆重举行,作为2016年中国行活动的第四站,本次活动以教育科研行业的信息化与大数据应用为背景,活动主题为:数据共享,合作共赢。本次活动由中国新一代IT产业推进联盟主办,CIO时代网与希嘉教育承办,北大信息化与信息管理研究中心协办,专业云计算服务商UCloud冠名。与此同时本次活动还得到了希嘉教育、英维克、亿方云、全时等合作伙伴的支持。华中师范大学信息化办公室主任、北大CIO同学会教育科研行业分会秘书长李鸿飞分享了题为《学习大数据深度应用的一个框架》的主题演讲,以下为演讲实录:

\

  非常感谢。经过了一年在北大的学习,我相信我能够掌握一些如何开展信息化基本的理论的一些基本工具和了解的一些案例,在这个学习过程中接触到不同行业的很多同行,所以这是一个非常好的学习。第二感谢北大, 非常感谢姚老师能够把教育科研研讨会能够放在湖北武汉来开。第三感谢会务组,给我们提供了会务的便利。最后感谢我们邀请来的很多高校主任的代表大家能够聚在一起,共同研究,共同探讨。我想我介绍前面几个感谢,也是为了要把教育信息化和科研信息化这两块的专家领导在一起,做一些分享和沟通。关于今天这样一个汇报,我想说两点。第一点华师2012年开始做,我想把我们最近3到4年的教学改革的进程,特别是信息化环境下的教学扩模式创新,大数据如何深入应用做汇报。另外一方面我的报告里面绝大多数是我们学校专家教授很多的思考或者他们的一些想法。可能里面有我小部分的一些体会,所以说我也就是把华师目前实践跟大家汇报。
 
  对下一代教育的理解
 
  第一个背景,从中国本身改革看也是这三个,教育公平,教育质量,核心公平。在2015年8月份,这样一个纲要里面特别提到探索发布大数据对变革教育方式,促进教育公平,提升教育质量的支撑作用,大数据对教育方式是什么含义,如何来促进教育问题是什么含义,提升教育质量如何提升支撑作用,第三次工业革命的时代背景下,教育是不是需要往数字化,网络化,定制化的方向发展。也就是原来的农业社会,也是个体教育,到第一次工业革命的时候,实际上它很多是规模化的,工业化的这样一种教育,它大大的提高了人才培养的效率。进入第三次工业革命以后,是不是能够规模化和个性化,这个是现在大数据时代或者说信息化时代,我们的教育能不能走向这一步的关键所在。
 
  经过我们学校很多课题组研究,我们认为关于教育的理论实际上可能在信息化的教育这个背景下,教育理论和实践应该会有很大的变化,同时我们经过很多的研究认为,下一代教育关键特征可能有四个关键词:教育精准化、学习个性化、环境智能化、服务智慧化。从教学精准化来看,以大数据、云计算,人工智能等技术为支撑,在保障规模化教学的前提下,实现差异化教学、精准化教学,这是老师有更好的工具来实现目标。第二个学习个性化,正式学习和非正式学习的界限日益模糊,在线学习,移动学习、智能导学等日益成为常态。从环境智能化上面说,更加智能化、更加有利于促进教与学绩效的智能化。服务智慧化,如果是高校运转效率高,能够得到更好体验,使得决策能力和服务能力大大提升,这个是作为现在大学和未来大学教育我们认为四个非常重要的关键特征。这个实际上就是刚才大家这样一个,就是我们最终认为第三次教育革命来临的时候,我们是不是可以这样定义,就是规模化和个性化和谐统一,是在信息化和智慧化的条件下能够实现的目标。
 
  信息时代教育理论与实践,有四大基本任务:精准教学、自主学习、智能环境和智慧服务,里面有需要支撑的理论创新和实践创新。关于信息时代教育理念与实践,应该说还有许多关键的科学问题需要我们去思考。从基础理论来看,个体、群体的学习机制与环境到底是什么,学习大数据分析与建模,它背后包括本身这样一种数据分析这样一种理论到底是什么,我们为什么需要建这样的东西,这可能都需要在理论上,在基础理论做探讨。在关键技术这一块,个性化教学组织的技术,大数据的采集与分析标准,在实际应用示范这一块,学习者为中心的智慧教育生态,寻求最佳应用范式。这些都是我们要思考,这是我跟大家汇报我们最近考虑对下一代教育的一个理解。
 
  学习大数据公共服务环境
 
  当我们看到智慧校园的时候发现,这里面有一些智能感知,有一些技术,我们把这些技术认为我们智慧校园达到这样的程度,会发现我们有没有数据可用,实际上很多学校的数字化校园逐步向数字校园迈进的时候,可能有很多数据很缺乏,但是我们是不是真正有可用的数据,当然这个数据实际上包含了教学资源。那么实际上数据质量可能会成为我们目前非常大的一个困难的问题。就是我们为什么不能做到精准教学,为什么不能提供学生个性化学习,包括智慧环境在搭建过程中,为什么不能能够把所需要的资源进行汇聚,这个实际上可能会涉及到数据问题,也就是说我们的数据规划,数据标准,我们的业务数据的治理,包括数据的评估,这样一种管控,包括数据过程整个的工具,我们是不是在这些方面,我们可能还需要得到一些进展和优化。解决了这些问题,我们是不是有高质量的数据,或者我们有可用的数据,这个是关于数据治理这一块,有的专家也提出可能至少需要7到8个方面的工具。
 
  这个方面我只是谈到数据质量治理的工具,我后面也会提到关于学习分析的工具和方法,这个里面实际上说的,要做学习大数据的这样一种深度应用,首先要解决数据问题。我们学校有了好的工具箱,工具体系之后,经过一段时间努之后,我们才会有高质量可用数据,能够真正进入大数据深入应用这么一个状态,这是一个基本前提。学习大数据实际上也是有一些基本特征,这样一个层次化模型,这个是美国教育部教育基础办公室出版了关于通过教育数据挖掘和学习分析来增进教育学这样一个报告里面,他们认为分为很多层的,每一个层都有数据隐含。
 
  关于学习大数据特征有三类,一个是学生学习行为数据,学生知识水平,学习能力及认知能力数据,教师教学行为数据及教学资源,我们后面谈到数据包括这几个资源。关于学习大数据基础环境,一般来看从目前的状况看,大概分四个层次,这四个里面都是数据的直接相关的,这里面我们是目前这个阶段,这样一个图式。在这样一个基础环境里面,我们可以体现为数据何为重要。在这个当中数据整合和利用最难,这个也是最核心,所有的数据最后都是如何以体现学为中心来强调学习中的核心体会,我们的数据到底通过什么方式去驱动。第二个就是云网端开放的,这是基础环境这样一个基础,有这样一个基础,很多层次都是不完整或者是缺失的,再就是协同问题,最终使得基础环境它的分工网一样,有非常好的效率,这种情况下最终是非常完整智能化的一个状态。学习大数据应用还有一些前提,这个过程中有四个方面是从技术方面可能还需要做的突破,包括搭建数据开放数据平台和若干学习工作,再就非结构学习化数据的结构化,异构数据的归并,知识普及与能力进阶路径的构建,整个体系的建构,和学生某个能力的建构,这个也是可以说的,而这一块实际上是需要做深入应用,也是非常重要的前提。
 
  学习大数据应用的三个框架
 
  框架基本目标,解决两个核心议题,一个是规模化教育中的个性化学习和以数据驱动科学学习决策。推动学习大数据研究和行业应用,探索面向教育机构、教育主管部门、科研机构和教学方面的应用。这个是作为一个模型,包括三大平台,应用服务平台,核心技术平台和数据平台,这个核心技术平台里面,包括教育数据挖掘,学习行为分析,情感分析,语义分析,语义理解,多维可视化,这是从整体视角来看。从关键技术来看,我们的学习群可控,学习过程可计算,学习者可描述,通过一段时间积累之后做规模化,我们会报告我们目前进展情况,包括学习群的可控,学习者可描述,这个实际上有很多老师,关于学习者描述和知识管理这一块有更专业的研究。
 
  关于应用服务主要是有这6大类,这个六大块里面,到底能够给我们通过大数据的深入应该提供哪一些深入应用的服务,这个实际上在这6个方面。这个是我们老师做的关于学习者的,毕竟学生在一个团队里面学习,就必须把个体的隐性知识,显性知识进行划分,这个基础上我们技术划分,找到数据规律,这个实际上也有很多的案例或者教授在团队和学习里面在做这样一些案例。包括个性化学习的建模,这个实际上通过这样一些模型的挖掘,这个就可以做很多大数据的深入的应用。关于学习大数据中心的治理体系,必须有标准规范和政策法规。
 
  案例与思考
 
  我们学校从2013年开始,3年之内专业必修科必须数字化,基于教学改革开始,2013年开始我们学校的本科教学的课时数180压缩到110,我们压缩的时候要给学生在课堂上提供什么东西,线上提供什么东西,每一个混合式课堂的讨论,作业,研讨课,网上讨论课,线下讨论,包括评测,每一门课程考核,这个可能跟原来的课堂都不太一样,所以我们学校在总结这一块的教学改革的时候说,可能需要一些新的理念,新资源,老师新能力,形成新的教学能力,包括一些新课题,当这些都组合在一起,我想很多真正信息化环境下的教学改革可能才会真正得以实施。目前在这个课堂里面,这个数据可能还是有一点老的数据,目前肯定远远超过5000人,注册超过3万人,2200位老师开创了这个课堂。不是传统意义的网络课堂,面对面教学和这样一种云课堂混合式,如何来进行这样一种教学改革,我们学校是规模化的,而不是一种某一个专业的教学。
 
  这个里面我们也可以举一个例子,包括课程建设与应用,这是一个数量上的统计,这是一个资源类别的途径,这是关于学习记录,就是能够记录学习者和教学者到底哪些数据。比方说2014年奖金1500万,2015年730万条。这里面会做一些简单的大数据的应用,包括做学习记录分析的序列分析,对学习的一些行为,描述进行编码以后,我们就可能会做一些对不同的类别的学习做一些学习季度持续的分析。不同的年龄,阶段都会有不同的行为表现,也会得出不同的结论,指导教务处针对不同的研究的学生进行改进。这个实际上从教学的管理的角度,实际上更重要谈到的,它如何改变我们个性化的自主学习和精准教学,这个上2000万条的数据会发挥更重要的。对我们老师来讲,怎么样改变老师教学的行为。包括专业能力测评如何来实现个性化教学,这是我们公选课做的一个尝试。国外实际上在这个应用也是非常多,包括学位指南针,能够帮助学生制定适合自己的学习计划。包括电子导师,通过数据树立提升学习的毕业率。
 
  最后有一点思考,实际上大家谈到说学校很多大数据的时候,在日志管理过程中,数据具有战略价值的时候,到底是谁认为它有战略价值,我认为这是一个问题。数据是不是战略价值,谁需要,什么阶段发挥作用。信息化部门的这样一个同行,我们都去考虑这个问题的时候,我们才会发现说数据它是学校真正的战略支撑。学习大数据于教学发展具有战略或者战术意义,具体内涵到底如何描述和定义,这个需要考虑得。再就是数据力,数据不活起来就不能走,当它活起来是革命性力量还是改良性力量,还是方向性力量,就是它如何带来创新,当它真正用起来的时候,活起来的时候,互联起来的时候,分析起来的时候能改变我们什么,我们为什么说智慧服务,它能改变我们的流程,真正活起来的时候。当我们的教学数据,能给我们提供什么帮助。
 
  再一个就是未来教育,未来大学到底是谁,是什么行业。大学是一个无边界的时候,面对面教学,和云下的教学是不是未来解决的针对性,在大学里面培养学生的这样一种情感态度价值观,在未来的信息化环境下到底是什么,大数据对真正这样一种人才培养能起到什么重大支撑,还能起到什么样的培养。未来大学它到底是先生大学,还是学生大学,还是仅仅只有数据的大学,它的内涵到底是什么,我觉得这个是作为信息化环境下的教育和教学可能需要考虑得。我今天的汇报就这么多,谢谢大家。

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:李鸿飞

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。