新闻
搜 索
  • 3434.jpg
  • 江苏教育系统六五普法回眸网页广告.jpg
智慧教育

大数据视野下的教育数据发展及应用

时间:2017-06-27 10:36:00  来源:江苏科技报

  一、大数据及教育大数据领域发展

  2007年,图灵奖获得者、关系数据库鼻祖Jim Gray发表了《第四范式:数据密集型科学发现》的演讲,他凭借自己对人类科学发展特征的深刻洞察,指出世界科学的发展正进入数据密集型科研——科学史上的“第四范式”,即从经验科学、理论科学、计算科学向数据密集型科学发展。

  2008年9月,美国《自然》杂志发表了以“大数据”为主题的专刊,“大数据”这一概念受到高度重视,并迅速成为科学和创新领域的前沿话题。

  2011年2月,美国《科学》杂志发表了关于大数据的专刊(Dealing with Data),发现如果没有大数据科学家、云计算基础设施、大数据分析技术的帮助,许多传统科学领域的发展将一筹莫展。

  2011年6月,麦肯锡研究院发布的《大数据:下一个创新、竞争和生产力的前沿》,对大数据的影响、应用领域和关键技术等都进行了详细的分析。大数据就像遗传性、颠覆性极强的基因一样,推动着产业形态朝着“数据驱动范式”前进和变革。该报告中定义,“大数据是指其大小超出了常规数据库工具获取、储存、管理和分析能力的数据集”。

  这些代表性的报告促使了大数据时代序幕的拉开,人类社会正从IT(Information Technology)时代转变到DT(Data Technology)时代,并催生了现代信息技术发展的新阶段。(如图1)

  

 

  从2013年到2020年,数字宇宙规模将增长10倍,每年产生的数据量由当前的4.4万亿GB,增长至44万亿GB,每两年翻一番。中国的数据量在2013年达576EB,到2020年将会达到8060EB,增长13倍。到2020年,中国的数据量在整个数字宇宙中的比例将达到18%,数据规模将超过美国,位居世界第一。

  在上述时代背景下,大数据在我国得到了广泛重视。《大数据标准化白皮书(2016)》指出,我国正处于工业化向信息化发展的转型时期,信息的公开、共享和服务成为时代发展的主题,开发和利用信息资源十分重要。阿里巴巴等互联网企业纷纷推出自己的大数据分析工具,使这一领域呈现快速发展的态势。

  2016年中国大数据发展趋势表现出如下特点:云计算和大数据深度融合;围绕数据生产、开发、服务和流通的大数据生态系统正在构建;开源技术不断进步,互联网公司开启了大数据技术和模式创新。全社会的大数据产业生态正蓬勃发展。

  也正是在这一背景下,教育信息化的发展进程中出现了“教育大数据”这一技术形态,并对“互联网+”时代的教育信息化产生深刻的影响。

  杨现民等人在《教育大数据的应用模式与政策建议》一文中,对教育大数据的作用进行了较为系统的阐述,并就如何推动教育大数据发展提出了六点建议;在《发展教育大数据:内涵、价值和挑战》一文中,对教育大数据结构模型进行了阐述,并就我国教育大数据发展中面临的应用落地、数据安全、数据治理与运营等挑战进行了描述。

  孟志远等人描述了“大数据驱动的教育变革”国际研讨会暨首届中国教育大数据发展论坛中关于教育大数据的研讨。该研讨会涉及三个方向:一是大数据变革教育的理论思辨研究,体现在利用教育大数据转变教育思路、改变教学方式、转变评价观念、建设教育治理体系等方面;二是基于教育大数据的教育现状解读,对各种渠道获取的教育大数据背后蕴藏的教育现状进行分析与展示;三是相关技术介绍,包括新兴的大数据计算理论,以及传统技术手段与定量研究方法的新应用。

  当前,伴随移动终端泛在化及物联网技术的发展,数据采集正在向非结构化、过程性的数据转变。数据之于教育教学的意义和价值日益凸显,从繁杂的教育数据中发现相关关系、诊断现存问题、预测发展趋势,对实现个性化学习、辅助教育科学决策等方面具有重要作用。基于大数据的学业诊断与提升,以及基于大数据的园所科学化管理等应用案例越来越多地呈现,教育大数据研究与应用进入了快速发展阶段。

  2016年4月,《中国基础教育大数据发展蓝皮书(2015)》发布,对教育大数据的应用模式进行了归纳,包括驱动教育政策科学化、驱动教育评价体系重构、推动区域教育均衡发展、助推学校教育质量提升以及促进师生个性化发展,并提出七大常用的教育数据分析模型,包括决策支持模型、校情监测模型、适应性学习模型、学业评价模型、学习预警模型、深度学习行为诊断模型和学生画像模型等,教育数据的系统化发展和应用得到越来越广泛的重视。

  二、推进教育数据的教育教学应用

  面对大数据时代的来临,我们一方面要理解大数据及其支撑技术发展的前沿状态;另一方面,也要理解我国教育信息化建设发展进程中教育数据基础环境的基本现状,教育大数据应用发展的进程才刚刚开始。我们要宣传、关注和应用教育数据,从各级各类教育业务发展中推进数据的生成、汇聚和应用,特别是广大一线教师要用数据来改变“经验性”教学实践,成为能用数据、想用数据和善用数据的一线教师;同时,教育系统中的各级各类教育管理人员,更应该基于数据开展精准管理,推动教育综合治理的能力建设。伴随教育大数据领域的发展,数据之于教育教学应用发展的意义日益得到实践,下面通过一些案例进行说明。

  1.数据功能支持的文献研究

  教育科研是广大一线教师专业发展过程中的必要环节,而文献研究是教育科研的必然途径。近几年来,各类文献资料库的数据功能得到了显著加强。以我们开展的一项关于“高阶思维能力”的文献研究为例,在CNKI上检索关键词“高阶思维能力”,该平台不但呈现了文献列表,还提供了计量可视化分析功能。用户可以选择部分文献或全部文献进行可视化分析,CNKI将根据文献里的年份、学科、作者、机构等数据信息自动生成多种统计图形,包括总体趋势分析、分布分析(涉及学科、作者、机构和文献来源等类别),以及根据关键词出现频率和关联特征自动生成的关系网络图。基于这些分析,用户可以快速获取其教育科研中核心概念的发展态势,并根据自己的研究问题,进行整合和讨论。

  2.基于互联网教育服务的学习者发展研究

  自2013年以来,伴随在线学习的发展,越来越多的互联网教育服务走向广大师生的学习和教学常态化实践。这些系统覆盖全国的教育用户,其学习行为、学习表现能够持续有效地记录在系统中,具有“教育大数据”发掘的意义和价值。下面以作业盒子小学(原速算盒子)、小象数据研究院发起的“全国小学生数学能力在线评测”活动为例。

  该评测活动是全国范围内首次跨区域、跨教材版本、跨年级的摸底考查行动,评测时间设定在2017年3月6日至16日,共吸引全国31个省、市、自治区近8000所学校,超过80万师生同时在线参与评测,创同类评测活动参与人数历史之最。题目布置、答题、批改以及数据生成全部在线完成。在指定评测时间内,教师通过作业盒子小学将评测题目布置给班群学生,学生在线提交作业,系统自动批改,并从答题时间、正确率、考查能力等多个维度统计区域、班群和个体的差异,据此形成研究报告。

  本次评测活动所用题库紧紧围绕教学大纲和数学核心素养的基本要求,注重对不同维度数学能力的考查,包括数感、符号意识、空间观念、几何直观、数据分析观念、运算能力、推理能力和模型思想等。通过科学的题量设计和答题时间设置,充分考查不同区域、不同教材版本以及不同年级学生的知识点掌握情况和数学能力的分布状况。此次活动在短时间内集中采集了超过1.2亿条评测数据,通过大数据平台集中处理后自动生成可视化、数据化的数学能力分布图表,并在专家的分析解读后,形成具有可操作性的教学建议,突破了传统评测在区域、时间、人力、成本和效果等诸多方面的局限。下面将一些数据进行呈现。

  作为第一次跨区域、跨教材版本、跨年级的小学生数学能力在线评测活动,本次活动共覆盖全国31个省、市、自治区,7596所学校,20174位教师,825878位学生。从参与度上来看,湖南、山东两省参与度排在全国前列。

   1~4年级题量设计相同,答题平均用时呈递增趋势。5~6年级题量相同,但答题用时差距较大。(如图2)

  

 

  本次评测中,组委会将题目比对数学能力进行了标签化处理,进而对不同年级数学综合能力分布进行了量化考查,差异明显。(如图3)

  

 

  报告在数学核心素养能力方面增加了区域对比维度,抽取了上海、北京、吉林长春、湖南益阳四个城市与全国平均水平进行比对。调查发现了一些较为明显的差异,以上海为例。(如图4)

  

 

  3.基于大数据分析下的个性化学习策略研究

  伴随教育大数据领域的发展,个性化学习支持与服务成为备受关注的实践领域,并同广大一线教师和学生的常态教学、学习实践相结合。

  科大讯飞智学网提供针对数学、物理、化学等学科的个性化智能教学方案。通过个性化智能教学系统收集教育大数据,智学网提供精准数据分析,实现精准评测和精准推荐。

  系统根据学生真实作答数据,智能诊断出每个学生的知识点掌握情况,测评出薄弱环节,并基于科大讯飞人工智能推荐引擎提供个性化学习资源,助力教师因材施教,帮助学生查漏补缺,系统化改进学校教与学的形态,全面提升学校的信息化应用能力和教学服务水平。(如图5)智学网个性化教与学服务促进了师生教与学方式的变化。

 

 

  目前该系统已经在合肥一中、合肥六中、南京一中、宁波二中、黄广中学、南昌三中等学校使用,在学生成绩的提高方面取得了明显进步。

  合肥一中高一年级2016年上学年周练5数学总体效果如表1。

  

 

  黄广中学高二年级2016年10月月考(理科)化学总体效果如表2。

  

 

  4.基于“双课堂”各类交互数据支持语文专题教学

  教育数据不仅用于支持精准调优的教学实践,更用于促进课堂向支持学生能力发展的高阶课堂生态方向发展,以笔者所在团队与北京五中合作的“双课堂”深化发展研究为例。“双课堂”,即常态的“现实课堂”与基于网络教育服务平台搭建的“虚拟课堂”。将二者适当融合,构成一个新型的教学环境,凭借这一环境所开展的教学可称为“双课堂”教学。在这一教学环境中,“虚拟课堂”以网络平台为依托,分别为学生和教师提供云端的个人中心和公共平台。教师转变为学生的指导者,学生则可以在教师的指引下进行个性化自主学习,并且能随时随地与教师、同学进行交流探讨。“现实课堂”中,教师可以与学生面对面交流,解决学生的共性问题,从而保证了学生学习内容的统一及整体学习质量的提升。

  在上述“双课堂”教学环境中,如何充分发挥两类课堂各自的优势,使“现实课堂”成为促进学生核心素养和学科能力发展的课堂,是非常重要的研究话题。本团队与北京五中王屏萍老师团队开展合作,充分发挥行为数据、交互数据、作品数据的价值,挖掘这些数据背后所反映的学生学习状态、学习认知建构效果、学生思维发展品质。下面以王老师“双课堂”教学中某一主题的语文教学为例,通过“双课堂”支持系统所积累的数据进行分析。

  例1:学生参与交互的行为状态分析

  利用UCINET软件对其进行社会网络分析,可以得到“地坛中那些景物”主题的交互网络图。(如图6)可以看出,除了授课教师,仲同学与其他人的交互最多,反映出他在本次讨论中表现最为活跃。另外,从他被回复的情况可以看出,他的发言经常被其他同学回复,能引发其他人思考讨论,或者他发言的角度新颖,能够引发质疑等。除了仲同学之外,田同学、王同学、张同学在本次讨论中的发言也相对比较积极。可以看出,这几位活跃发言的同学成为几组讨论的中心,撑起了这次讨论的交互网络。

  

 

  例2:认知建构导向的交互行为频次统计

  学习者的认知建构是教学实践中有重要意义的实践话题,不同的认知建构状态反映了“双课堂”教学生态中意义建构的指向和效果。在所选定的教学专题中(如图7),阐述/附议和知识共建/意义挖掘所占比例最大,分别为32%和30%。说明在本次讨论中,大多数学生趋向于发表自己的观点,或针对别人的观点进行补充和探讨。同时,驳斥/否定占22%,仅次于前两者,主要表现在对他人的观点提出质疑,进行反驳,这反映出学生在该帖中的讨论相对激烈,能进行思维的碰撞。审视/修改和其他分别占8%和6%,主要表现在学生能结合别人提出的观点来反思调整自己的想法,同时表达感谢或者对他人的想法表示赞扬。总结观点占比最少,仅为2%,反映出只有少数学生能有意识地梳理大家的发言,并逻辑清晰地阐述对问题的全面认识,大多数学生还是趋向于就问题的单个角度进行阐述或讨论。本次讨论中,学生在“虚拟课堂”中实现了合作学习,能通过意义共建、驳斥否定等方式共同建构对知识的理解,反映了合作学习的本质。

  

 

  例3:基于SOLO分类框架的学习者思维发展呈现

  学习者的思维发展越来越成为课堂教学追求的目标。研究中,选取某一专题活跃度较高的五位同学,利用SOLO分类理论框架,对他们2013年至2015年间在论坛中发表的帖子进行编码,旨在考查学生的发言质量和思维发展趋势。(如图8)从中可以看出,学生在2013年的思维表现相对不稳定,从整体发展趋势可以看出学生的思维层次逐渐由低到高,表现为前期的分数主要在3以下,后期的分数在3以上(12月份后期分数值降低可能是因为临近期末,学生的帖子质量受到影响)。由此可见,学生在“虚拟课堂”上进行讨论时,思维逐渐由单一结构走向多元结构。

  

 

  上述一组案例,从面向应用视角让我们体验到教育数据应用的意义和价值。只有积极主动地关注教育数据,应用教育数据,教育大数据才能有切实发展的可能。

  而另一方面,我们也能够深刻感受到,教育数据的应用面向教育科研、教育管理、学习发展及教学优化,特别在变革课堂教学、建构面向学生核心素养提升和21世纪能力发展的课堂等方面,都具有了切实有效的实践可能。

  期待广大教师积极参与到教育数据应用发展的进程中,并以您的智慧和实践为我国教育现代化的进程贡献力量。

  李玉顺 清华大学博士,副教授,数字学习与教育公共服务教育部工程研究中心副主任,中国教育发展战略协会教育信息化专业委员会专家、北京市中小学百所数字校园实验项目指导专家、北京数字学校发展战略研究核心专家、国家数字化学习资源中心高级研究员。现任职于北京师范大学教育学部,研究方向为泛在学习、适应性智能学习系统、中小学数字校园与区域教育信息化等。

标签:教育;发展;学生
责任编辑:秦倩清(实习)