您的位置:首页 > 参评方案展示 > 大数据

西安交通大学:基于学工大数据的学生行为模型分析

  随着教育信息化的发展,各高校在业务管理、科学研究、人才培养等方面都有很大的提升,特别是随着近几年大数据、云计算等新技术不断提出,不仅推进了业务系统的建设,规范了业务操作,也积累了大量的业务数据。

  近年来,很多高校开始使用大数据分析解决日常教学、管理中遇到的实际问题。据分析,在学生行为分析方面,很多高校通过对校园卡消费、上网、考试成绩等数据进行分析,从而改进学校的教学、管理等方面的问题。但是,对单一数据的分析,不能完全反应学生所存在的所有问题,因此,如果能有效结合学生所有的消费、生活、上课、上网、门禁等数据,进行全方位分析,就能及时的对学生提出学习、生活等方面的指导及帮助。该平台建成后要求能够充分利用各部门的业务数据,有效的展现业务数据的数据价值,为提升学生的日常行为分析、管理及发展指导建议提供可靠的依据,并且能够支持未来潜在的数据和业务需求。

  研究设计及分析方法

  数据集成

  本平台以学生工作大数据为基础,根据教学管理需求,对学生工作相关的数据进行集成、分析,最终实现学生画像、学业预警、精准资助、行为告警以及成长推荐等功能。因此,平台集成了网络、消费、门禁、考勤、社团、贫困补助、奖助金、图书借阅等各个相关业务的共计十三大类业务系统的所有数据。

  数据集成是平台的重要组成部分,是整个平台的信息传输、信息交换总线。实现校内各业务系统、异构数据源集成,并按照统一标准对所有数据进行清洗、转换,同时要保证业务数据的完整性,是一项非常复杂且繁琐的工作。在集成过程中,针对数据来源的不同,且各业务统间数据口径、标准不统一,系统间数据依赖关系复杂,维护难度较大等问题,首先确定数据的权威来源,然后通过学校主数据平台将数据同步到数据采集库,再根据数据源的数据质量采取不同的方式对数据进行清洗、转化放入分析库。在数据抽取过程中,对各业务系统数据的一致性、无效值和缺失值等都进行了一一的核对及处理,保证数据的完整性和有效性。

  平台设计及功能

  基于学工大数据的学生行为模型分析服务平台是数据整合、清洗与分析挖掘的一体化平台,它由四大部分组成,分别为:数据集成、业务管理、综合分析和数据展示。平台的架构如图1所示。

  图1 平台整体架构

  数据集成是指平台对主数据平台同步到采集库里的数据质量、编码标准、字段格式等统一进行分析,并按照学校的标准将其标准化侯放入分析库;业务管理是指负责学生工作的老师对学生的日常事物如:第二课堂、心理咨询、党团生活等进行管理;数据综合分析是指将学生综合分析库中经过标准规范化的数据分主题进行分析挖掘;数据展示是指将数据综合分析中的分析结果进行可视化的展示,通过报表展示工具将数据与美观的图表完美的结合在一起,并按照不同的权限供学校不同层次的用户查看。

  学生行为模型算法分析

  学生行为可通学生校园行为(如:出勤率、到课率、轨迹、消费、上网等大数据)进行量化,量化后的数据可对学生的作息时间规律性、努力程度、学习技能、经济状况等多维度进行分析,最终达到揭示学生成长轨迹,进行学生学业预警、精准资助、就业推荐等目的,从而可以为学校对学生进行个性化与精准化的教育管理与引导提供重要依据。下面针对学生成绩预测进行进一步阐述。

  影响学生成绩的因素主要有六大类:第一课堂、第二课堂、经济消费、个人信息、生活规律和上网,且每种因素都有其关键指标,因此可以分别对各个因素的关键指标进行分析,如:第一课堂的学习成绩、到课率、准点率;第二课堂的学生参加活动与奖惩情况;学生经济消费能力;饮食、作息和上网时长是否规律等作为关键指标来进行分析。选用学生上课监控数据,准点率,出勤率,并结合上学期成绩,做加权求和,目的在于反应学生本学期的学习基础与学习态度,评价学生学习是否健康,公式如下所示:

  f(成绩(包含德育成绩))

  其中f(x)为归一化函数。再根据学生饮食是否健康。良好合理的健康饮食习惯是身体健康的保障;不良的饮食习惯则会导致人体正常的生理功能紊乱而感染疾病,严重时甚至会影响正常工作学习生活。因此饮食要按照科学的比例进行,公式如下:

  饮食指数=(2×f(p_m)+2×f(t_d)+f(S)+f(p_n))/6

  其中f(x)为归一化函数,p_m,t_d,S,p_n分别为早餐评价,用餐标准差评价,消费差评价,宵夜评价。

  其次还有作息时间是否规律、上网时长是否合理、准点率和出勤率是否正常以及历史学科成绩等分析,最终形成学生学业成绩分析结果。这个算法背后的思想是通过分析学生的作息时间、行为轨迹、上课情况等各事物间的相关性来进行成绩预测,例如:作息时间规律、出勤率高、去图书馆较频繁、按时吃早餐等的同学成绩较好。

  部署方案及应用效果

  平台部署方案

  本平台根据学校的统一建设规划,部署在以新华三技术有限公司的整体解决方案为基础的云平台上,云平台层采用了基于OpenStack架构的CloudOS高校运营版,计算虚拟化采用了基于KVM架构的CAS企业版,分布式存储采用了基于Ceph架构的ONEStor产品。所有产品采用基于主流架构技术路线的商业化产品,保证了系统开放性和对用户的友好性。

  平台应用效果

  通过本平台,能够掌握学生的日常行为轨迹,实时的了解学生的状态变化,并且可以通过分析数据,提前为学生提供有效的学习、生活以及未来的职业规划建议,进一步提高学校管理及服务水平。

  从学习方面,能及时发现学生的学习、作息时间以及出勤变化,及时查找变化原因,为学生提出合理的建议及有效帮助,提高学生的学习效果。在健康分析方面,可以及时关注学生的饮食习惯及消费状况,为学生提供良好的健康建议及精准的资助服务,保证学生的学习效率。从教学质量来看,能够实时的反映教学状态数据,不断提升教学质量。在学生就业方面,通过数据分析能完善就业指导,提高学生就业率。

  结论与思考

  本文主要阐述了了以学生工作大数据为基础,对相关数据进行集成和分析,最终形成完整的学生行为数据分析及服务平台,该分析结果可以对学校的教学、日常管理、学生指导等方面提供科学的、有力的依据。文中通过一种不同的视角,对影响学生相关的各因素进行了分析,并总结了分析结果在学生学习、健康、管理、就业等方面的具体应用,进一步阐述了将基础数据分析与学工相关数据分析相结合带来的更宽广的视角及更有效的分析效果。在后期的建设中,我们不仅要结合校内的数据,更要结合校外如:购物、网站浏览、社交等多个方面进行数据抓取及分析,以达到更有效指导及管理效果。

  (作者单位为西安交通大学网络信息中心)

来源:中国教育网络作者:张亚娟 洪丹丹 吴飞龙 锁志海
《中国教育网络》
杂志微信公众号
高校信息化应用
微信公众号
高校网络安全
微信公众号