中国教育和科研计算机网
EDU首页 |  中国教育 |   高校科技 |   教育信息化 |   CERNET
教育信息化

资讯 | 专题 会议 观点 专栏 访谈 企业 产品 CIO 技术 校园信息化 下一代互联网 IPv6视频课堂

中国教育网 > 教育信息化
您现在的位置: EDU首页 > 教育信息化 > 校园信息化
大数据在高校中的应用研究
http://www.edu.cn   2014-02-10 中国教育网络 作者:孙其伟 陆春

字体选择:【大】 【中】 【小】

  

  3. 数据分析

  将就业分析模型所需的数据存储在Hbase 数据库后,可以利用Hive 对Hbase中的数据进行查询和分析。Hive 提供了一种简单的类SQL 查询语言,十分适合数据仓库的统计分析。通过Hive 我们可以实现传统数据仓库所实现的对就业数据的汇总统计分析,而且可以容易的扩展其存储能力和计算能力。

  除了数据统计分析之外,我们还可以利用Mahout 这个机器学习工具对数据进行监督学习和无监督学习。监督学习使用先验知识对数据进行分类;无监督学习则由计算机自己学习处理数据,并在做出判断后给予一定的激励或惩罚。在进行就业分析时,我们可以使用Mahout 已经实现的具体方法。首先是协作筛选,通过分析已就业学生的成绩、参加的社团活动、关注的行业、性格特点、就业单位、就业岗位等,计算学生之间的相似度,为即将毕业的学生推荐适合的就业单位和岗位,提供个性化的服务;其次是聚类,这是一种无监督的机器学习方法,我们可以通过不同的维度将未能及时就业的学生进行分析,从中找出其共同的特点,再通过比较在校学生的相关属性,及时对学生给出预警,以便其在后续的学习和生活中加以改进,如图3 所示。

  4. 数据展示

  在数据展示层, 我们可以使用Tableau 软件将分析的结果进行可视化的展示,Tableau 将数据与美观的图表完美地结合在一起,它包含非常多的预定义的图表格式,同时还可以将时间、地图等多种维度在单一的图表中进行展示。

  学习行为分析

  为了支持学生的自主学习,高校一般都有自己的学习管理系统如Blackboard、Sakai 等。这些学习管理系统为学生、教师提供了课程学习和交流的空间。美国教育部教育技术办公室认为教育数据分为键击层(keystroke level)、回答层(answer level)、学期层(session level)、学生层(student level)、教室层(classroom level)、教师层(teacher level)和学校层(school level),数据就寓居在这些不同的层之中。一般高校每年的开课数在数千门,学生数在数万人,产生的数据量非常大。应用大数据分析技术使得监控学生的每一个学习行为变为了可能,学生在回答一个问题时用了多长时间,哪些问题被跳过了,为了回答问题而作的研究工作等都可以获得,用这些学生学习的行为档案创造适应性的学习系统能够提高学生的学习效果。

  学科规划

  促进学科交叉融合发展,构筑有生命力的学科生态,打造凸显核心竞争力的高水平学科是学校学科规划的重要任务。借助大数据分析技术,充分收集各学科的教学状态数据、科研项目数据、前沿发展动态等信息,从而分析学科建设存在的不足,确定学科未来发展的方向,发掘出潜在的具有国际视野的学科带头人。

  心理咨询

  论坛、微博等平台上每天都会产生由评论、帖子、留言等数据,这些数据集反映了师生的思想情况、情感走向和行为动态,对这些数据进行科学的存储、管理并使用大数据技术进行有效的分析利用,建立师生思想情感模型,对掌握师生心理健康程度,有针对性地加强对师生的心理辅导有着重要的意义。

  校友联络

  校友资源犹如一座座宝藏,对高校的发展建设有着不可替代的重要作用,是高校工作的重要组成部分。有效地把校友联络起来、团结起来,对学校的建设和发展具有重要意义。利用传统的管理方法,仅校友信息收集就要耗费大量的时间和精力。利用大数据技术,收集各类社交网站上的非结构化数据,通过分类、聚类等数据挖掘方法,确定校友身份并收集其联系方式、参加的活动信息等,可以大大提高校友数据收集的效率,为以后利用校友资源提供良好的基础。

页面功能 【打印】 【关闭】 【我有话说

MOOC风暴来袭

版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备15006448号-16,京网文[2017]10376-1180号

关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com