首页   |   关于我们   |   理事专栏   |    |   发行征订   |   广告服务
近期活动
2006’中国无线校园建设与应用大会
  本届大会将以“无线校园,无限生活”为主题,共同深入地探讨无线校园网络的建设与应用对教学模式、教学理念、教学管理等方面带来的深刻变革!
《中国教育网络》
 编委会主任:李志民
 编委会副主任:吴建平
 编委会委员:(按笔划排序) 
  马 严  王兴伟  王 陆
  王珠珠  雷维礼  张 凌
  张 蓓  张德运  李 卫
  李 未  李芝棠  李 星
  李晓明  杨健安  汪为农
  汪文勇  陈 禹  周全胜
  金 海  娄 晶  祝智庭
  赵 宏  奚建清  袁成琛
  康 宁  黄荣怀  龚 俭
   
《中国教育网络》总编辑:吴建平
 
展会合作商

1.2006第三界广州国际多媒体通信及会议室设备展览会

2.2006北京地区教育装备展示会

3.第七届中国国际计算机网络和信息安全展览会

4.2006中国国际信息通信展览会

5.第四届中国国际软件和信息服务交易会 China International Software & Information Service Fair 2006 中文简称:“中国软件交易会”或“软交会” 英文简称: CISIS

6.

7.

8.网络存储世界/2006中国

9.



        “教育超市”的个性化授导
“教育超市”的个性化授导

  自1998 年教育部批准清华大学等四校开展现代远程教育试点起, 或从2000 年“教育部现代远程教育试点经验交流会”正式启动重点大学的试点之后,中国远程教育以毋庸置疑的姿态进入第三个阶段,即开放灵活的远程学习(丁兴富,1992)。“服务”的办学理念悄然兴起,不断地深入人心,构建“沃尔玛”式的教育超市成为远程教育机构的梦想。“沃尔玛”超市为市民提供便利快捷个性化的服务启发着教育者们构筑具有其品牌效果的远程教育连锁超市。为学生提供优质的个性学习支持服务成为当前热烈讨论的话题,“个性化授导”应运而生。那么我们该怎样使这一理念付诸于实践,怎样在实践层面上“拿来”有效的技术支撑个性化服务?本文旨在讨论把基于wed的数据挖掘技术应用于远程教育个性化授导的空间,通过获取学习者在web上的学习过程行为数据,如访问频度、内容、访问时间长短及偏好等,经过模式处理,得出学习者学习过程的一般模式规律,以此为学习者提供良好的个性化服务,使学习者更好地发展自我。

  基于web的数据挖掘

  基于web的数据挖掘是将web的使用与传统的数据挖掘结合起来,来获取web知识的过程。一般来说,基于web的数据挖掘按照挖掘的对象不同,可以分为web内容挖掘、web结构挖掘及web使用挖掘。

  web内容挖掘是指对Web页面内容及后台交易数据库进行挖掘,从Web文档内容及其描述中的内容信息中获取有用知识的过程。

  web结构挖掘是从人为的链接结构中获取有用的知识。由于文档之间的互连,WWW能够提供除文档内容之外的有用信息。利用这些信息,可以对页面进行排序,发现重要的内容页面,重新组织内容结构,使内容逻辑结构更加合理。

  web使用挖掘是主要通过挖掘相应站点的日志文件获取学习者的访问内容、停留时间、访问频度等,发现其学习访问模式等有用信息的过程。

  挖掘流程

  基于web的数据挖掘一般流程经过数据的采集、预处理、模式发现、模式的分析及其应用几个过程。

  数据采集

  根据挖掘的目的明确收集学习者什么样的数据:web内容挖掘是从web自身资源中收集信息,利用网页自动化分类技术可以用做站点搜索引擎;web结构挖掘从页面内部结构(intra-page)以及页面之间的结构(inter-page)获取资料,包括HTML内部标记和网页之间的链接关系,可以以树的形式记录下来;web使用挖掘从服务器端或者远程代理或者客户端来收集用户使用过程的数据,如IP、URL、ID、Time等。

  预处理

  web内容挖掘的预处理:把网页中的文本、图片及其他文件转换成数据挖掘算法可用的形式。

  web结构挖掘的预处理:对web的页面结构进行分析、变形,使之适用于数据挖掘系统。

  web使用挖掘的预处理:过滤掉价值不大的信息(如用户访问的传输协议,错误代码等),补充用户完整路径,识别用户(Single IP address/Multi Server Sessons Multiple IP address/Single Server Session/Multiple IP address/Single User Multiple Agent/Single User)和识别事务(可以根据用户跨越页面时间长短来划分事务,也可以根据用户一系列的page view直到退回首页划分为一个会话事务)。

  模式发现

  经过数据预处理之后,应用一种合理的挖掘算法或综合应用不同的算法,如关联规则分析、聚类和分类技术、统计分析以及时序模式技术等,来处理“消噪”后的数据,最终发现用户的访问模式。关联规则分析可以发现学习者对内容页面之间的访问关系,调整页面之间的结构关系,预测学习者可能访问的内容,使其最快捷地访问到感兴趣的内容。聚类分析挖掘访问相同页面的相似学习者,可以为其群体提供特定的内容;同时,聚类分析还可以将内容相关的页面归为一个组,为学习者搜索内容提供服务。预先为学习者设定几个类别,利用分类技术将学习者投射到某一个类中,为某特殊类提供特殊的个性化资源和学习支持服务,还可以用于远程协作的学习小组分配。统计分析技术是通过统计学习者经常访问或者访问频繁的内容,发现用户的兴趣倾向,也可以统计非法IP、无效URI 和未授权访问等。这些信息对于提高系统性能,密切注意学习者动向起着辅助决策作用。序列模式可以寻找用户频繁出现的序列,预测学习者行为,把其需要的资源主动提供给他(她),减少系统响应时间。

  模式的分析和应用

  通过模式挖掘之后,生成的规则数目庞大,表达晦涩,得不到很好的利用,这就需要对模式进行分析评价,通过模式分析和应用技术处理之,选择学习者易于理解和接受的方式显现出来。经常用到的是可视化技术、联机分析技术和智能查询机制等。利用数据挖掘与学习内容绑定的技术,在学习者学习过程中以可视化方式指导其学习和个性发展。

  远程教育个性化授导中的数据挖掘

  学习者特征模型构建

  根据学习者不同的特征参数,对学生学习活动进行跟踪,记录与学习相关的信息。记录学习者经常访问的URL,跟踪统计学生访问次数、总停留时间、该学生访问的课程数、该学生对哪些课程停留时间较长等,还可统计网站某个时间段内访问的次数、访问次数最多的URL地址、学习者作业的过程、参与讨论的情况、交流用的工具等。通过数据挖掘的去噪和模式发现模块,得到学习者的学习特征风格,建立和完善学习者学习模型,建立学习者个性数据库,为不同的学习者提供合适学习策略提供基础。

  为学习者提供个性化的学习资源

  在启动学习者个性数据库之后,可以为学习者个别需要调整学习资源,将与用户无关及用户不感兴趣的资源过滤掉,即远程教育的界面自适应性。统计分析技术的应用可以根据用户经常访问的页面来预测学习者进一步的行为,推出其感兴趣的资源,减少学习者等待时间,正如Microsoft office系列的人性化推理预测一样。

  个性化学习指导

  不同的个体其背景各不相同,如个人的学习能力、兴趣与学习习惯、原有基础、努力程度,都存在巨大的差异。对于每一个用户都有很多属性,我们可以在进入系统平台之前让用户提交测试用户属性信息的一组表单,得到最初的学习类型。但是一些属性却是持续变化的,如学习能力、知识基础、学习历史等。我们可以挖掘用户的使用数据日志分析他的浏览趋势,即一组数据项之后出现另一组数据项,从而形成一组按时间排序的会话,以预测未来的访问模式,这将有助于针对特别用户群安排特定内容,可以解决远程教育中针对各种层次学生进行因材施教的问题。

  针对学习者个性特点建立个性化的学习策略库,动态地获取学习者当前学习过程信息,将挖掘处理后的信息反馈在学习界面上,给学习者及时恰当的学习指导。

  改进系统性能

  对于远程教育机构来说,学习者的满意度和服务质量是关键,系统的安全和稳定性能决定学员们继续下去起着重要的作用。随着远程服务的发展,网上交费等陆续出现,安全性被越来越多的关注,web的使用挖掘提供了网站构架的信息,及用户使用的信息。管理员可以根据站点流量信息,控制web缓存、负载平衡和网络构架等问题。

  个性化授导系统构架

  远程教育“个性化授导”本质上是学习者个性化服务的过程,以学习者需求为中心,满足需要的过程。包括两个方面,其一是根据学习者特征提供丰富的个性的学习资源服务——“授”;其二是提供学习过程支持服务,即学习指导——“导”。图1是个性化授导的实质:d是不同的学习者通过各种途径使用学习资源,即学习过程。b是系统跟踪学习者学习过程,创建学习者访问模型,创建学习者个性数据库。最后系统根据动态的学习者模型调整系统资源,满足个性化需求,即图中c。图中的a是远程授导最为重要的方面,对学习者的学习过程挖掘之后,反馈给当前学习者适当的学习建议,应用个性化指导策略指导其完成能力的拓展以及个性的发展,将个性化授导实质具体化,把基于web的数据挖掘应用于远程个性化服务之中。

  图2是构建的远程个性化授导的模型。此模型分为几个模块,首先远程教育系统向学习者提供丰富的资源,包括课件库、作业库、答疑库、案例库等。这些资源以知识点为核心进行组织,统称知识库。知识库通过web服务器调度内容知识点给学习者使用学习。

  个性库模块

  该系统建立学习者的个性化特征库,其一是保存学习者静态资料,如学习者姓名、ID、密码、性别、昵称、email等,其二是学习者学习者的知识结构、学习风格、学习历史、课业完成情况等动态信息。静态信息一般是不会发生变化的,提供进入系统的入口。动态信息随着学习者学习过程的进行会发生质的改变,在学习开始之前让学习者通过web提交一组自己动态信息的问答表,该问答表包括学习者学习风格类型、知识结构等学习特征的属性值,之后系统会利用数据挖掘模块不断完善其模型特征。

  基于web挖掘的模块

  该模块从web服务器上获取学习者学习动态信息,一般来说以web的使用挖掘为主。在对服务器的学习者访问日志路径进行补充之后,系统将对数据进行预处理,清除那些与挖掘无关的信息项,识别用户,对事务合理地切片,最后得到的是学生访问信息的原始信息立方体数据库。该数据库数据庞大,需要进一步的模式发现与分析。应用关联规则分析、分类和聚类技术、序列模式等数据挖掘算法处理学生访问立方体数据库,通过可视化等模式分析技术把挖掘结果以学习者可以理解和接受的方式呈现,不断完善补充学习者个性模型,同时通过web服务器反馈给学习者合适的学习策略和学习建议。

  Web服务器模块

  学习者通过访问Web服务器获取知识,web挖掘处理后的应用模式作用于web服务器,在知识库中挑选适合于学习者个性的知识,同时为其提供合理的学习策略和学习建议。

  最后,学习者通过web服务器访问学习资源,看到的是根据其个性定制的学习环境。

  远程教育的个性服务已经成为远程教育提高教育教学质量的一个关键共识问题,本文对基于web的挖掘过程、挖掘的算法、挖掘模式进行了分析基础上,讨论了基于web的数据挖掘在远程教育个性化授导空间的应用的切合点,进而分析了个性化授导实质,之后构建了远程教育个性化授导模型。

  远程教育个性化授导是教育发展的必然要求,本文提出了模型的构建模块,需要进一步从技术角度来细化,在编程层面上实现之。


北京赛尔时代传媒文化有限公司
主管单位:中华人民共和国教育部  主办单位:教育部科技发展中心  承办单位:中国教育和科研计算机网CERNET
《中国教育网络》杂志社 © 版权所有 严禁复制
建议使用800*600分辨率及Microsoft IE5.0版本以上浏览器

layer
layer
close
close