中国教育和科研计算机网
EDU首页 |  中国教育 |   教育资源 |   科研发展 |   教育信息化 |   教育在线 |   CERNET  |   校园之窗
教育信息化

资讯 | 专题 会议 解读 专栏 访谈 项目 数据 招标 企业 产品 CIO 技术 校园信息化 教育装备 下一代互联网

中国教育网 > 教育信息化 技术论坛入口    用户名
密 码 搜 索 
您现在的位置: EDU首页 > 教育信息化 > 解  读
陈翼:数据质量与校园信息化应用建设思考
http://www.edu.cn   2009-12-07 中国教育和科研计算机网 作者:

字体选择:【大】 【中】 【小】

  12月1日消息,由教育部科技发展中心主办,《中国教育网络》杂志承办的“2009(第四届)教育信息存储大会暨数据管理与虚拟化应用研讨会(杭州站)”在浙江大学举行。2009教育信息存储大会(杭州站)分论坛之·“数据中心建设与发展”。

  下面是复旦大学信息办信息中心副主任陈翼现场演讲实录。

  陈翼:各位老师大家上午好,我今天报告的题目是“数据质量与校园信息化应用的建设与思考”这是我今天报告的一个提纲,今天我们会议的主题是数据存储数据管理和虚拟化的发展为议题。在高校里面信息建设的热点现在不仅包括海纳存储虚拟化高可用性等等。这些应该在很多高校里面已经有很深入的应用和一些比较好的一些成功的经验。但是从我们高校实际工作的一个角度来讲的话,我们可能有一些深入思考,也就是说,我们会扩充一个数据中心的建设,不仅仅是一个基础设施的概念。包括刚才杨女士讲的存储这一块,从基础设施的角度来讲,也是非常先进或者非常前沿。但是我们从学校应用的角度来讲,数据中心能发挥多少作用?可能还不仅仅是一个基础设施能解决的问题。所以我们来从数据角度的来做一些思考,我们认为数据中心建设的着眼点,应该在数据这两个字,因为我们存储的是数据,查出的是数据,系统里面输入的是数据,输出的也是数据。最后能体现我们信息成效最有价值的数据。但是我们想问问自己,也想再问问同行,我们的系统数据能满足现在的使用要求吗?

  可能我们碰到类似一些问题,比如说像信息系统用的数据不清,概念混淆,程序设计的控制和教学不严,系统使用数据的偏差等等导致系统数据质量的问题比较多,可能长期存在,随着数据的量越来越大,这些问题不但没有减少反而增加了,另外业务的数据标准化,不仅导致这个数据的质量问题也给数据集成带来很大的麻烦,前面方老师也提到这个数据集成的经验。可能类似的情况在很多高校,包括在我们学校都有这个情况,我后面还会讲到。数据集成并不是一个简单的技术问题。

  建立和推广高效的业务数据标准,处再一个充分的阶段。大家知道教育部牵头做了一个教育管理信息的标准,这个标准只是具有一个指导的意义,真正能给大家的实际建设带来多大的成效,现在还没有完全体现出来。在颁发利用环境当中,不同的单体系统之间还存在大量的数据依赖,这个对数据层面有效的基层要求比较高。

  另外我们也认为数据保存城市的系统当中,其质量的问题很难暴露出来的,只有这些数据被使用你才能逐渐的显现出来。目前很多高效的数据分析和利用停留在一个相对初级的水平,数据很难被发觉利用,也反应我们现在系统建设过程当中数据不准确,不精确不一致的诸多质量的问题。所以我们面临这样一个挑战,一方面我们高校对信息化现在要求越来越高,对我们的期望也越来越大。但是我们现在花费大量的能力经历和财力做的这个信息系统,我们信息系统的数据是不是能够满足学校今后发展的要求。我们认为这个系统当中最有价值有待发展的宝藏就是积累的数据,从这个数据里面发现有价值的信息,我们信息系统前期投入真正价值的体现。而且我们认为这方面拓展可能是不可限量的。现在很多数据分析利用的功能仅仅是一个开始。但是如何充分利用信息系统当中的数据,当然也是以后我们现在信息系统实施最重要的工作,也是一个长期的工作。

  下面我花一点时间讲理论方面的东西,我快速带过去,后面再看一下我们复旦大学在以往的做法和目前面临的一些新问题新挑战,以及我们的一些新想法。这里有一些常见的,有些是我们系统当中直接找出来的数据质量的问题实例。我们认为数据质量的问题,可能原来在实际工作中有一些误区,造成这个数据底下的主要原因可能就是在于数据录入的原因,要提高数据质量,只要把数据输入的源头这个关把好,保证录入数据符合要求,解决这个数据上的问题。

  另外一个观点通过这个手段,我们在这个数据收入的环境进行这个格式标准要求方面的控制,就能解决这个数据的问题。但是实际我们在实践工作当中来看的话,高校的信息化不是一个单体的系统,也不是一个简单的应用。是一个庞大的应用环境,数据因为是多部门的维护,有一些重复采集,各部门对这个数据的定义不清楚,或者不一致。参照不完成。这些并不是每一个部门里面,数据录入的人员一些基层的工作人员就能解决的,解决数据质量问题往往要耗费比较多的资源,增加这个管理的成本,不单单是一个技术的问题,需要来自管理和技术两方面的可能形同的努力。对于数据系统我们有这样一个理解,首先质量这个词大家见得比较多。尤其是在我们社会生活当中非常广泛使用的词语,我这里面采取国家标准当中对质量的一个定义,质量是一种固有特性,要求的程度,这些要求包括民事的,通常必须履行的需求和期望。

页面功能 【打印】 【关闭】 【我有话说

版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备05078770,文网文[2008]228号

关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com