中国教育和科研计算机网
EDU首页 |  中国教育 |   高校科技 |   教育信息化 |   CERNET
教育信息化

资讯 | 专题 会议 观点 专栏 访谈 企业 产品 CIO 技术 校园信息化 下一代互联网 IPv6视频课堂

中国教育网 > 教育信息化
您现在的位置: EDU首页 > 教育信息化 > 专题文章
“数字校园”建设的基础工程:信息资源规划(四)
http://www.edu.cn   2008-06-12 作者:

字体选择:【大】 【中】 【小】

  为了开发利用高校的信息资源,必须建立高校的信息资源管理(IRM)基础标准。这些基础标准决定着信息系统的质量和效率,因而也是进行信息资源开发利用的最基本标准。我们在实践的基础上总结出信息资源管理基础标准即一些数据标准,包括:数据元素标准、信息分类编码标准、用户视图标准、概念数据库标准和逻辑数据库标准。这些标准将构成高校信息化建设的数据标准化体系,在信息资源开发利用、信息系统建设和运行使用中都具有极其重要的基础性作用。

  建立数据标准的重要性和原则
  威廉·德雷尔(William  Durell)1985年出版的专著《数据管理——成功的数据管理实践指南》(DATA ADMINISTRATION:A Practical Guide to Successful Data Management)总结了信息资源管理的基础—数据管理标准化方面的经验。他的名言是:没有卓有成效的数据管理,就没有成功高效的数据处理,更建立不起来全组织的计算机信息系统。他认为,早期的计算机信息系统开发,缺乏关于数据结构的设计和管理方面的科学方法,直到近十年(指上世纪80年代),才对这些问题加以认真地考虑。信息系统设计人员了解和掌握数据标准,就像建筑设计师了解和掌握建筑材料标准一样重要,否则,是设计不好信息系统的。

  为了有效地制定和实施数据标准,威廉提出了一些重要的原则:
  第一,数据标准的制定要从实际出发,要以共同看法为基础;
  第二,数据标准要简明易懂,切实可行;
  第三,标准必须加以宣传推广,而不是靠强迫命令;
  第四,管理部门保障标准的执行,有纠正违背标准的办法;
  第五,标准应该逐渐地制定出来,不要企图把所有的数据标准一次搞完;
  第六,数据管理最重要的标准是一致性标准——数据命名、数据属性、数据设计和数据使用的一致性。

  数据元素标准
  数据元素(Data Elements)是最小的不可再分的信息单位,是一类数据的总称。信息系统中的“职工姓名”、“员工姓名”、“职员姓名”等,如不加以统一,在用汉语拼音表示其标识时就有ZGXM、YGXM、ZYXM等;而其英文标识就可能是EMP-NAME、NAME-OF-EMPLOYEE、EMPLOYEE-NM、EMP-NM等。如果统一采用“职工姓名”,其标识为ZGXM或EMP-NM,这就是少数的“标准化”数据元素;如果开发人员都这样做,就可大幅度减少信息系统中所使用的数据元素总数,并可大大简化其结构。数据元素的质量是建立坚实数据结构的基础。在数据元素的创建和命名上做整体的考虑,借鉴对化学元素的研究,就可以把握信息系统中有限数目的“核心”数据元素,这就需要建立数据元素标准——数据元素命名、标识标准和一致性标准。

  命名规则
  数据元素命名的规则是用一简明的词组来描述一个数据元素的意义和用途。这个词组的一般结构是:

  例如:“社会保险号码”(SOCIAL-SECURITY-NUMBER)是一个数据元素,其结构是:

  类别词(class word)是指能对数据对象作一般性分类的词,例如“时间”、“编号”等;基本词(prime word)是指能对数据对象做进一步分类的词,例如“设备”、“保险”等;修饰词(modifying word)一般是名词,而不是形容词或副词。类别词是数据元素命名中一个最重要的名词,用来识别和描述数据元素的一般用途或功能,不具有行业特征,条目比较少。基本词是对一大类数据对象做进一步分类(反映一小类数据对象),一般具有行业特征,条目比较多。把握类别词与基本词的定义和数目,就能控制数据元素的定义准确性和总体数目。

  注意:数据元素作为最小的不可再分的信息单位,其命名词组要说明抽象数据的逻辑属性,而不包括物理属性,即不得包括时间、空间和人员单位等属性。以“授课人数”这一数据元素为例,某天的授课人数、某教室的授课人数、某教授的授课人数等,都不再是数据元素。

  标识规则
  数据元素标识即数据元素的编码,是计算机和管理人员共同使用的标识。数据元素标识用限定长度的大写字母字符串表达,字母字符可按数据元素名称的汉语拼音抽取首音字母,也可按英文词首字母或缩写规则得出。

  一致性控制
  数据元素命名和数据元素标识要在全组织中保持一致,或者说不允许有“同名异义”的数据元素,也不允许有“同义异名”的数据元素。这里的“名”是指数据元素的标识,“义”是指数据元素的命名或定义。

  例如,“同名异义”的数据元素有:

  这是因为没有遵循数据元素标识规则,用两个字符来标识数据元素(过于简单)的结果。如果坚持汉语拼音或英文缩略的数据元素标识规则,就消除了“同名异义”现象:

  数据元素的“同义异名”的例子,如前面提到的“职工姓名”和“员工姓名”的标识分别是ZGXM和YGXM,还有“单位编码”和“单位号码”的标识分别是DWBM和DWHM等,实际上是对同一个数据元素用了不同的标识。

  建立高校的数据元素标准,是指按上述规则识别定义出所有的数据元素(一般在2000多个左右),由所有应用系统共同使用。

  信息分类编码标准
  信息分类编码(Information Classifying and Coding)是标准化的一个领域,已发展成了一门学科,有自身的研究对象、研究内容和研究方法。在工业社会中,信息分类和编码是提高劳动生产率和科学管理水平的重要方法。美国新兴管理学的开创者莫里斯L·库克(Morris L Cooker)说:“只有当我们学会了分类和编码,做好简化和标准化工作,才会出现任何真正的科学管理”。在信息化时代,信息的标准化工作越来越重要,没有标准化就没有信息化,信息分类编码标准是最重要的基础标准。

  信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类系统和排列顺序,以便管理和使用信息。

  信息编码是在信息分类的基础上,将信息对象(编码对象)赋于一定规律性的、易于计算机和人识别与处理的符号。具有分类编码意义的数据元素是最重要的一类数据元素。根据我们的研究和实践结果,将信息分类编码对象划分为A、B、C三种类型。

  A类编码对象
  在信息系统中不单设编码库表,编码表寓于主题数据库表之中的信息分类编码对象,称为A类编码对象。这类编码表的记录,一般随主题数据库表记录的增加而逐步扩充,很难一次完成。虽然不单设编码库表,但其编码表可以从数据库表中抽取出来作为一个虚表(是数据库表的一个投影)在信息系统中使用。这类编码对象一般在具体的应用系统中使用较多,如身份证号码(国家标准)、教职员编码、学生编码、设备编码等,都是A类编码。

页面功能 【打印】 【关闭】 【我有话说

MOOC风暴来袭

版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备15006448号-16,京网文[2017]10376-1180号

关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com