根据在 《中国国家试验型数字式图书馆》会议对元数据方案所作出的结论,本数字图书馆项目最小元数据集合采用Dublin Core;最小元数据集合Dubli
n Core的实现采用RDF方式;元数据分成两层,第一层为DC,第二层为MARC或TEI Header,在资源建设中要求按这两层实现。技术组必须据此提出项目所需采用的规范的元数据元素集及其定义、元数据元素的限定规则、以及元数据元素的具体表达方式。
会后提出对各成员馆进行一次调研,对各馆计划进行数字化的资源内容、方式、目前的状态、应用目的等进行摸底,在5月底以前上海馆仅收到辽宁馆一份,本《实施意见》据辽宁馆和上海馆本馆的资源情况,设想了一般情况,鉴于具体资源情况对元数据方案的实施无重大影响,本方案据此成文。
DC元数据方案是一个非常灵活且及具扩充性的方案,然而对于各馆合作的同一个项目,原则上应该制订一些统一规则,例如元数据元素的增删取舍以及限定方式等,当然也可以由各馆自定,这样会在一定程度上影响到互操作性。制订统一规则的难点是必须经过各馆统一一致的详细讨论,这是一项耗时费力的工作,必须由项目组负责协调组织。
首先必须说明的是,根据项目技术组的结论:
DC只是提供互交换性的中间层,虽然是必需的,但不一定要物理存在,物理层为第二层即MARC或TEI Header,通过自动转换动态获得,或重新抽取均可;
元数据的表达只有在HTML4.0及XML中才能采用RDF方式实现,鉴于目前HTML3.2普遍采用,本项目完成时前者也不一定能完全取代后者,据此本实施意见仍旧考虑了在HTML3.2中利用“META”方式表达元数据元素的方法;
本文涉及许多规则,如DC、RDF等,至今仍然是草案,尚处在不断的变动中,未承诺任何版本兼容性,是否能够得到广泛支持尚不得而知;
本文作为本项目工作小组的研究报告,根据以上会议精神,将对项目元数据方案进行进一步的描述和限定,为便于实际实施,特进行实例描述;
目录
一、DC元素定义及其限定
二、RDF框架及其含义
三、实施实例及说明
DC在HTML2.0/3.2中的应用
DC在HTML4.0中的应用
DC的扩展应用
RDF与DC的应用
四、实施建议
一、DC元素定义及其限定
关于DC的历史影响、结构框架以及为何选用DC作为最小元数据集合的原因本文不再赘述,请参见文末所附的参考资料:
下文给出DC十五个元素的中文基本定义,原文定义请参见其主页:
http://purl.org/metadata/dublin_ core 。
DC元素基本描述
以下是对DC元数据元素集的参考定义, 关于进一步的描述或任何已经定义的限定,请见下列地址: http://purl.org/metadata/dublin_core 。
在以下的描述中,为便于进行语义上的理解,每个元素都有一个描述性的名称, 同时为便于在一定的编码体系中使用,每个元素都有一个正式的标签(Label)。
尽管HTML之类的环境并不区分大小写,我们还是建议在实际使用中按照下文所定义的标签大小写来进行书写, 以免在转换或移植到其它环境时发生冲突或歧义,如在XML中。(参见 http://www.w3.org/TR/PR-xml )
每个元素都是可选及可重复的,并且排列顺序也可以是任意的。
为促进最广泛的互操作性,许多元素的描述建议采用控制词表来分别规范各个元素的内容,这也即是说,可专门构造一些控制词表应用于特殊领域, 以增强这一领域的互操作性。
元数据元素的含义不因其是否嵌入所描述的资源而受到影响。
元数据元素依据其所描述内容的类别和范围可分为三组:1.对资源内 容的描述;2.对知识产权的描述;3.对外部属性的描述(instantiation)。
资源内容描述类
知识产权描述类
外部属性描述类
Title
Creator
Date
Subject
Publisher
Type
Description
Contributor
Format
Source
Rights
Identifier
Language
Relation
Coverage
元素描述:
1.题名 Title
标签: "Title"
由资源创建者或出版者给定的资源名称
2.作者或创建者Author or Creator
标签: "Creator"
对创造资源知识内容付主要责任的个人或机构.
例如:书写文献的作者,视觉作品的艺术家、摄影师、或插图画家等。
3.主题及关键词Subject and Keywords
标签:"Subject"
资源的主题。通常是描述资源主题或内容的关键词或词组短语。建议采用受控词表和规范的分类体系。
4.描述Description
标签: "Description"
资源内容的文本描述,包括文献类对象的文摘或视觉作品的内容描述等。
5.出版者Publisher
标签 "Publisher"
负责使资源成为当前形态的责任者,例如出版社、大学的系科、或者公司实体等。
6.其它责任者Other Contributors
标签 “CONTRIBUTORS”
指并没在Creator元素中列出的对资源的知识内容具有重要贡献的个人或组织,其贡献次于创建者(如编辑、誊写员、插图作者)。
7.日期Date
标签 "Date"
指与创建或使资源成为可利用状态相关的日期。注意与Coverage元素中代表资源作为知识 内容所覆盖的时间属性相区别。推荐最好采用ISO8601(参见W3C技术 规范http://www.w3.org/TR/NOTE-datetime“日期及时间格式”)所规定的YYYY和YYYY-MM-DD表达方式, 例如 日期1994-11-05 即表示1994年11月5日。