计算机技术、网络通讯技术的迅猛发展为图书馆迎来了一次数字化革命,数字图书馆迅速成为中外图书馆界乃至社会各界关注和研究的热点问题。美国因是数字图书馆研究起步最早、进展最快、成果最多的国家而备受世人瞩目。本文主要就中美数字图书馆研究的异同做一比较和评述。
1 关于“数字图书馆”概念的研究
对“数字图书馆”的认识,中美都经历了一个发展的过程。“数字图书馆”概念的提出最早源起于20世纪80年代末、90年代初的西方发达国家,称为Digital Library。以Internet为背景,并随着美国数字图书馆创始工程DLI的提出于1993年得到确认并迅速风靡世界。
1.1 “数字图书馆”提出的背景
“计算机技术与图书馆的结合”的设想其实早在计算机诞生初期,人们就在设想将传统图书馆改造成计算机化的“图书馆”。在不同时期人类给自己的设想赋予了许多名字,如“未来图书馆”、“无纸图书馆”、“电子图书馆”、“虚拟图书馆”、“数字化图书馆”等。“数字图书馆”是人类近50年来对图书馆的美好设想,在计算机和网络通讯技术依托下的发展定位。
由于Internet的开通,网上信息资源日益膨胀、堆积,网络用户一方面为资源的丰富而惊喜,另一方面又为检索的不便而抱怨。这其中除了技术原因外,就是网上信息资源缺乏有效的组织和管理,无序信息泛滥,严重影响了用户利用信息资源的效率。显然,传统信息资源的组织和管理方法已不能适应网络信息资源管理的要求,迫切需要一种全新的组织管理信息资源的新模式。因特网是全球信息服务网络,上网的信息资源应按这种模式组织管理,于是“数字图书馆”应运而生,也即在这种背景下提出“数字图书馆”。数字图书馆就是21世纪初下一代Internet上信息资源管理模式。
1.2 对“数字图书馆”概念的认识过程
“数字图书馆”概念的提出,就像其它科学技术引入图书馆领域一样,最初也经历了一个盲目阶段。至今中外对数字图书馆还没有一个明确、完整的定义,即使是身处数字图书馆研究前沿的美国,数字图书馆的定义也是随着数字图书馆研究和建设的深入而对其不断完善的。
90年代初,美国国家科学基金会(NSF)、美国国防部研究项目机构(DARPA)、国家航空与太空总署(NASA)在分别拨款给一些计算机与通讯技术方面的基础研究项目时,他们就认为数字图书馆是一个发展前景广阔、潜力巨大的新领域。但研究哪些课题项目当时并不是很清晰。经过一些非正式小组的不懈努力,屡次就项目所达到的目标和其他可替代的研究课题技术问题召开专题讨论会,并最终形成报告将数字图书馆研究创始工程的方向和内容定位于“极大提高通过网络收集、存储、组织和获取以数字形式存在的信息”上。1993年9月美国数字图书馆创始工程DLI正式公布,向全美公开招标征求项目和参与者。起初按照基础研究创始工程设计,中标项目属高风险研究,主要用于试验和演示新技术。1994年9月DLI启动后,才发现许多问题没有考虑进来,这是一个牵涉面广、复杂的项目。联邦部门很快意识到并出资赞助召开各种专题讨论会,正是这些座谈会使数字图书馆的
定义逐渐得到补充和完善。
美国数字图书馆创始工程一期工程(DLI-1,1994.9-1998.8),对数字图书馆的定义侧重于数字图书馆技术,更多强调技术和具体作用。美国官方和研究机构当时对数字图书馆的认识在1995年召开的联邦信息基础结构与应用项目(IITA)数字图书馆专题研讨会上有所体现。会上提出:“数字图书馆是向用户群体提供便于查找利用庞大的、经过组织的信息和知识存储库的手段的系统。这个信息组织的特点是没有预知的关于信息使用的详情。用户进入这个存储库,重新组织和使用之。这种能力由于数字技术的能力而大大增强。”这种看法后来又有了扩充和完善。1997年3月由NSF赞助召开了关于“分散式知识工作环境”专题讨论会[http://www.si.umich.edu/SantaFe/],会议报告将数字图书馆界定为“并不仅仅是一个有着信息管理工具的数字收藏的等价词。数字图书馆更是一个环境,它将收藏、服务和人带到一起以支持数据、信息乃至知识的全部流程,包括从创造、传播、使用到保存的全过程。”美国数字图书馆概念的提出,实际上经历了如下三个阶段:
(1)数字化资源库的开发阶段。该阶段考察的重点是图书馆文献资源、科技成果的数字化转换(字符编码文本、电子化的位图映像等)、存贮、标引与检索、显示和输出等方面的问题。
(2)数字图书馆技术研究阶段。该阶段的研究重点是数字化图书馆的信息存取、服务提供技术的解决方案。主要包括:数字图书馆数据对象的内存结构、命名规定;用户界面与人机交互;数字化素材的组织及标识;数字网络传输技术和协议制定等研究内容。配合这一阶段目标的实现,实施了“计算机科学技术报告计划”(CRTR PROJECT)。该研究计划由美国国防部高级计划局(ARPA)资助,经两年时间研究于1995年初制定数字图书馆结构框架。对其中提出的数字图书馆基本结构块的命名、标识、组合、数字对象库存、标识系统、智能检索、人机交互界面等多项技术方案基本达成共识。并通过美国数字图书馆研究中心(CENTER FOR THE STUDY OF DIGITAL LIBRARY)的研究项目,对空间超文本系统、人机交互技术、超媒体操作系统(HOSS)服务以及SGML、VRML技术进行了研发,并取得良好进展。
(3)数字化图书馆的综合研究阶段。以美国数字图书馆启动计划(DLI)为标志,昭示着数字图书馆的研究已进入综合研究的时期。DLI-1重点集中在技术力量强的6大项目上,主要是计算机和信息科学。DLI-2放在技术研究课题上的注意力缩小,但学科范围有所扩大。强调以人为中心,涉及数字图书馆的经济、社会、法律和政策框架,制定信息共享格式与国际标准,数字图书馆网站的可靠性和稳定性,经济因素和商品化等研究内容。
如果说美国是从技术角度来界定数字图书馆,那么我国对数字图书馆的认识,则是从信息资源数字化开始的。认为“数字图书馆是传统图书馆的扩展”,“数字图书馆是用数字技术收集、存储和组织信息,并通过计算机网络查询和检索信息的一种现代化的信息系统”,“数字图书馆是一个数字化的信息系统,它将分散于不同载体、不同地理位置的信息资源以数字化方式贮存,网络化方式相互联接,提供即时利用,实现资源共享”。北京图书馆孙承鉴认为“数字图书馆是被下一代超高速Internet选定的管理信息资源的模式。”“数字图书馆实际上是一个数字信息资源库的概念,这个库有声音、有文字、有图像……。”其特点是:(1)是个多媒体的数字信息资源库;(2)这个库存是分布的,通过计算机网络可以跨库查询。它是一个图书馆群体的概念,是由一个地域或一个国家的众多图书馆或信息资源单位组成的联合体;(3)信息组织必须按格式标准,即数据库中的信息资源是有序的,按统一标准来组织;(4)在网上运行,且用宽带高速网实现;(5)以大量高新技术为依托,比如数据库技术、数据挖掘技术、数据推进技术,是多种高新技术的集成;(6)为读者提供方便、快捷、全面的服务。实现数字图书馆后,网上查询不必一个站点一个站点地查询,对读者而言,只要提供某个检索点,计算机就会提供所需分布在网上各馆的相关资料。
在对数字图书馆的认识上,中美存在差异,其原因是:(1)数字图书馆研究起步条件不同。美国在数字图书馆启动工程启动前,已基本完成信息资源的数字化存储,信息基础设施完善。我国数字图书馆研究起步晚,特别是1996年IFLA第62届大会后,电子图书馆在我国才引起普遍重视。面对蓬勃发展的计算机和网络通讯技术,要建设数字图书馆,人们首先想到如何将信息资源数字化,完成数字图书馆的初级工作。因此,对数字图书馆的描述难免有不同侧重。(2)对数字图书馆的理解有简单化思维倾向。在我国有相当一部分图书馆工作者将“图书馆数字化”与“数字图书馆”混为一谈,简单地认为图书馆资源数字化了,上网了,就是数字图书馆了。这是我们对数字图书馆认识上的一个误区。数字图书馆是一项涉及社会许多领域的整体性工程,不是由哪一个部门能够独立完成的。馆藏资源的数字化仅仅是数字图书馆工程的一个基础环节而已,况且对图书馆来说,也不是要把所有馆藏都数字化。数字图书馆是一个群体概念,不是哪一个图书馆的代名词。
美国已于1998年8月完成了数字图书馆创始工程的一期工程,已经启动二期工程。对他们来说,处理的问题不再是数据资源数字化、音频视频信息的转换、存贮和检索以及多媒体信息技术扩展深化中的难题。一期研究成果部分已上网应用,对数字图书馆的认识也随着研究的推进而明晰。中美对数字图书馆概念的理解都经历了一个认识的过程,这个过程还在不断完善中延续。数字图书馆的内涵会随着数字图书馆的研究而动态变化。我们没有必要非把数字图书馆定位于某个框架上,非要争论出一个被大家都接受的定义来。适当的讨论是必要的,因为它有助于我们确定数字图书馆整体框架、技术内容和范围等。但对读者来说,实用的数字图书馆才是大家企盼的最终产品。