|
专家把脉数字资源建设
北京大学信息管理系教授赖茂生
杜绝重复建设
下一阶段的数字化的重点,特别是数字图书馆研究方面,不应放在文本信息上。数字化文本的开发和应用技术已经比较成熟,而目前我国几个大型的数字图书馆建设项目,包括中国科学院的科学数字图书馆工程、高校数字图书馆工程、国家图书馆的数字图书馆建设项目等的重点似乎都在文本信息上。文本信息产品服务水平是不是好,是不是到位?目前主要的是管理和服务方面的问题,而不是技术问题,甚至也不是资金问题。
今后,数字图书馆的核心技术在文本信息方面主要是查询智能化和海量信息的处理技术,而在这方面我们要充分注意到一些已经有的技术,数字图书馆建设项目不要在这方面重复投资。今后,我国数字图书馆研究和开发的重点应该放在非文本的数字化处理和管理上。我们有非常丰富的图像和音视频资料急需开发利用。
当然,从数字图书馆建设项目的投资方来说,一般是不会拿大钱去做探索性研究的。他们关注的是实在的应用,所以几个大的项目工程都侧重于实用。而从承担项目方来说,由于人员、团队和目标上都有一定局限,也难以把重点放在非文本信息方面,仅限于管理和提供普通文本、纸质资源等。这使得我们在非文本的技术开发上与国外的差距一直难以缩小。
数字图书馆工程建设上,国家在资金投入上存在一定的问题。资源共享应该从源头上进行规划。在现有的体制下,一旦以项目的形式投入,就很容易变成某一系统内独占的资源,要想把这些资源拿出来共享,是比较困难的。所以,应该由投资部门(主要是财政部门)先期规划好跨部门甚至是全国共享的资金投入方案,通过抓财政拨款这个源头来强制要求实现跨部门和全国的信息资源共享。目前的情况是,国家近几年在信息资源建设方面投入不少,每个系统或行业少则几千万,多则上亿甚至几亿元。但最终往往有许多由国家财政形成的公共资源却成为了行业或部门专有的,不能得到更合理的利用,而且容易造成重复建设。项目建设效果的评估工作也有较大的缺欠,应当组织中立的评估,完全由其他行业和系统的用户来评估,而且要实行双盲式的评审。现在博士学位论文和一些期刊审稿都采取盲审制了,而要花国家成百上千万元以上的项目,就毫无理由拒绝这样做。
打破条块分割
国内核心技术研发并没有什么值得认可的
中国的数字化是跟着国外在走,处于仿制状态。我们不讲应用的软件,在核心技术上,如元数据、格式、规范、XML、OPEN URL等等,基本上都是国外的技术。这是一个落后、追赶的状态,这个差距很难缩短。因为数字化是信息技术处理的大规模应用,整个信息处理都是国外领先的,而信息技术的发展又与国家科技、社会经济各方面的发展密切相关。所以在若干年内,中国只能是争取不至于加大差距,缩小差距是比较难的。
从政府角度对信息化不能说不重视,但社会信息化的大环境与国外相比还是远落后于国外。当然信息化建设也有浪费和重复建设的地方,但不是简单地加大投入,信息化水平就能提高的。
标准规范化应形成固定的机制
我一直认为在数字图书馆建设上应非常重视标准规范化建设,因为我国图书情报分成几大系统,目前条块分割并没有得到根本的改变,几大系统都在做自己的数字图书馆,如果我们不把标准规范的事做起来,数字化情况下的条块分割将导致各大系统更难相互联通。
标准规范化工作目前进展还是很好的,从国家数字图书馆的工程与CALIS都在采用这个标准规范,虽然未成为国家的标准,但是形成共识,共同进行,会起到一定的作用。
从政府角度,应该建立一个机制,形成一种不断地根据需要,制定、批准、推广、应用的机制,数字化过程的标准规范层出不穷,科研立项与具体应用有一定距离,如果没有一套促进标准规范的制定、批准、推广、应用的机制,将跟不上技术发展,很难实现真正的资源共享。
数字图书馆本质是需要资源共享的。标准规范是数字图书馆建设的一个重要条件,如果没有标准规范,各个系统之间的互操作、资源的互相利用上都会出现问题。而数字图书馆做不到资源共享,势必造成重复的投入。
协调与分工合作是关键
资源建设方式多种多样,有企业化方式,有项目方式,有市场方式,但不管采用什么方式,都应尽量地分工合作和协调。
比如,企业化市场方式,不同企业都在做电子书,但是有重复,重复的量也相当大,造成了资金、人力上的浪费。在CALIS系统内在尽量避免这个情况的发生,但系统之间由于各个资源提供商之间的不同利益,很难做到。
另外,原生数据越来越多,这涉及到如何采集、整理、保存的问题,这也可以看做是一种建设,但每天有大量的数据产生,需要有相应的方式。目前保存原生数据的方法有两类,一是市场化,由企业来做;另一是开放获取(Open Access)。大量的论文、科研成果分散在各种场合,需要进行系统化的收集、整理,国外有机构储存、学科储存两种方式推动“开放获取”工作,而国内目前还未启动,需要在政府指导推动下进行。
数字化转化是面向过去的,而原生数据储存则是面向未来的,需要全社会的分工合作,如果各个高校、科研系统、公共馆在本系统范围内进行收集、整理、规划、分工,那么这个数据就相对完整。
目前最需要关注的是分工合作,这是国家从理论上努力解决,但事实上并未解决的问题。国家有强有力的控制干预能力,但关键问题在条块分割,这是历史原因,从政府层面来说,也并未引起重视。
国家图书馆数字图书馆管理处总工程师孙卫
重视标准规范
从技术角度,如果要让每个图书馆都做技术开发,对中国来说是不现实的。另外,也不利于最大限度地发挥各个图书馆的作用。
与当前纯的数字图书馆的概念不同,我们目前正在做现代图书馆,是传统图书馆与数字图书馆共同构成的复合型数字图书馆。
我参加了有些单位标准规范化的相关会议,我认为没有一个是标准,都是explane,推广不起来。标准是别人看了你的手册就能做,如果必须采用你的模块才能做,那就不是标准。目前国内实践得相对多的是CALIS,但也有问题。如果不能准确地遵循国际标准,那么中国教育与国际接轨就成了一句空话。
国内有些厂商也宣称自己在做国际标准,比如CNML格式、DOL(数字对象描述)格式,但是他们都忽略了一点,不是写了标准,就能成为标准,标准是要公开开放的,让别的供应商来做各种后台应用系统,不是自己一揽子都包了,那根本不可能成为标准的。比如PDF格式,原先国内都说这不是国际标准,不予采用,各家做各家的标准,但2004年Adobe的PDF通过了ISO认证,成为国际标准,国内的厂商如果仍然坚持以往观念,前途堪忧。
制定标准规范,也要注重实施,这方面我们与CALIS比较一致。遵循国际标准的程度是什么?写在纸上的,可操作的模式却可能是五花八门的,所以,我们强调对国际标准的实现和测试。要符合国际标准,有三个条件,一是标准的制定,二是标准的技术实现,三是标准的测试平台。
做研究制定标准,不是要培养机构垄断。美国的软件多数是开源的,是由政府投资来完成的,但服务是收费的,在技术研发上进行重复性的投入是不明智的。
目前国内的这些数字厂商不能叫数字图书馆,只能称为资源供应商。阅读格式需要转为PDF,通过Z39.88协议,实现不同资源系统的兼容,这些都是国际标准,也是我们目前与数字厂商谈判需要转化和兼容的格式。这样,读者只需要在一个平台上就能调用各种资源。也能与国际接轨。
因此,数字图书馆建设上绝不能做井底之蛙,开放和协同合作的精神很重要。
|