试想一下在几十个不同检索平台上、数百个数据库中找你所需要的信息,这就好比要在排架各不相同的数百个阅览室里找几本书,不要说是读者,就是专业图书馆员也难以应对这样一项工作。网络化数字资源的出现,给我们获取文献资源几乎提供了无穷无尽的能力,但现在面临的则是上面提到的海量数字信息资源组织和服务的无序状态。怎样把这些无序的一个个相对独立的数字资源库整合成整体有序的数字文献资源体系?往深一步说,怎样整合和规范化各种各样的数字式服务成为数字图书馆建设首先要面对的难题。
模型确立:搭建互联互通的环境
数字图书馆建设这几年的混乱局面是任何事物发展中必然会出现的问题。网络刚刚出现时,各种网络技术并存难以实现互通互联,直到TCP/IP被广泛接受,靠一系列技术规范使得其异构网络能对接,才有今天发达的Internet。因此,数字图书馆刚刚开始发展,各个环节都是在发展与研究之中,可以说,目前绝大部分的关键技术都已经解决。对CALIS项目而言,重要的是如何选用一套特定的技术规范,使得能搭建一套实现高校资源共享的体系。
技术规范的选择制定离不开特定的应用模型。网络有七层结构模型,在这个模型的基础上规定不同层上的技术标准和规范,才能保证节点间的互联互通,保证数据的准确传递,才有了目前的互联网。数字图书馆也是要解决同样的问题——首先要确立应用模型的问题,再根据模型的需求搭建适当的应用环境。处于模型不同环节的各个应用软件,有的负责信息检索,有的完成资源发布,有的提供认证和链接调度的功能,只有它们高效可靠地协同工作,才能构成真正意义的数字图书馆体系。这就需要一系列的标准规范来约束各个应用系统,以保证系统间互联互通和有效的数据交换。
在CALIS“十五”项目开始之前,已有一些厂商开发了很多数字图书馆相关的应用软件,五花八门,缺乏标准的数据规范、服务规范、接口规范等,各不相容。如果盲目地选择这些软件进行数字图书馆建设,很快就会造成互联互通上的一系列问题,给建立分布式的CADLIS、给CALIS的后续建设都带来极大的困难,甚至关乎“十五”建设的成败。为了解决这些问题,保护数字图书馆建设者的投资,建立可持续发展的CADLIS体系、模型及相关的标准规范建设成为CALIS“十五”建设的重点任务之一。
2002年科技部科技基础条件平台工作重大项目《数字图书馆标准与规范建设》的启动,为高校数字图书馆建设的规范化提供了基础。2004年11月,CALIS制定了《中国高等教育数字图书馆技术与标准规范》,虽然在这套标准规范还有许多需要完善的地方,但是为CADLIS建设和各高校数字图书馆建设在服务规范、技术规范、数据规范以及管理规范等方面提供了依据。CALIS在自身项目建设中强制执行该套标准,并要求为CALIS项目提供应用软件的厂商遵循这套标准,由CALIS技术中心进行认证。通过用户和开发者两个层面落实该标准规范,来保证CALIS各子项目建设成果的互联互通,为后续发展奠定了基础。
标准推广:结束有树无林的状态
尽管目前这一标准规范在某些环节上还不成熟,需要根据国内外的发展进一步修订,但仍然是CALIS建设的一个非常重要的环节,它在一定程度上结束了高校数字图书馆建设有树无林的状态。若统一在这个标准规范下,即使将来系统升级,也便于利用国家集中投资统一升级,不仅总体成本相对于无序状态的升级要低得多,更为各个高校的建设节省了大量经费。目前CALIS的成员馆有700多家,如何将标准规范推行贯彻下去,也是一个非常关键的工作。
当下的做法是,凡参加CADLIS项目的成员馆强制执行该标准;没有参加CADLIS项目的成员馆,建议他们采用;同时CALIS管理中心与各地区中心联合开展培训推广,宣传CALIS的标准化思想。另一方面,通过要求给高校图书馆提供应用软件的厂商遵循该标准规范,从软件源头上解决,以共赢互利的方式推动厂商的参与。目前这个做法得到了清华同方、拓尔思、方正电子、中数、义华等9家公司的支持。CALIS为这些公司培训技术人员、提供测试样例、进行功能和接口标准认证等。一些省、直辖市的文献保障体系建设也直接采用了CALIS提供的这套标准规范。
标准进行的障碍
标准化意识的欠缺是标准规范推广的最大障碍。这种危害是隐性的,往往不被大多数人所认识。例如,现代图书馆建筑,对馆舍如何合理布置,各业务部门工作环境的安排,在国际上都有了一套较为成熟的观点。但目前很多新的图书馆建设仍然没有很好考虑这个问题,这给图书馆的空间利用、工作人员结构和服务的便利性等都带来很大的障碍。可一旦落成就很难改造。数字图书馆建设存在类似的问题,若没有标准化的意识,无论是后期的维护成本和长远的发展,或是从系统的扩展和服务能力上都会存在问题,未来将不得不再花钱改造。需要大量的宣传培训工作。
另外,尽管一些商家也认识到标准规范的重要性,但为了保护既有的利益,保护以往的投资在市场上取得回报,会抵制标准规范的快速推广。而CALIS为项目制定的规范,离开了项目建设,不具有法规的强制性。因此,对这些厂商,要制定利益的平衡策略。一旦商家研发了合乎标准的产品,CALIS就予以推荐,组织集团采购,以平衡商家的利益。
还有一点,CALIS建设是工程项目,有很强的时间限制。标准规范的制定和推广需要较长的时间,这存在长期利益和短期目标间的平衡问题。项目建设的紧迫性和投入的经济性,也在一定程度上影响了标准规范的充分推广应用。
“标准”外的开放合作机制
数字图书馆建设是一项庞大的系统工程,CALIS制定的标准规范只解决了数据和应用层面上的问题。实际上,正如只有书,没有好的馆舍,也不能提供良好的服务一样,数字图书馆没有一套良好的服务器、存储设备、网络设备以及中间件等一系列的软硬件系统平台,是难以发挥其作用的。目前硬件技术和中间件技术发展很快,任何图书馆都不大可能及时全面掌握这些发展。因此,数字图书馆建设中怎么得到各系统平台厂商的支持,选用适当的高性价比的设备和系统软件,也是一项不容忽视的问题。CALIS在CADLIS建设中以开放的形式与专业软硬件提供商展开充分的合作,从中寻找高性价比、可靠的技术平台,以保证数字图书馆建设的成功。
2004年11月,CALIS管理中心与中科红旗软件技术有限公司一起,联合Intel、IBM以及Oracle公司,成立了“中国高等教育数字图书馆Linux联合实验室”,旨在提供基于“PC服务器(IA架构)+Linux操作系统”平台的数字图书馆解决方案。
很多成员馆对这一方案心存疑虑,因为从物理的角度,这并不是一个高端的配置,数字资源能否顺畅地在网络上运行?这不能不让人担忧。由于目前各高校图书馆的规模、服务对象与模式以及建设经费来源和数量不尽相同,其数字图书馆解决方案应根据实际情况来选择,以便在有限的经费内完成既定目标,因此,CALIS对这一方案的推行进行了反复的测试和检验。
采用PC服务器的原因在于以下两点。一是高校面对的用户群,最多也在十万以内,这对服务器的性能要求并不高,而目前PC服务器的运算能力不亚于小型机。小型机的操作系统都是各个厂商专用的系统,维护成本相对较高。而且小型机的配件也是非标准的,国内代理商提供的备件库并不理想。为保证可靠运行,学校往往购买双机,成本又提高了。二是PC服务器维护和管理相对便利,易于上手,横向扩展的成本也相对较低。
之所以选用Linux操作系统,一是Linux在运行稳定性和网络上受攻击程度比Windows好;二是Windows尽管上手容易,但日常维护工作量越来越大;三是在Windows平台上一般性开发的程序运行效率相对较低,高性能开发的成本则非常高。
在这一实验室中,中科红旗软件技术公司、Intel、IBM、Oracle等公司免费提供实验室所需的系统软件和硬件服务器,并配备相关的软硬件工程师队伍提供技术支持,帮助对该平台上软件的优化测试。这种形式的合作对CALIS提供了巨大的帮助,例如,我们可以通过这种模式获得Intel公司的技术支持,帮助我们在基于Intel芯片组的服务器上进行性能测试,优化软件,以获得更高性能更稳定的性能。
由于CALIS的应用软件产品大部分是基于Java技术的,绝大部分可直接运行在实验室平台上,所以已在实验室平台上进行联合目录系统、馆际互借与文献传递系统以及资源调度系统的测试与移植。在中科红旗软件技术公司的协助下,已完成CALIS联合目录系统的Linux测试,其他系统还在测试和移植中。该Linux联合实验室的建立,标志着CALIS与这些著名的系统厂商从一般性的技术交流进入了深层次的技术合作,为CALIS“十五”建设提供了极大的帮助和技术保障。