最新 | 专题 | 理论研究 | 信息技术 | 网络建设 | 应用案例 | 解决方案 | 企业解读 | 教育产品 | 教育网络 | 分析报告
  当前位置: EDU首页>教育信息化>信息化应用>应用俱乐部>软件应用
数字图书馆中图象信息的处理和存储
http://www.edu.cn 2006-11-08 15:28:00 作者:刘炜;赵亮

    前言

    目前国内“上网”的热潮方兴未艾,“上网”已不仅仅为获得信息,而进化为发布信息。各地的信息港计划在完成网络基础设施建设之后,也逐步把信息资源建设放到了首要位置。图书情报机构作为信息资源的大户自然不甘落后,纷纷组建自己的INTERNET站点,希望通过在网络空间中争得一席之地。信息资源的数字化,很重要的一个部分是图象信息的数字化,这不仅仅因为图象本来就占据着信息资源的很大部分,限于技术原因或保存的目的,目前许多文本型文献也要籍由图象来保存。书本带给我们的乐趣永远是数字无法替代的。

    相对于文字信息来讲,图象信息的处理和存储较为复杂多样,需要有起一套工作规范。目前由于“数字图书馆”的建设尚处在起步阶段,在图象信息资源数字化工作中,需要根据目前的设备和技术情况,摸索建立一套行之有效的工作流程和标准规范,以利于信息资源数字化后信息质量的统一和提高,以及今后各图书馆之间及各馆与其他单位的信息互交换,同时为今后随着技术的发展而发展留下一定的兼容和扩充余地。

    数字图书馆的图象信息有如下要求:

    尽最大可能保存原件的所有信息(数字化本身就损失了很多信息);
    需要“永久保存”(当然永久可能只是个相对概念);
    需要便于查阅;
    需要便于网络传输;
    在满足以上条件基础上需要占用最小空间。
    对于参加本课题的各成员图书馆来说,为保证成果能够共享并且具有最大限度的互操作性,必须制定一定的图象存储规范,以下讨论参照美国国会图书馆数字图书馆计划和IBM梵地冈数字图书馆的经验,参考目前在图象处理和存储的最新技术发展而成文。

    本文仅对平面图象的机读数据作出规定,不涉及矢量图形或动态图象,不考虑其物理存储介质。

    图象压缩与存储

    数字化的图象存储就是要尽可能多地将原始资料的图象信息保留至数字化载体中。由于图象数字化后数据量非常巨大,压缩技术一直就是图象存储的重要课题。图象压缩的原理是在保证一定的图象质量的前提下,以一种数学运算方法将图象的数据量降到最小。图象压缩分为无损压缩和有损压缩,顾名思义无损压缩就是不破坏原有图象信息或所有图象信息均可通过一定的算法恢复的压缩方法,而有损压缩则是在可接受的图象质量条件下对图象进行的一种不可复原的压缩方法。有损压缩比无损压缩有更高的压缩比,因而压缩后的图象数据量更小,因此多用于网络传输等对数据量要求较为严格的条件下。关于图象压缩存储的方法很多,也比较复杂,本文在此不多展开。

    图象的存储格式可以说是多种多样,涉及的标准也很多,为以下就一些常用格式作一些简单介绍。

    TIFF

    TIFF格式的图象允许存储相当多的位信息,最多每个象素点可存储到32bit,一般最常用的是24bit。最初设计TIFF的初衷就是要能够将扫描的图象在不同的平台上进行高质量的打印。所以TIFF格式比较适合作为高质量的保存原件的图象存储格式。TIFF格式允许RGB模式或者CMYK模式,因此TIFF图象在显示及打印两方面都能保持较高质量。TIFF还能以符合LZW算法的无损压缩格式存储,并且也能存储黑白两值或256级灰度的黑白图象。

    JPEG

    JPEG与下文提到的GIF是目前网络应用中最常见的两种图象格式。JPEG也是目前应用最广泛的压缩存储格式,其图象压缩的效率极高。JPEG还是一个很灵活的图象存储格式,允许以不同的质量要求来对原图进行不同倍率的压缩。JPEG采用的是一种有损压缩的算法,这在放大显示时很明显可以看出,对于高质量的打印其效果也会有差别。所以JPEG不适合作高质量保存原件的存储格式,但因其压缩效率极高,因此非常适合网络应用,通常情况下我们可以用JPEG对原图作15到20倍的压缩,仍能得到可以接受的视觉效果。

    GIF

    在WEB上GIF的应用恐怕比JPEG更多。GIF是一种非受损压缩图象存储格式(它支持LZW压缩),但是它每一位的图象元素只能存储到8bit信息,也就是说只能支持到256级灰度或256色阶。因为过去绝大多数的电脑显示器只能支持到256色,所以在当时来说,GIF的格式是非常经济实用的,因此它不是为了打印,而仅仅是用于显示的图象格式。同时GIF是一种功能非常丰富的图象存储格式,它支持隔行扫描显示,这在低分辨率显示器及低网络带宽情况下非常有用。其最新的GIF89格式还支持对图象部分作透明处理,并且有多帧显示、时序控制等简单动画功能。

    PHOTOCD

    由KODAK公司开发的一种包含多层图象的存储格式。它原本用于照片或胶片数字化后的存储,并且创立了PHOTO-CD这一新的存储介质。PHOTOCD采用的是一种视觉上无损的有损压缩图象格式,也就是说,它损失的图象信息是一般在视觉上难以分辨的。所以PHOTOCD的压缩倍率介于无损压缩与JPEG之类的有损压缩之间。

    PHOTOCD创造性的采用了多层图象格式,分别对应于不同的应用,有用于图片索引的,用于电视显示的,用于电脑显示的,用于HDTV显示的,甚至有用于印前处理的。大量的专业图象应用采用了PHOTOCD格式。

    建议标准

    根据对相关技术与标准的考察,并且考虑到我们目前国内各馆的应用水平与未来的扩展情况,本文提出一些建议性的图象处理标准。在选择图象处理标准时,本文根据如下原则:

    标准性

    标准性即是要求选用的图象标准或方法符合国际上的通行标准、事实标准或通行做法,以保证不会在国际交流中的产生困难,从而保证一定的互操作性。在目前的网络环境下,如果过于强调中国特色,闭门造车,拒绝国际通用标准,或硬要在国际标准中塞些自己的东西,是无法在网络社会中生存的。

    标准性有利于进行质量控制,因为一方面能够借此建立起统一的质量体系和衡量标准;另一方面通用的标准会有更多的软硬件支持,我们可以很容易地利用一些实用工具来帮助我们控制质量或改善品质。

    只有符合现有的通用标准,才具有较强的生命力。标准性提供了可扩充性,具有升级的能力,具备被向下兼容的权利。

    可操作性

    一是指所采用的标准规范及工作流程要符合工作人员实际的能力和技术水平,使一般工作人员经过短时间的培训就能够操作。信息资源的建设是一个劳动密集型的行业,虽然具有相当的知识要求,但大量的基础工作不能要求普通工作人员都具备应付复杂工作的能力,过于复杂的标准和处理过程也不利于品质的控制。

    二是指现有的硬件或软件能够满足标准或操作要求,或者仅通过有限合理的升级即能满足实际需求的。根据我们的经验,图象处理的精度要求一高,对图象处理的硬件要求就要提高很多,同时大幅度增加处理时间。因此,我们所定的处理标准一定要定在现有软硬件能够在合理的时间内进行处理的层次上。

    三是指必须考虑网络应用的现实情况。从目前的发展趋势看,数字化图象资源最首要的用途应是满足网络应用的需求。所以我们在考虑应用标准的时候,首要的出发点是一定要满足在网络上的应用需求。比如必须考虑在现有的网络环境下图象能否以合理的时间和速率在网上传输。图象处理一般来说都是属于海量数据内容的电子数据处理,信息量很大。数字化后的图象在目前的一般网络带宽上进行传输速度很慢,要达到实用程度有一定的困难。这就要求我们在制定标准的时候必须考虑到这一问题。同时在考虑选用存储标准的时候,也必须考虑其在网络上的通用性。

    前瞻性

    我们在制定图象处理标准时,所考虑的首要问题之一是所选用的标准及技术必须具有一定的生命力,不能选用已逐渐面临被淘汰的技术和标准。此外在考虑软硬件因素的时候,应适当的留有发展余地。如在网络带宽发展的情况下,就能合理的时间内传送更高质量的图象。同样对于电脑、显示器,其它硬拷贝等设备也要考虑到它们快速发展的可能性。在制定标准的情况下留有相当的发展空间。

    在采用通用标准的情况下,对目前尚未成为标准的先进技术或规范进行仔细研究和考察,综合其技术和生命力诸方面的因素,适当的采用一些合理的内容,以提高我们所建设的信息资源和开发的系统的生命力。

    综合上述原则,并且参照PHOTOCD分层的概念,我们建议将图象分成不同的层次以满足不同的应用需求。当然我们没有必要再搞一个类似PHOTOCD的将多层图象结合在一起的存储格式,只需订立一个用于应用及互换的标准即可。

    本文对图象处理提出如下建议标准:

页面功能 【字体:   】 【打印】 【关闭我对此感兴趣
相关链接
·数字图书馆的体系结构与元数据方案
·数字图书馆建设中知识产权保护问题刍议
·数字图书馆的数据库权利保护
·数字图书馆发展建设中的管理问题
·数字图书馆信息资源建设中知识产权问题
·数字图书馆建设中的法律问题
·论数字图书馆信息资源建设与著作权保护
·关于我国数字图书馆建设问题及对策的思考
·浅谈数字图书馆及数字图书馆建设的意义
·数字图书馆建设发展形势的企业图书馆
中国教育和科研计算机网版权与免责声明

①凡本网未注明稿件来源的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的 媒体、网站,在下载使用时必须注明"稿件来源:中国教育和科研计算机网",违者本网将依法 追究责任。

②本网注明稿件来源为其他媒体的文/图等稿件均为转载稿,本网转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者 在两周内速来电或来函联系。


要闻回顾
·第8届高交会开幕 CNGI-...
·浪潮高校论剑 尽显国产...
·湖北省将启动“高校数...
·国际教育信息化技术标...
·甘肃会宁远程教育覆盖...
·数字化颠覆图书馆传统...
·新时代学习方式 即时远...
·三星谈教育行业硬件采...
·北京交大建成国内首个I...
·如何保证现代远程教育...
 
—热门关键字—
 
ERP CRM 局域网 电子商务

 天网搜索 :
 
 站内搜索:
 


版权所有: 中国教育和科研计算机网 Copyright©1994- CERNIC CERNET  京ICP备020072  文网文[2008]228号
关于假冒中国教育网的声明 | 有任何问题与建议请联络: Webmaster@cernet.com