最新
推荐
2009教育信息存储大会(广州站... 11-06 关于召开CERNET第十六届学术年... 12-02
CERNET第十六届学术年会征文通知 10-16 “2009教育网络管理与应用大会... 08-20
|
12月1日消息,由教育部科技发展中心主办,《中国教育网络》杂志承办的“2009(第四届)教育信息存储大会暨数据管理与虚拟化应用研讨会(杭州站)”在浙江大学举行。2009教育信息存储大会(杭州站)分论坛之·“数字图书馆发展模式探讨”。
图为:浙江大学图书馆副馆长 黄晨 下面是浙江大学图书馆副馆长黄晨现场演讲实录。 黄晨:谢谢大家,谢谢主持人对我们的期望很高,我的压力也很大,其实我刚才看了一下根据日程表我已经没有时间了,我的进程以后结束了,但是按流程我们还得走下去,所以说我想把今天的我所准备的报告跟大家一起分享,就是“数据洪流困境与希望”,刚才各位老师讲的内容都比较详实,来自于第一线有很多具体的例子,那么我这个报告可能会比较宏观一些。 我想我首先今天的主题跟三个有关,首先就讲的我们所面临的一个现实问题,然后就是我们在这个现实当中所遇到的存储问题,然后以凯都项目为例,那么凯都是我们浙江大学牵头的一个图书馆计划,在这个计划当中所遇到的一些存储问题可以结合我前面讲的一些内容来进行一些回顾,跟大家做一个请教。 那么首先我们以一组数据为来开头快速的过一下,我们一直都说我们是在一个信息爆炸的时代,那么这个信息爆炸的时代究竟是怎么样一个时代呢?首先就是Google,Google每个月所发生的检索量是27亿次,那么我们每天所收发的短消息的数量是60亿,是这个星球的总人数,有3000本书每天出版。估计《纽约时代》一周所包含的信息量,是过去18世纪一个人一辈子所遭遇的信息量,那么今年,这个今年因为这个PPT是在2004年已经发表了,今年也就是2004年产生的独立信息有1.5乘以10的18次方的这样一个数据量,相当于过去5000年整个世界产生的数据量的总和。 所以我们这个时代的人是总不容易的,我们相当于活一年相当于过去活了5000年所遇到的东西,第三带光纤网有NEC和R卡这已经测试完毕,可以在1秒钟之内传输10个TB的数据,换算成数据量的话就相当于1900张CD,或者说是1.5亿电话同时通话,然后这个传输量是在未来每6个月提升3倍,而且是在持续未来20年都讲以这样的数据提升。 那么关键的一点是这些光纤在全世界有无数的我们称为黑光纤,也就是说它还没有被点亮,而这些黑光纤已经铺设到位,而刚才我们所讲到的数据量传输数据的提升只需要2端接入设备的升级就可以。也就是说数据量的提升不产生任何成本的提升。然后我们再来看另一组数据,著名的图片网站以及有40亿张以上的图片,优酷著名的视频网站每天访问量达到10亿次,非斯Book每天全世界3亿用户在上面耗时80亿分钟,还有今年最流行的微波它的第50亿条信息已经产生,我们可以看到整个信息世界它的速度发展是越来越快。我们以前是讲几百几千几万,现在动不动就是几亿几十亿就是这样一个,我们所面临的信息图景,所有的这一切是怎么样一个含义呢?这就是我们所面对的,以前就是网管员会面对一团糟的世界,而现在是我们每一个人,在座的每一个人你所面临的都是这样一个世界。以前我们讲信息匮乏,说这个事情我不知道,我没有听说过,我没有手段知道,但是我们现在讲的是现在泛滥,并不是说你不知道,只不过我根本就来不及过滤,在我眼前一闪而过,我就没有来得及接受,这个是我们面临的时代。 所以接下来我想讲一下在这些庞大的数据面前,我们所面临的问题存储的问题有两个,第一个就是海量的存储管理问题,海量的存储管理问题现在从厂商来讲的话我会告诉你,我们直接作为第一线的人会碰到第一个就是跨平台,像浙江大学图书馆有EMC的存储,有IBM的存储,有惠普的存储,所有的存储几乎都在浙江大学图书馆里面找到,但是这么多的存储它的跨平台管理如何来应对,第二个就是厂商指数虚拟化,虚拟化技术是厂商提出来的一个法宝,说我可以解决你的这个跨平台的问题,我在你这个上面做虚拟化,作为用户来讲我不用知道这是谁的产品,但是实际上如果是做存储管理的老师就会发现,这个其实对我们来说还是一个故事或者说还是一个远景,远远不能达到我们所需要的程度。 那么现在又提出了一个匀存储,也就是去年以来提出来的匀计算已经是非常的流行,那么匀存储是不是能够解决我们的问题,今天因为有很多的厂商在这里我不需要来介绍这些技术的细节,所以我想我们还是讲宏观的问题,对于这个厂商所提供的这些东西,实际上对于我们来说今后会有两种架构的选择,一个是TCA一个是LC,所谓的对成结构我们不用理解它是什么含义,看左边的那个表Plsclo可能没有听说过,亚马逊大家都知道,然后我们还看到了EMC、IBM、Nkpp这些公司,那么我们送这里面要抓一个点,就是亚马逊它提供的是一个非对成结构,那么它的典型代表就是匀存储,亚马逊是提供匀服务的,也就是说你可以把你的数据存放在亚马逊所给你的这样一个存储架构上面,你不用去管是谁来替你管理,你不用去管是哪一个厂商提供的产品,就亚马逊告诉你我给你5个G或者500个G都可以,你直接把产品放在那边去,它提供是一个非对称架构,它不需要你拥有硬件,不需要你拥有维护人员,它是一个服务。 |
版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备05078770,文网文[2008]228号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com