最新
推荐
2009教育信息存储大会(北京站... 11-06 CERNET第十六届学术年会征文通知 10-16
“2009教育网络管理与应用大会... 08-20 聚焦应用创新 提升服务水平 09-04
|
中国教育网讯,11月24日消息,由教育部科技发展中心主办,《中国教育网络》杂志承办的“2009(第四届)教育信息存储大会暨数据管理与虚拟化应用研讨会(北京站)”今天在清华大学举行,中国教育网做现场报道。
图为:上海交通大学网络中心副主任 林新华 下面是上海交通大学网络中心副主任林新华教授演讲实录。 主持人:下面演讲的嘉宾是上海交通大学网络中心副主任林新华教授,他今天带来报告是上海交大高性能计算中心的变迁经验。大家欢迎! 林新华:谢谢各位老师、同学今天下午来这这里。我是来自上海交通大学网络计算中心,我们实验室一直做高性能计算相关东西,照片也是我们目前有的一个机房。我今天讲的题目是上海交通大学高性能计算中心的变迁,因为我在这个学校待七八年,差不多高性能计算中心从开始到现在,我作为见证人、现在方向人我有一些想法心得。在座老师可能是网络中心老师,现在因为各个高校学科的需要,是不是建一个高性能计算中心,是不是放在网络中心做,什么时候做合适?怎么做?是不是跟应用学科相结合?这些问题我想跟大家分享一下。 对于我们学校来讲,基本可以用八个字概括变迁两个字,就是合久必分,分久必合。合久必分是过去,我不知道什么时候能合起来做一个比较大的东西。这句话哲学基础就是《易经》里讲“无往而不复”。这句话用到计算机发展的话,也可以看到以前是大型机、巨型机会,后面一句话是IBM讲的,说这个世界只需要5台计算机。这句话在PC时代变成笑柄。到了网络时代、接下来做云计算时代我们的确需要五台计算机。我想高性能计算属于计算机里边也是IT必然遵循的规律,我相信这句话引证我们过去,也指导我们现在的发展,但是我相信这句话预测将来做的事情。 这个是我2002年拍的照片,我的导师陆查达教授89年从德国回来,从那个时候一直我们交大做高性能计算事,当时我们实验室是我们学校唯一有能力做的。这个东西很贵,90年代的时候一台机器要十万块钱,有一些做非常好的用户到现在都有联系。当时在我们高校里边,我们合在一起是SUN在做这样事情,这样状况一直持续2002年,2002年我们卖了一台SGInyx3800,当时售价四百来万。接近着下一年2003年接着马上买一台IBMP690,这台机器开机要30分钟,是一台体积非常大的机器,也是花四百多万,基于这台机器把以前高性能计算实验室组合,变成现在的网格计算中心。 我们一开始都是一个,到2002、2003年开始虽然是合着,但是一个变成两个。那个时候我们考虑一个问题,为什么?用户这边需求变大了,用户随着研究水平提高、本身需求对计算需求逐渐变大,还有一个比较重要的就是成本变小,以前做高性能计算从90年代到2000的时候,做高性能计算只能买大机器。用户希望有更多的控制,你怎么用?你操作系统没有权限,在后面做的非常好,但是用户心理感觉、技术感觉没有控制感,这种心态是真实的,这种心态直接导致后面有钱我们学校一下买很多。为什么时间点选择2003年,网格计算兴起从02年开始,高校有很多钱投到这上边,所以久字合到一定程度肯定分的。 从2005年开始成本下来了,从技术、随处可以拿到产品、软件方面非常成熟,这是我们2005年DIY集群。这个地方是我们交大网格图,航空航天大学主要针对国家大飞机战略新成立的学院、还有一个学院核工程学院是交大非常老牌的学院、还有一个材料学,剩下我没写的微电子、机械、生物、制药、环境我们一共有12台,实际去年08年的时候,我们总价报价60—100万机器,一到六月份一共买了八台,当时主管副校长开一个圆桌会议,这个是不是重复投资,对学校来讲最怕事情就是这样。 我们以前材料学院买五个显微镜很贵放在那里,一下买八个,是不是有必要。后来会议讨论下来,每个应用单位老师坚持需要的。通过我后边走访,2008年我们一下买了八台。介绍三个比较典型的。 一个航空航天大学,跟同一类是药物,这是他们机房样子,大概十来平方,他们是放在四楼上边,这个机房望出去风景非常好,是交大最好的高层机房,他们机器差不多自己DIY,这是这台机器用法很奇怪,他们把它当做16个PC,每一个节点算一个东西,因为他们优化的时候,要算不同的功耗,属于定型度不是太高,而且这台机器用的windows系统,他们算程序的时候很多在windows上边CE东西,他们没有用立式孔体,布线非常乱。他们刚刚开始做这一块。 这一块核工程学院,项目来源比较特殊,保密性质可能采用国内,最后选择曙光。他们把机器三个屏幕模拟核反应堆状况,下面是UPS,从机房建设来讲这套装非常专业,它有三套网络,蓝色的线跟外边连接的IP。机房也做的非常专业,实际用的时候,机房设计没有考虑可扩窄性,进去机房那块板子拉开起来,没有其他多余电源只能从下面走。 材料学院是我们交大非常强势的传统学科,他们楼群根据他们教授讲,号称亚洲第一材料学院建筑群,占地面积非常大的。他们机房规模也就比我们小一点。他们买一套惠普,他们在上面算分子动力学科,也有UPS这样东西。这个机房我去了之后觉得非常惊讶,他的机房比较小,但是设计非常科学,上面有通风管道,热量排放经过专门计算,还有网络交换机、放了一个鱼缸在里边。 这是我们现在的网格计算中心,其实我们房间分两间,外面一间房用来做管理,里边房间放机器的。我们现在主力机型一共四台。这四台机器堆在下边,下边全用钢板顶起来,虽然我们机房建在一楼,每个机架只有一个支点,压力非常大,即便地板不顶起来放时间会很长一定陷进去。 我们前两天和中科委合作,把机器完全拆开,搬了一下大概60公里,因为电梯最大载重1吨,最好把拆下来,拆花了一天,装花的四天,所以这个工作我们基本在上个星期完成。靠左边那台是IBM12350,这一台是我们自己DIY,是微软做高性能计算专用的操作系统。这台机器去年买的,是三个计算机节点、加上储存节点。这台机器特殊之处我们有光线,和外边设备相连接。我们这个机房特别考虑消防问题因为在这样环境里边,发电量非常大,而且我们空调有的时候会有问题,有可能发生火灾,而对机房消防来讲连泡沫都没有,原来都是喷水,我们当时用两个大柜子。 我们现在用的方式就是聚集在一起,既然有这么多,还有一个办法就是再分。我们那台机器为什么上面连光线,航天航空学院物理风洞,这是他们一个桶、这是他们控制室,每做一次实验产生巨大的数据,而我们其实把数据通过我们光线连到我们机器上边,他们航空学院除了风洞至于,还有两台价值800万虚拟设备,其实我们和他们之间距离1.3公里左右,有些数字风洞和物理风洞融合了,这件事情操作我们跟他们关系比较好,最后效果非常好。 还有一个上海和其他地方比较特殊,上海一一个超算,我们可不可以拉光纤,现在我们用光纤直连,达到1KB,非常迅速。用户感觉到有一个大的机器可以用。还有一种方式,有一个东西叫GPU,你可以看到金融达到149个价值比,我现在和材料学院老师就这个事情沟通,你可以把很多数据放到GPU上边。 最后我想总结一下,我们交大现在处于一个第二个阶段,分久必合的状态。我坚信未来一定合起来,但是那个时机把握在哪里?交大和南大完全是两种不同风格的学校,交大只有工科非常强势,科学计算都是非常大的,工程计算最常用就是4—32个,一台超能计算机。交大做工程相对比较有钱,我有经费自己买一个要的,高性能计算其实就是贵族游戏,我就是赛马,赛马选手不需要自己养马,只需要跑马。赛马不想养马,不是因为马麻烦而是马非常贵,现在马便宜了是不是买,这个时候你跟他讲不要买了,基本听不进去,因为管理事情很烦的事情,只有自己三年到五年管我一圈才发现,自己根本没有精力管超性能计算机。 对于交大来讲,我们钱准备好了,机房也准备好了,我们外部环境都满足了,但是我们现在马上建一个大的,现在是不是合起来最好的时机,他们自己算算就足够,大型的集群管理用户用的像自己方便,还是很难。像航空航天学院就是拆分,他只需要这个。如果你利用率很低,积极要求去买,做应用老师跟我们讲好像这个机器不灵,这个机器摆在你手里就是烫手的山芋。所以在什么时候合适时机选择这个东西,是非常重要的。所以什么时候久? 我这文章是今年五月份,当时在杂志上刊出来了。其实我们在高校里边管机器,通常有几个误区。重机器、轻软件、湖绿人。重科研、轻教学、忽略服务。要把这个做好放在网络中心非常好,但是科研怎么兼顾起来,变成另一个。小中心和大中心之间的关系,大中心和学校之间的关系。这几年我对我们交大建立高性能计算中心的感受。最后谢谢大家! |
版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备05078770,文网文[2008]228号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com