中国教育和科研计算机网
EDU首页 |  中国教育 |   教育资源 |   科研发展 |   教育信息化 |   教育在线 |   CERNET  |   校园之窗
教育信息化

资讯 | 专题 会议 解读 专栏 访谈 项目 数据 招标 企业 产品 CIO 技术 校园信息化 教育装备 下一代互联网

中国教育网 > 教育信息化 技术论坛入口    用户名
密 码 搜 索 
您现在的位置: EDU首页 > 教育信息化 > 解  读
陈世卿:以自主创新信息网格云端计算技术建设全民教育信息化
http://www.edu.cn   2009-11-24 中国教育和科研计算机网 作者:

字体选择:【大】 【中】 【小】

      中国教育网讯,11月24日消息,由教育部科技发展中心主办,《中国教育网络》杂志承办的“2009(第四届)教育信息存储大会(北京站)”今天在清华大学举行。中国教育网做现场报道。

图为:美国工程院和艺术与科学院两院院士 陈世卿

  下面是美国工程院和艺术与科学院两院院士陈世卿演讲实录:

  主持人:首先介绍第一位嘉宾,他是中国超计算机网格发明人陈世卿,是美国工程院和艺术与科学院两院的院士,纽约时报称他超级计算机领域最耀眼的新星,20世纪80年代他研发世界最快的计算机,并成为该项设计理念最早开发者和专利权拥有者,2005年起陈院士在中国大陆做农村信息化工作,在农村和少数民族建立区域全民健康保障信息服务平台,2007年陈院士又开发世界前沿的网格超计算机系统,并建立中国自主创新信息网格信息共享平台。下面我们以热烈掌声有请陈博士,他今天演讲题目是“以中国自主创新的信息超级网络云端计算技术建设中国全民教育信息化的理念实践与展望”。有请!

  陈世卿:今天很高兴跟各位嘉宾、各位教授分享一下我四十年在美国开发的经验和应用的经验,回国快六年了,我把全世界最新的信息技术能够发展到中国,以中国为开发基地,最重要前十年2009年开始,我在美国开始设计最新的高性能、高效能计算机架构,在研发、一直到云端计算。

  我上次在清华播音论坛讲的时候,有机会遇到我们教育部,有机会跟你们分享一下。假如说所有学计算机人大概都知道,从最早50年整个不同的主机、小机器很多很多设计的架构,你可以看到全部架构,每一个架构都是各层。从小型机、巨型机、超级电脑、云端电脑有很长的过程,每次都有基本架构的突破,为了达到目的。

  这就是80年代在美国大力开发,那时候我很幸运正好毕业跟美国超级电脑大师一起学习,所以发展好几代并行超级计算机,最典型8个CPU计算,最早一个1个CPU,现在快到千个以上CPU。80年代这一部机器2500万美金,可以做非常强大的科研,比如气象预测、天气、肿瘤、生物医学这方面的研究。

  未来要解决问题是解决各种不同的问题,最大问题我们是解决生物跟生命科学的问题,所需要运算能力非常强大。80年代一部机器是1000万美金做天气预测,做两天天气预测那时候只能准确500公里,那时候气象预测今天要下雨,可能真的下雨可能在500公里以外,所以那时候精确度不是很高。但是每一次加深精确度500—200公里、200—100公里,精确度一加倍数据特别庞大,那时候就需要四倍以上的速度处理。

  人类达到这个目的,目前已经早到一万亿次、百万亿次、千万亿次,最近湖南天河一号就是千万亿次。理论科学、实验科学我们国内比较缺乏、没有基础就是计算科学,计算科学可以快速找到靶标,由靶标再做实验、再做理论的弥补。这个图形看到未来达到这个逐渐上升,当系统设计师任务是什么,就是每次升的时候达到那个目的的时候,我们必须系统架构跟着走,而不是研制同一个架构都适合所有。

  就像人类造一千层大厦、一百层大厦用的基础石块、或者基础物质不一样的。所以我们在进行的时候,每一次上升的时候都开始有新的架构突破,第一个突破点在80年代单量算变成并行向量进行,从第二条线走到4个引擎、6个引擎、200引擎、450引擎。造一部机器那个机器消耗能量可能在机器旁边放一个火力发电站才能支持,所以不可持续发展。

  所以2009年开始确定下一个层次,要上超过1000并行这种情况怎么做?而且还有一个任务你不是指望越来越快、越来越多并行,而是越来越贵,很贵大家养不起。假如一千万亿次一个国家只能一个,必须多量多人发展,才可以可持续发展。我自己在美国开发网格发电机,至少可以到一千的并行,同时保持高效率。

  人类现在需要解决很多未知的问题,这里边都是我们未来需要研发的内容。但是这里边表示假如从最小度,目前走到一千万亿次,中国有一部,美国有四部,非常贵情况下只有几个单位才能使用,这不是我所希望看到的。必须有一个技术必须普遍使用,都能创造这才是高性能、信息技术高效点。

  再往下走我认为有另外一个突破点,不是纯职能计算。目前刚刚公布全世界前100名,这里边还是走20年前架构路线,没有动,只是把堆积堆积更多意见得到纯速度分子,而且效率可以观察的。假如效率50%就浪费50%能量。十年前我们开发网格计算机就是可以分布、可以并行,当你分的时候非常大量人、大量应用都可以使用,合在一起就是非常大的计算机。

  我们现在用的高效能、可信,在云端上公共设施共享服务平台。全世界有一百人亿人口,都有一百亿次计算,分开几百个高效能机器大家可以分享。

  它的观念把网格超级计算机理念,当时我们叫超级刀片服务器,我们是做刀片超级计算机,它的能量、它的叶片就是刀片的意思,每一个叶片本身技术水平材料是普通的,但是它后边控制系统是高速的控制,结果高效能、高可信的超级计算机,这就是这个名词的来源。

  怎么制造、怎么生产研发,必须做到可扩充性,学校可用、医院可用这里边就有很多很多需要研究的技术。这里边就让基本价格降低,以前二十年前一部机器一千亿次就要一千万美金,现在一万亿次要八百万人民币,这里边包括处理器、引擎材料全部都是PC机上的材料,交换机在市场可以买到的。

  主要功能上面是刀片,刀片有各种高速计算结点,中间就是大型的交换机控制系统,这里是点对点。区别一般建实验性公司,买很多机器变成集群,那个跟这个不一样,延迟性可能100—300毫米平均,这个没有延迟。最重要使用方法,一百个刀片可以分成不同的领域,可以动态的分解,比如有N个应用,第一个应用可能健康、教育、文化、气象不同的分布,第二个应用可能是气象预测20个刀片同时算一个数据叫并行运算,比如四个应用同时计算但是必须协作,协作之后并行。

  导弹20分钟之内对方打出来,他只要这样朝这个方向走,它会转向,因为有风力。必须四同时运算、同时协作。比如气象预测大气、海洋有不同的区域,每个地区不同运算,算完之后要结合。

  好处是可信度很高,必须用不同方法保护安全、保护可信度,机器要不间断,主机90.999,应该达到永不间断。那么它的观念就是跟电力事业一样,举一个例子,在50年前或者30年前每一个农村、每一个农家为了发电必须买柴油发电机,现在农家不用买柴油发电机,有一个供电网,只需要付电费,后面国家供电网用所有火力发电、风力发电等等全部网格服务。这里边结合起来大的信息供应网,同时分开单独支持,而且它有私有的、公有的,私有比如气象局有自己的结点,公有就是你气象局不用的我可以进来关掉,你用可以付费给你完全跟电力一模一样。

  这个看出来跟电力完全一样,人类一定走到这条路。假如网格我要算一个图形,每一个格就是一个城市超级网格,整个一起算速度就会快、而且精密度加大。这里边有很多技术优势,上升云端计算有三个层面,一个系统层面、一个平台层面、一个应用层面。一般Google谈的是应用层面,一部分在平台层面,真正系统层面非常重要,系统不稳定云端就更不稳定。

  网格超级应用非常广泛,国家大型企业、城市都可以应用,民生经济是我最近五年工作重点,除了个别国家单位买的起,而是真正卖到终端,能够影响民生经济。这是第一代2001年在美国开发,在香港电信用了五年,现在当纪念品。第二代已经到中国,第三代在深圳设计和生产,这是128个刀片,这是第三代在北京就是非典疫苗、生物学功能等等,用的非常好。这是香港气象天文台。这是第五代目前正在生产的,有一部分在欧洲原子碰撞系,里边有很多大型超级计算机,我们现在中国前面五年真正民生经济用在中国,就是健康网格计算机。

  上面一层有国家层云上服务平台,有省、地方市有一个,怎么结合起来。下面县跟乡镇就不需要了,他们只是一个使用者,数据收集者跟服务者,下面所有云端用手上笔记本电脑或者3G随时可以应用。第一个村医移动工作站,以前村医带着草药什么资料都没有,现在带着电脑有村民一千多个档案。这里边所有教育、健康、文化、艺术、金融服务终端都需要,消耗能量也很少,可以节省很多很多能量消耗、物质材料的消耗。

  我们在四年在中国做哪些东西?对外面没有多说,因为这是国家项目延伸出来。这是第一个切入口,云端计算第一切入健康,第二个是教育、第三个是文化。

  这个工程是国家医药卫生科技数据共享工程,国家投资很多钱,2030年开始首先共享有地震、气象数据、还有医疗数据,这里边主管部门各政府单位一级单位,现在已经变成常设单位,已经不再是一个单位。加拿大有基础科学还有中药、公共卫生,临床医学科学,主导单位协和医院和301医院。

  我们把全民健康保障系统,我们怎么做保障每一个老百姓都有好的健康,不是说你病的时候再看,而是做预防保健,最好不生病,有病早一点找到,而且远程会诊、诊疗等等都要用上。最后你生病的时候很容易治疗,整个技术帮国家建立一个模式建立全民健康。奥巴马准备花一万亿美金在十年内做到这个系统,这个系统我们已经在中国很多城市已经试点。

  四层架构,高片机铺在试点城市里边,在国家一级、省一级、市一级,每一个人生下来到老所有重要的信息,都储存市的云端,省云端随时抽取,知道这个省发生哪些疾病,我怎么救助,再到下面就是国家级科研、基础、数据库。大的系统中间系统各级乡医院、村医到国家二级医院、三级医院还有和国家疾病控制中心启动。这里边核心价值从云端实际民生工程非常重要,一个人资料库可能50G,都在云上的话怎么保护、怎么挖掘、怎么交换都是非常有意义的问题。

  除了资料的储存、资料的交换、资料的保护、资料的收集,这个收集错的收集没有任何利益,真正到农村他生病有没有生病,他有没有资料非常重要。我们要做远程会诊、做远程培训,乡村医生在我们这个系统里可以达到。

  这四年我们开发很多软件,七八种软件对整个云端系统增加刀片,很容易一个应用到N个应用,一个城市只要一套系统多种应用,综合信息服务平台。云端不是教育来一套、文化来一套,我们中国养不起,我们要把资料做到实时收集、协作收集、而且动态收集。

  你作为体检三年后再来一次,那是实打,我们村医到随访的时候,随时用手机加上来,你一看病自动生成,整个系统是封闭性的系统。比如会诊软件下级医生传到上级医生,这是实际发生的。中国西部医生非常少,农村在边缘地区根本没有教师、教师水平也不行、环境很差。只要你能够上网,就能够把最好老师带下去,就是云端的服务。底层乡镇医院,四级医生可以指导他,这就是我们张家口农村贫困区,农村村医每个人都是脸黑黑的,这几年还不是医师身份,而是村民身份。他们做不到公益事情,整个系统做不到。

  这个就是我们2007年的时候,卫生部长参观的时候他非常高兴,问我美国有没有这个系统?我说没有还没有做大,假如400—600亿我们分几年也要做完。今年颁布是国家基本国策,财务支持850亿人民币,三年内每一个中国人都有健康系统,我希望今天把这个好消息带给大家。四年前我们是摸着沙子过河,什么都没有标准。知识分子就是下乡,到那个地方摸出一个模式,让国家看是不是可行,所以我们挑最辛苦的地方,希望那个模式可以复制。

  将来教育也是到下面做才能知道到底需求在哪里。我们在数据一收集,发现成人40%—80%都有肾结石,把这个报告环保局,当地有非常丰富的铁矿,因为铁矿致富了,但是他的健康有影响的。大部分人吃硬质。而且我们发现在这个地方有25%肺结核重新复发。在这种数据收集以后,你要挖掘最有用的东西。

  这个乡镇里边、这个城市里边是什么背景、在哪里。在医院看到哪些人到哪里,有没有跑到大城市看的,这里边有很多数据我们可以共享、来做国家政策的支持。

  第二个少数民族西部靠近新疆的哈萨克自治县,他们以前是吃肉很多,运动很多,现在还是吃肉很多,但是不运动,产生很多问题。把这个建立起来监控每一个小孩子从小长到大吃进去东西监控。还有一个问题,当地有煤矿,沙尘暴一起来细粉到空中,不但附近能扩散,而且两个礼拜扩散到美国加州。所以美国人也很高兴,其实吸到肚子。这是很重要的数据要跟民生生活结合起来才能有意义。

  内蒙古同样道理,一个平方只有五个人,村医随访一定要有服务平台,随时上报。我们把村医工具站都让他带着。

页面功能 【打印】 【关闭】 【我有话说

版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备05078770,文网文[2008]228号

关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com