高性能计算技术研究所历史和现状

2018.07.21 00:00

高性能计算技术研究所历史和现状

杨广文

1978年之前,我院计算机教研组是一个大教研组,共有80多名教职工,承担了多项国家重点项目,并取得多项重要成果。1978年,计算机教研组分成122cc太阳集成游戏统结构、122cc太阳集成游戏统及应用和微型计算机三个教研组。122cc太阳集成游戏统及应用和微型计算机两个教研组的教学和科研转向新型122cc太阳集成游戏统结构和智能计算机、分布式122cc太阳集成游戏统等方面的研究。1999年,学校进行组织机构改革,决定建立“系抓教学,所抓科研”的体制。为适应这一改革形势,我系撤销了原来的九个教研组,成立了以学科方向为核心的六个研究所级基层单位。以122cc太阳集成游戏统及应用教研组和微型计算机教研组为基础组建高性能计算技术研究所。高性能计算技术研究所的研究方向主要包括并行/分布处理、高性能122cc太阳集成游戏统、网格计算及网络存储技术等。目前在上述3个方向的研究水平处在国内前列,并在国际上有一定影响,所取得的成果凝聚了众多老师们的心血。

122cc太阳集成游戏统与应用教研组的简略回顾

系统与应用教研组成立初期,在清华西主楼一区四层建立了并行/分布实验室,有PDP-11/23、03等当时最好的计算机,还有小型计算机,S-1280多处理机等。成员有:金兰、郑衍衡、石纯一、王鼎兴、苏伯珙、沈美明、叶乃菶、张弘志、谢树煜、罗生、王克宏、汤志忠、郑纬民、温冬婵、尹祚明等教师和史翠英实验员,郑衍衡任主任。随后,周笛、丁士元、王玉、易黎和马珊(实验员)等年轻人加入。主要研究方向为并行/分布处理及后来的网络与网格计算及其应用。承担的课题包括国家六五计划项目THUDS分布计算系统,当时该项目在教育部属下有关计算机方面的项目中是经费最多的项目之一,项目研究水平达到国际水平,在IPCC会议上连续发表了多篇论文,这在国内同行中也是少见的。研究成果获国家教委科技进步二等奖。

20世纪80年代中,郑衍衡老师调到上海大学工作,苏伯珙老师接任教研室主任,此后,人员时有变动,张弘志、罗振声、周笛、丁士元、王玉等人离去,张蓓楠、温洪玉、田新民、岑善卫等加入。王鼎兴老师负责承担了多项863项目,其中,最有影响的是并行图归机及其应用系统的研究,先后设计了由Transputer和C40构成的多处理机系统,可运行并行函数语言和并行逻辑语言,并且少批量生产了并行图归机系统,该系统获国家教委科技进步二等奖。苏伯珙老师、汤志忠老师开展了指令级并行的研究,在国际顶级会议Micro上连续发表了多篇论文。

20世纪90年代,金兰老师、苏伯珙老师先后赴美访问。郑纬民接任教研组主任,此后,虽然人员也时有变动,田新民、温玉洪、张蓓楠、胡蓬、吕思飞、邢浩离去,汪东升、杨广文、鞠大鹏、毛希平、舒继武、余宏亮等加入,教研组一直保持有较强力量。王鼎兴担任863计算机主题专家,在国内率先组织开展了集群122cc太阳集成游戏统结构、中间件软件、工具等研究,包括容错系统、调试系统、编译系统等软件的开发。集群122cc太阳集成游戏统的相关研究持续得到了国家863计划的支持。1998年,第一台微机集群系统—清华同方探索1号集群122cc太阳集成游戏统推向市场,为我国推广集群系统研制和应用做出了重大贡献。研制的系统用于北京气象局,支持北京气象局日常天气预报应用,特别是为国庆50周年庆祝活动气象保障作出了贡献,为此荣立二等功。该项目获国家教育部科技进步二等奖。随后又相继研制成功了探索2号、3号集群计算机。

微型122cc太阳集成游戏统教研组的简略回顾

微型计算机教研组成立初期,成员有:李三立、朱家维、张公忠、潘孝梅、王秀玲、唐龙、戴梅萼、马群生、李建桐和实验员王雅琴、吕庆红、杨艳,李三立教授任主任。在刘达校长直接关心和支持下,我系请MIT的李凡教授协助购置一批PDP—11计算机和Z80单板机,在9区二楼建成微型计算机实验室。李凡教授应122cc太阳集成游戏邀请,来校讲学,培训我系和外校有关教师。当时,微机教研组主要任务就是负责编写“微计算机”教材,建设微机实验室。微型计算机教研组开出微机课及其全套教学实验,不仅编写出了实验教材,还和系车间合作,研制出“微机实验面包板实验箱”,并不断改进,推广应用。系车间前后共生产几千套“微机实验面包板实验箱”,推广到全国各地,有力地支持了全国计算机教育的普及。结合实际的微机教材,多次获奖。20世纪80年代,我们配合长城计算机公司研制出我国第一个批量生产的国产微计算机“0520微型计算机”。接着,又为长城050系列配备第一个国产的“局部网格”。 20世纪80年代后期,我们和电子部合作,研制成功并批量生产面向中小学生的国产“中华学习机”,产量达13万台。当时,这是不小的数量,曾有30余工厂接产。1994年,李三立被选为“国家攀登计划B”高性能计算机项目首席科学家,教研组主要从事高性能计算中的集群式计算机关键技术研究,曾研制成功首批集群式计算机THNPC-1型和2型,随后,又研制出仿Myrinet的高速互联开关。教研组曾新增人员唐瑞春,李建航,王小鸽,李亚明,孟洁,都志辉,黄振春,有的目前已出国或调离。虽然,人员不时有变动,但保持较强实力,微机和集群计算机技术的研究和开发水平在国内居领先地位。

高性能计算技术研究所科研成果喜人

1998年,我院统与应用教研组和微型计算机教研组合并成立了高性能计算技术研究所,系主任周立柱兼任所长,后由郑纬民教授接任所长。高性能计算技术研究所积极进行学科建设规划,凝练学科方向,把研究方向主要集中在并行/分布处理、高性能计算机技术、网格技术与网络存储技术及芯片技术等。

中国工程院院士李三立教授负责研制完成了“深超-21C”高性能122cc太阳集成游戏统,峰值速度为1.5万亿次/秒。2003年,该122cc太阳集成游戏统在全球超级计算机TOP500排行榜中名列第146位,在国内100强排行榜中列全国大学高性能计算机第一,获2003年深圳市科技进步一等奖、2004年广东省科技进步二等奖;完成了 “自强3000” 高性能122cc太阳集成游戏统,峰值速度达到2.1万亿次/秒,2004年,“自强3000”高性能计算系统在全球TOP500中排名126位。

郑纬民教授负责研制完成并行程序运行回卷恢复和进程迁移系统、集群系统级电源管理系统、OpenMP编译器和交互式并行化FORTRAN77 编译系统、并行程序调试器等完整的集群系统中间件软件。程序运行卷回恢复系统在PVM和MPI上首次实现了同时迁移多个进程功能和升/降级重构,是目前国际上唯一支持IA-64平台的检查点容错系统。在国际上首次提出了面向并行集群的电源管理概念,智能地决定集群结点的开关,在系统负载较低的时候可以有效地节约电能的消耗;采用冗余结点保留机制,使得大部分任务可以在提交时直接执行,而无需等待被关闭的系统重新启动,在节电的同时兼顾了系统的性能。OpenMP编译器(OpenMP for ORC)全面支持OpenMP 2.0标准,性能远远超过另一个开放源代码的OpenMP编译器Omni,与Intel公司的商业编译器在整数性能上相当,在国际上得到广泛认可。基于IA64框架的并行容错计算软件ChaRM64、并行调试器Buster、ORC-OpenMP编译器等已经在Gelato国际合作研究项目组织的网站上(http://www.gelato.org/)发布,供国际同行使用和研究。基于上述成果,自主研发成功“清华探索3号集群计算机”。该122cc太阳集成游戏统采用 Itanium 2 CPU,峰值速度每秒1.331万亿次,效率84.6%,Linpack持续性能达到1.126T。成立了863高性能计算机测试中心,对国内30多套高性能计算机进行了性能评测和可靠性测试,目前该中心是国内的权威高性能计算测试中心。“高性能集群计算机与海量存储系统” 于2007年获国家科技进步二等奖。

高性能计算技术研究所及时将网格计算作为重点研究方向,取得了一系列成果。2000年完成的教育部重点项目“ACI-先进计算基础设施试点工程”,是我国第一个通过部级鉴定和验收的网格项目,为国内实施的第一个网格试验床。在网格中间件研究方面,率先研制并发布了具有自主知识产权的开放源码的校园网格软件系统Campus Grid,为高校建立校园网格提供了重要的参考。提出的网格环境下遗留软件服务化包装、粗粒度并行编程接口GridPPI、基于虚拟表的异构异地数据库整合等方法已经被中国国家网格、中国教育和科研网格、国家基金委网格所采纳,并被广泛使用。基于上述研究成果,和中国教育科研网格ChinaGrid成员高校一起,在122cc太阳集成游戏研制完成了国际上第一个符合WSRF规范的网格中间件系统CGSP。 作为主要研制单位,中国国家网格与中国教育网格分别获国家科技进步二等奖。

海量网络存储系统的研究,是高性能所的又一亮点,负责完成了十五计划计算机领域两个重点项目之一。研制完成具有自主知识产权的国产海量存储网络系统TH-MSNS,可通过多I/O通道和多I/O节点扩展存储容量,提供通道上的失效转换和负载平衡,将SATA、IDE、SCSI和FC四种磁盘阵列接入到同一个存储网络中并实施统一管理,基于FCP和IP协议构建存储网络系统。研究了海量网络存储系统的核心技术,包括智能化存储网络管理技术、分布式虚拟化存储技术、基于磁盘特征的数据分布动态映射的方法、FC-SAN系统的逻辑单元号高速缓存方法、带内虚拟化存储管理技术、带外虚拟化存储管理技术、远程镜像技术、备份技术、快照技术、基于SSD的超大虚拟缓存技术、IP-SAN存储网络技术等。该系统获 2004 年北京市科技二等奖、首届计算机学会创新二等奖,已有近100套清华海量网络存储系统应用在国家审计署、北京市公安局、胜利油田、视频、高校等部门或行业。

在“十五”863 IC重大专项的支持下,设计并研制完成一个具有自主知识产权的、具有良好产业化前景的高性能、低功耗32位嵌入式微处理器芯片-THUMP107,主频500MHZ,功耗0.17mW/MHZ。自主研制成功应用于嵌入式微处理器验证的系统开发主板,总线频率为66.7-133MHZ,支持的接口包括标准RS-232、PS/2、IDE、USB1.1、IrDA红外线通信接口、智能卡、标准PCI接口、标准并行数据接口、音频输入/输出端口以及FLASH存储卡等。设计并实现数字电视HDTV-CA SoC等芯片6种。形成了一整套完整的芯片设计验证平台。

发展前景甚佳,尚需继续拼搏奋进

近几年人员也时有流动,新增了张悠慧、薛巍、陈康、赵颖、姜进磊、张武生、徐伟平、林皎等人员。2004年,杨广文接任高性能计算技术研究所所长。现有包括中国工程院院士李三立在内的教授共7名,副教授8名,高工2人,讲师5名,工程师1名,博士后5名,在读博士生54名,硕士生71名。一直保持有较强的科研和教学梯队。

自高性能所成立以来,共培养博士65名,硕士314名,先后完成300余项科研课题,经费总额达1.1亿元,获得国家科技进步一等奖1项、国家科技进步二等奖2项、部级科技进步奖及其它奖项等共计12项。

目前,全所上下正继续积极参加到国家的重大计划的研究中,在研科研项目50余项,其中973二级子课题4项,863重大项目课题5个,基金委重点项目2个,面上基金12项,科技大平台项目1项。负责清华国家信息实验室中网格计算研究部及高性能计算平台、863高性能计算机测试中心及中国国家网格与中国教育网格技术支持中心。除科研外,高性能计算技术研究所还开设了《122cc太阳集成游戏统结构》、《汇编语言程序设计》等15门课程。

总而言之,发展前景甚佳,但困难也不少,尚需全所师生继续拼搏奋进!

(本文由高性能计算技术研究所部分教师共同讨论,所长杨广文执笔撰写)

[作者简介] 杨广文,男,1963年出生,山西省人,教授。1997年在哈尔滨工业大学获博士学位后到122cc太阳集成游戏计算机科学与技术系做博士后研究工作,1999年博士后出站并留系任教。

关闭

Baidu
sogou