由中科院研制的单精度千万亿次超级计算系统
我国第一套单精度峰值超过每秒1000万亿次浮点运算的超级计算系统,日前由中国科学院过程工程研究所研制成功并投入使用。该系统针对众多行业和学科的应用需求,提炼了不同领域的共同特征,构建了多层次的并行算法和相应的计算机体系结构,是中科院长期积累、自主创新的重要成果,并得到了联想和曙光的支持和合作。
超级计算能力不仅体现了一个国家在科学研究方面的实力,而且决定了工程技术和国家安全方面的竞争力,已成为各大国激烈竞争的科技制高点之一。在计算硬件技术迅速发展的同时,通用超级计算投资大、能耗高、算法开发滞后、实际效率低的问题日益突出;而针对各种特定算法设计的专用计算机研发成本高、无法成批生产,经济性差。这两方面的问题成为提升超级计算能力的瓶颈。
对此,中科院过程所长期探索。1984年开始多尺度方法及其计算模型的研究,1993年进一步开展离散化方法和算法的研究。在此过程中,逐步认识到多尺度结构和离散化是许多工程问题的共同特征,建立了适应不同问题的通用算法框架。2000年,根据此类算法良好的并行性和可扩展性,正式提出了多尺度离散化并行计算模式。2008年2月,过程所敏锐地抓住图形处理器(GPU)编程环境更新的机遇, 借助GPU自主研制了基于该模式的单精度峰值120万亿次的计算系统。利用该系统,成功开展了多相流动直接数值模拟、材料和纳微系统微观模拟和生物大分子动态行为模拟等应用,证明了多尺度离散化并行计算模式的优势和前景,得到了国家有关部门的高度重视。
2009年,在国家重大科研装备研制项目支持下,该系统又升级至峰值450万亿次,并新建了基于多种GPU的峰值150万亿次的单元系统,同时与联想集团和曙光公司分别联合研制了两套200万亿次的单元系统,于今年2月安装到位。3月,四套系统通过千兆以太网互联为多层次的体系结构,并解决了多种不同GPU联用的问题,建成了峰值速度超过1千万亿次的超级计算系统。
在日前举行的项目评估会上,专家组高度评价了该系统的重要意义,认为它提炼了众多应用领域的计算问题的共性算法特征,提出了具有一定普遍意义的多尺度离散模拟方法,通过算法、软件和硬件结构密切结合的创新设计,提升实际问题的求解能力,并显著降低成本与能耗,实践了一种富有特色的超级计算模式。
由于应用需求迫切,该系统研制期间就开始承担国家重大专项、国家科技支撑计划、国家自然科学基金重大基金和多家大型企业的计算任务,涉及化工、冶金、石油、矿产、动力等多个产业和物理、化学、材料、生物等多个学科,展示了广阔的应用前景。
该系统是中科院过程所与联想集团和曙光公司等单位协同攻关的结果,体现了中科院在高性能计算的研究、开发和系统集成方面的整体实力。两家企业也分别形成了新一代高效能低成本超级计算产品系列,为研发成果的推广应用打下了良好基础。该系统的成功表明:从应用出发、另辟蹊径,通过多学科、多领域的交叉合作实现问题、算法和硬件结构的一致性,以提高计算的效率和经济性,是我国在现有条件下赶超世界超级计算前沿水平的可行途径,也将是超级计算发展的重要方向。
4月20日,中科院举行了“单精度千万亿次超级计算系统”新闻发布会
中国科学院副院长、项目领导小组组长李静海出席会议并回答记者提问
中国科学院秘书长、项目领导小组副组长李志刚介绍该项目背景及意义
中国科学院新闻发言人、办公厅主任蒋协助主持会议
中科院过程工程所研究员、项目负责人葛蔚介绍系统研制和应用情况