“天河三号”原型机通过验收,百亿亿次计算即将来临

张强,孙玉松,于冬阳/科技日报
2018-07-26 18:13

百亿亿次超级计算机也称“E级超算”,被公认为“超算界的下一顶皇冠”。在原型样机系统基础上,“天河三号”超级计算机有望于2020年研制成功,其运算能力将比“天河一号”提高200倍,存储容量提高100倍。

由国防科技大学牵头研制的、运算速度预计可达“天河二号”十倍以上的“天河三号E级原型机系统”已在国家超级计算天津中心完成研制部署,并于22日顺利通过项目课题验收,将逐步进入开放应用阶段。“天河三号E级原型机系统”的部署完成并顺利通过验收,预示着中国E级计算机将很快进入实质性研发阶段。

新一代百亿亿次超级计算机的研制计划是国际高端信息技术创新和竞争的前沿。美国和日本均已提出E级超级计算机的研制计划,拟在2020年或之后完成研制。而我国的百亿亿次超级计算机的研制计划也早已提上日程。据介绍,2016年国家科技部结合“十三五”发展规划,通过国家重点研发计划支持,开始分两期启动我国E级计算机研制计划。第一期主要为“E级计算机关键技术”研究,安排了三个E级机原型样机的研制;第二期为研制E机计算机。“天河三号E级原型机系统”研制项目是我国首个完成原型样机系统研制和部署的项目。

相关负责人透露,“天河”系列超级计算机已经全面掌握“五大”自主核心技术,即具有自主知识产权的四大芯片和自主操作系统。目前,通用CPU和加速器CPU、互连通信路由芯片和互连接口芯片,均已装配在“天河二号”2期系统中,打破了2015年美国对国防科大和“天河”系超算中心的CPU禁运,而“天河三号”超级计算机将对这四大芯片进行全面升级。

目前,“天河三号E级原型机系统”实现了四大自主创新,即三款芯片——“迈创”众核处理器(Matrix-2000+)、互连接口芯片、路由器芯片;四类计算、存储和服务结点,十余种PCB电路板;新型的计算处理、高速互连、并行存储、服务处理、监控诊断、基础架构等硬件分系统;系统操作、并行开发、应用支撑和综合管理等软件分系统。

前述负责人介绍,“天河三号原型机系统”实现了可适应科学计算和数据处理多应用需求的柔性体系结构,突破了计算访存通信三方平衡的高性能计算结点技术,可支持十万结点规模的高速互连和光电混合高速信号传输技术,高效靶向散热冷却技术,用户透明的高性能计算环境软件支撑等技术。这些技术通过几十年的积累和不断创新,在“天河”超级计算机系统核心关键技术上已实现了整体自主可控。

“‘天河三号原型机系统’关键技术的突破和系统研制,也全面为‘天河三号’整机系统提出了计算、访存、通信性能平衡的设计方案。”他表示,“未来‘天河三号’E级超级计算机将对已经设计生产的三款计算、互联通信核心芯片再进行全面升级,同时基于飞腾CPU设计新的多核CPU,实现可支持海量数据存储的层次式存储系统,对适用高性能计算和高效大数据处理的柔性体系结构进一步优化。计划利用2-3年的时间打造出全自主的具有国际领先水平的新一代‘天河三号’E级超级计算机。”

依托“天河三号”超级计算机能力,国家超级计算天津中心今后将构建超级计算与云计算和大数据深度融合的高性能计算服务平台,在长效高分辨率气候气象预报、大规模航空航天数值风洞、地震地质研究和油气能源勘探、生命科学研究等超大规模计算与模拟,以及涉及国计民生、信息安全的政务数据、医疗卫生、基因健康、智慧城市、交通、地理、海洋等大数据分析处理领域,发挥强大支撑和平台作用,有效推动新一代人工智能发展规划等实施和网络强国建设。

(原标题 重磅!“天河三号”原型机通过验收,百亿亿次计算即将来临!)

    责任编辑:徐路易