6 月 30 日消息 一年一度的高性能計算大會 ISC 如期而至,世界 TOP 500 超級計算機排名昨日正式公布。
對比去年的榜單,今年 TOP 10 的榜單中,來自美國新能源部勞倫斯伯克利國家實驗室的 Perlmutter 系統(tǒng)新晉入圍。中國超級計算機的數(shù)量雖然下降至 186 臺(去年 212),但對比位居第二的美國的 123 臺,依然遙遙領(lǐng)先。不過美國超算算力更強,美國超算的綜合性能為 856.8 Pflop/s,而中國超算為 445.3 Pflop/s。
以下是 Top10 中的系統(tǒng)摘要(引用自 Top500):
日本的 Fugaku 仍然是第一的超算系統(tǒng)。它擁有 7,630,848 個內(nèi)核,使其能夠達到 442 Pflop/s 的 HPL 基準(zhǔn)測試分數(shù)。這使它領(lǐng)先第二名 3 倍。
Summit 是美國田納西州橡樹嶺國家實驗室 (ORNL) 的 IBM 構(gòu)建的系統(tǒng),仍然是美國最快的系統(tǒng),在 HPL 基準(zhǔn)測試中的性能為 148.8 Pflop/s,全球排名第二。用于對 TOP500 榜單進行排名。Summit 有 4,356 個節(jié)點,每個節(jié)點包含兩個 Power9 CPU,每個 CPU 有 22 個內(nèi)核,六個 NVIDIA Tesla V100 GPU,每個都有 80 個流式多處理器 (SM)。這些節(jié)點通過 Mellanox 雙軌 EDR InfiniBand 網(wǎng)絡(luò)鏈接在一起。
美國加利福尼亞州勞倫斯利弗莫爾國家實驗室的 Sierra 系統(tǒng)排名第 3。其架構(gòu)與 #2 的 Summit 系統(tǒng)非常相似。它由 4,320 個節(jié)點構(gòu)建,具有兩個 Power9 CPU 和四個 NVIDIA Tesla V100 GPU。Sierra 達到了 94.6 Pflop/s。
由中國國家并行計算機工程與技術(shù)研究中心(NRCPC)開發(fā)并設(shè)立在江蘇無錫國家超級計算中心的神威太湖之光以 93 Pflop/s 排名第四.
排名第 5 的 Perlmutter 是 TOP10 中的新晉成員。它基于 HPE Cray“Shasta”平臺,以及一個具有基于 AMD EPYC 的節(jié)點和 1536 個 NVIDIA A100 加速節(jié)點的異構(gòu)系統(tǒng)。Perlmutter 達到了 64.6 Pflop/s。
Selene 現(xiàn)在排名第 6,是 NVIDIA 內(nèi)部安裝的 NVIDIA DGX A100 SuperPOD。該系統(tǒng)基于 AMD EPYC 處理器,采用 NVIDIA A100 加速,Mellanox HDR InfiniBand 作為網(wǎng)絡(luò),實現(xiàn)了 63.4 Pflop/s。
由中國國防科技大學(xué)(NUDT)開發(fā)并部署在中國廣州國家超級計算機中心的系統(tǒng)天河 2A(Milky Way-2A)現(xiàn)在以 61.4 Pflop /s 被列為世界第 7 系統(tǒng)。
名為“JUWELS Booster Module”系統(tǒng)是 No. 8。由 Atos 構(gòu)建的 BullSequana 系統(tǒng)安裝在德國的 Forschungszentrum Juelich (FZJ)。該系統(tǒng)使用帶有 NVIDIA A100 的 AMD EPYC 處理器進行加速,并使用 Mellanox HDR InfiniBand 作為類似于 Selene 系統(tǒng)的網(wǎng)絡(luò)。這是歐洲最強大的系統(tǒng),算力達 44.1 Pflop/s。
排在第 9 位的 HPC5 是戴爾構(gòu)建、意大利 Eni SpA 安裝的 PowerEdge 系統(tǒng),由于使用 NVIDIA Tesla V100 作為加速器和 Mellanox HDR InfiniBand 作為網(wǎng)絡(luò),實現(xiàn)了 35.5 Pflop/s 的性能。
Frontera 是一款戴爾 C6420 系統(tǒng),安裝在得克薩斯大學(xué)的得克薩斯高級計算中心,目前排名第 10。它使用 448,448 個英特爾至強內(nèi)核實現(xiàn)了 23.5 Pflop/s。
值得注意的是,此次榜單中大多數(shù)系統(tǒng)采用了 AMD 和英偉達的方案。另外,名單上更新的兩個新系統(tǒng)“超級云”,能夠同時滿足 AI、高性能計算(HPC)和云端需求,這意味著,高性能計算正在同 AI 加速融合。
此外,英偉達也在本次 ISC 大會上發(fā)布了全新的 HGX A100 系統(tǒng),且已經(jīng)在英國愛丁堡大學(xué)托管的 DiRAC 超級計算機中落地。
據(jù)介紹,英偉達 HGX A100 加入了三項關(guān)鍵技術(shù):NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 網(wǎng)絡(luò)和 NVIDIA Magnum IO GPUDirect Storage 軟件。
其中,A100 80GB PCle GPU 采用 NVIDIA Ampere 架構(gòu),與 A100 40GB 相比其內(nèi)存帶寬帶到 2TB/S,提升 25% 。更高的內(nèi)存容量和內(nèi)存帶寬,能夠?qū)⒏嗟臄?shù)據(jù)和更大的神經(jīng)網(wǎng)絡(luò)保存在內(nèi)存中,從而最大限度地減少節(jié)點通信和能耗,研究人員也能獲得更高的吞吐率和更快的結(jié)果。
目前,英偉達最新 HGX 高性能計算平臺已落地英國愛丁堡大學(xué),為其托管的新型 DiRAC 超級計算機 Tursa 提供動力支持。