去年11月份,AMD發(fā)布了頂級加速計算卡Instinct MI100,首次采用針對HPC高性能計算、AI人工智能全新設(shè)計的CDNA架構(gòu),和游戲向的RDNA架構(gòu)截然不同?,F(xiàn)在,第二代的MI200也首次浮出了水面。
MI100采用臺積電7nm工藝制造,集成120個計算單元、7680個流處理器,并專門加入Matrix Core(矩陣核心)用于加速HPC、AI運算,還整合了4096-bit 32GB HBM2顯存,支持PCIe 4.0 x16和八卡并行,整卡功耗300W。
它的FP64雙精度浮點性能首次突破10TFlops(也就是每秒1億億次),混合精度和FP16半精度的AI性能提升接近7倍。
根據(jù)最新消息,MI200將會采用下一代CNDA架構(gòu),并首次引入MCM多芯片封裝,看這樣子翻番到1.5萬個流處理器問題不大。
本次曝光的MI200將用于HPE Cray EX超級計算機,執(zhí)行加速計算,產(chǎn)品名被描述為“MCM Special FIO Accelerator”,其中FIO代表“Factory Installation Option”(廠商安裝選項),此外還有OAM形態(tài),代表開源加速卡。
不過,MI200的具體規(guī)格目前一無所知,除了猜測流處理器可能因為MCM封裝而翻一番,還有望加入FullRate640ps指令集、支持全速率FP64浮點計算。
MI200預(yù)計今年晚些時候發(fā)布,未來將搭配代號“Trento”(特倫托)的霄龍?zhí)幚砥鳎餐糜贏MD為美國國防部打造的百億億次超級計算機“Frontier”。
Trento并未出現(xiàn)在AMD霄龍演進路線圖上,其實是即將發(fā)布的第三代“Milan”(米蘭)的定制版,專為超算優(yōu)化,可能會提前支持PCIe 5.0。