低功耗處理器設(shè)計(jì)已經(jīng)應(yīng)用于超過1800億顆芯片的ARM,兩年前就開始探索邊緣、云端及5G市場,并發(fā)布了Neoverse E系列處理器,ARM當(dāng)時稱到2021年這一系列處理器每年要實(shí)現(xiàn)30%的性能提升。2019年,第一代Neoverse N1推出,性能提升60%,是2018年提出的目標(biāo)的兩倍。
本周,ARM再次更新Neoverse產(chǎn)品線,發(fā)布第二代N系列Neoverse N2以及全新的Neoverse V1平臺。相比Neoverse N1,Neoverse N2在保持相同水平的功率和面積效率之余,單線程性能提升了40%。同樣與Neoverse N1相比,Neoverse V1的單線程性能可提升超過50%。
ARM在高性能計(jì)算市場是要靠單核與x86的多核競爭嗎?
Neoverse CPU為何強(qiáng)調(diào)單核性能?
Neoverse系列發(fā)布兩年之后,已經(jīng)擁有了E系列、N系列、V系列三大系列。Neoverse N系列同時考慮了性能、功率、面積(PPA),擅長可擴(kuò)展;V系列旨在提供最佳性能,相對而言會消耗更多面積和功耗;E系列主要關(guān)注效率,在功耗和面積的縮減上進(jìn)行優(yōu)化。
作為最新發(fā)布的產(chǎn)品系列,V系列更加追求性能,因此Neoverse V1是面向7nm和5nm設(shè)計(jì),并且率先支持可伸縮矢量擴(kuò)展(SVE ,Scalable Vector Extensions)。SVE可基于未知寬度向量單元的軟件編程模型,執(zhí)行單指令流多數(shù)據(jù)流(SIMD)整數(shù)、bfloat16、浮點(diǎn)指令。
同時,V1還支持PCIe 5.0連接、DDR5、HBM2e和CCIX 1.0,可實(shí)現(xiàn)插槽之間的芯片與封裝內(nèi)小芯片之間的雙向一致性通信。
ARM基礎(chǔ)設(shè)施事業(yè)部高級副總裁兼總經(jīng)理 Chris Bergey接受雷鋒網(wǎng)采訪時表示:“SVE在加速HPC高性能計(jì)算領(lǐng)域或者是機(jī)器學(xué)習(xí)工作方面表現(xiàn)高效,同時它對軟件開發(fā)者非常友好,不需要管矢量的位寬是多少。未來我們會把SVE技術(shù)運(yùn)用到除N2和V1之外的一系列核上面。”
以ARM架構(gòu)為基礎(chǔ)的日本富岳(Fugaku)超級計(jì)算機(jī)就使用了512位的SVE的技術(shù),它不僅是全球最快的超算,也是最新Green500榜單排名第四的超算。
ARM本周發(fā)布的另一款新產(chǎn)品Neoverse N2面向5nm工藝設(shè)計(jì),支持PCIe 5.0和DDR5,通過支持用于高帶寬存儲器的HBM3以及用于結(jié)構(gòu)的CCIX 2.0和CXL 2.0來進(jìn)一步擴(kuò)展??芍С謴?核心,20W到192核心350W的設(shè)計(jì),橫跨云、智能網(wǎng)卡(SmartNICs)、企業(yè)網(wǎng)絡(luò)到功耗受限的邊緣設(shè)備的高可擴(kuò)展性平臺。
Chris Bergey表示,關(guān)于新發(fā)布的V1和N2的更多細(xì)節(jié)會在之后公布?,F(xiàn)在我們只知道V1和N2相比上一代N1的單核性能提升了超50%和40%。
為什么Neoverse CPU如此強(qiáng)調(diào)單核性能?Chris Bergey解釋:“我們認(rèn)為云服務(wù)廠商會更傾向選擇單線程處理器核,因?yàn)榻咏?、安全性、多租戶等特性可以為他們帶來更好的?jīng)濟(jì)性,這也是我們的產(chǎn)品聚焦單線程技術(shù)的原因。當(dāng)然,Neoverse E1也支持同步多線程(SMT)技術(shù)。”
他還給出了一張圖表,X軸代表芯片級性能,Y軸代表每線程性能,從圖表中可以看到,相比傳統(tǒng)的英特爾和AMD服務(wù)器CPU,Neoverse的單核及芯片級性能都超過了市場上的產(chǎn)品。
Neoverse每年30%的性能提升持續(xù)到2021年之后
ARM承諾,Neoverse系列CPU的性能每年會提升30%,這種提升會持續(xù)到2021年。Chris Bergey說:“這當(dāng)然與ARM工程團(tuán)隊(duì)的努力和投入是分不開的,我認(rèn)為與軟件生態(tài)的逐漸成熟有更大的關(guān)系,例如很多云原生的軟件現(xiàn)在可以比較無縫地運(yùn)行在ARM架構(gòu)上面。”
ARM在手機(jī)CPU市場持續(xù)更新的架構(gòu)與Neoverse性能的持續(xù)提升顯然有著密不可分的關(guān)系。Chris Bergey表示,“我們在Cortex的基礎(chǔ)上,針對基礎(chǔ)設(shè)施領(lǐng)域所要求的功能做了進(jìn)一步的增添或提升,并且打造最合適超多核設(shè)備的功耗與性能,包括核之間的互聯(lián)等優(yōu)化工作。”
也就是說,同一時期的Cortex和Neoverse產(chǎn)品之間存在相似之處。比如,Neoverse N1是和Cortex-A76是同期開發(fā),這兩個微體系結(jié)構(gòu)有很多相似之處。
Neoverse V1可以看作是Cortex-X1的同級設(shè)計(jì),兩款旗艦CPU可能共享許多超大型內(nèi)核結(jié)構(gòu)。Cortex-X1是今年5月份發(fā)布的新品,同樣追求最大性能。
Neoverse N2有些特殊,因?yàn)樗硐乱淮鶦ortex-A的設(shè)計(jì),也就是與Cortex-X1同期發(fā)布的A78的后續(xù)產(chǎn)品,這或許也是Neoverse N2的技術(shù)細(xì)節(jié)現(xiàn)在還不能公布的關(guān)鍵原因。為了更直觀的說明Cortex與Neoverse產(chǎn)品線之間的關(guān)系,外媒AnandTech制作的一張圖能夠幫助大家更好地理解。
軟件生態(tài)方面,ARM關(guān)鍵的任務(wù)在于ARM的芯片級接口,這提供了設(shè)計(jì)系統(tǒng)層級解決方案的機(jī)會。ARM在CCIX與CXL投資,提供更好的互聯(lián)技術(shù),可以提供可擴(kuò)展性的交換網(wǎng),支持大量的處理器核。
另外,ARM Project Cassini是希望通過標(biāo)準(zhǔn)、平臺安全性與參考實(shí)施,對軟件開發(fā)者友好,讓行業(yè)合作伙伴能夠在基于ARM的平臺上部署裝機(jī)即用。
在對基礎(chǔ)設(shè)施的基礎(chǔ)軟件包括操作系統(tǒng)、虛擬機(jī)管理程序支持方面,Xen、KVM、Docker容器以及越來越多的Kubernetes已經(jīng)陸續(xù)宣布支持ARM架構(gòu)。許多初期由ARM推動的開源項(xiàng)目正在變得自主運(yùn)轉(zhuǎn),商用ISV應(yīng)用程序也齊步演進(jìn)。
ARM服務(wù)器CPU“搶食”x86蛋糕最缺的是時間
但想要真正撼動x86在云端CPU市場的地位,ARM還有很長的路要走。Chris Bergey對雷鋒網(wǎng)表示:“ARM在云端市場最大的挑戰(zhàn)還是時間。我們看到很多數(shù)據(jù)中心的客戶對轉(zhuǎn)向ARM有巨大的興趣。但從ARM的IP到芯片設(shè)計(jì),到最后能夠在數(shù)據(jù)中心部署,再到軟件生態(tài)系統(tǒng)的支持,仍需要一定的時間以及很多產(chǎn)業(yè)鏈合作伙伴一起努力。”
當(dāng)然,Neoverse是面向從個云端到邊緣的市場。Chris Bergey也指出,ARM的機(jī)遇其實(shí)包括了云原生軟件的支持,以及協(xié)助客戶通過定制化的形式克服摩爾定律減速帶來的挑戰(zhàn)等。
雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))此前報(bào)道,亞馬遜、Marvell都已經(jīng)將ARM架構(gòu)應(yīng)用于云端,亞馬遜推出了ARM架構(gòu)的服務(wù)器處理器Graviton2,Marvell也推出了基于ARM架構(gòu)定制的ThunderX3處理器,華為海思也推出了基于Neoverse N1設(shè)計(jì)的鯤鵬系列服務(wù)器。
業(yè)內(nèi)有觀點(diǎn)認(rèn)為,ARM在云端市場要成功的一個關(guān)鍵就是滿足大型互聯(lián)網(wǎng)公司和云服務(wù)提供商的定制化需求。
“在異構(gòu)計(jì)算里,ARM有一個很大的機(jī)遇,就是我們?nèi)绾翁峁┚o耦合或是定制化的能力,甚至是通過多核封裝或多芯片組裝技術(shù),將來自生態(tài)系統(tǒng)、IP技術(shù)與云廠商的需求與技術(shù)整合在一起。” Chris Bergey說,對于沒有很強(qiáng)設(shè)計(jì)經(jīng)驗(yàn)的客戶而言,他們更傾向于選擇Neoverse核。
ARM架構(gòu)芯片能未來能否覆蓋從終端到邊緣再到云端?現(xiàn)在看來,這種成功除了ARM的努力外,最終是否會被英偉達(dá)收購也成為了關(guān)鍵因素。
關(guān)鍵詞: