今天凌晨,ARM正式推出了ARMv9指令集,官方稱之為10年來最重要的創(chuàng)新,將是未來3000億ARM芯片的基礎(chǔ)。
包括目前性能最強的Cortex-X1/A78在內(nèi),現(xiàn)在所用的ARM芯片還是基于ARMv8.x指令集的,2011年首次推出,主要特點是增加了64位指令集支持。
相比之下,ARMv9的升級看點就多了,過去10年計算架構(gòu)有了太多變化,ARM處理器也不止是移動/嵌入式專用了,已經(jīng)擴展到了PC、HPC高性能計算、深度學(xué)習(xí)等等新市場。
ARMv9在兼容ARMv8的基礎(chǔ)上,提升了安全性、增強了矢量計算、機器學(xué)習(xí)及數(shù)字信號處理,同時繼續(xù)提升處理器性能。
首先來說說性能上的變化,以智能手機等移動平臺使用的Cortex-X/A系列為例,X1/A78這一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架構(gòu)及Makalu架構(gòu)會保持30%以上的IPC性能提升。
IPC提升與頻率無關(guān),如果再考慮到未來工藝帶來的頻率增加,那么CPU性能有望提升40%以上。
除了CPU性能,ARMv9還非常重視整體的性能提升,包括降低內(nèi)存延遲(從150ns降至90ns)、頻率提升(從2.6GHz到3.3GHz)內(nèi)存帶寬(從20GB/s到60GB/s)、緩存等。
ARMv9這次與性能有關(guān)的一個重要升級是SVE2指令集,SVE最早是ARM與富士通合作的浮點性能擴展,日本最強也是TOP500最強超算富岳就使用了SVE指令集,現(xiàn)在推出的是第二代SVE浮點指令了。
相比SVE的128位矢量,SVE2可以支持多倍128位運算,最多2048位,因此SVE2可以增強ML機器學(xué)習(xí)、DSP信號處理能力,提升了未來5G、虛擬現(xiàn)實、增強現(xiàn)實以及CPU本地運行ML的性能,同時ARM未來還會繼續(xù)提升AI人工智能性能。
除了CPU之外,這次還簡單提到了未來的Mali GPU,ARM會增加更多高級功能,比如VRS可變幀率渲染、RT光線追蹤及其他高級渲染技術(shù)等。
在ARMv9中,最重要的一項挑戰(zhàn)其實是數(shù)據(jù)安全,這一次ARM推出了全新的CCA機密計算體系架構(gòu),基于之前的TrustZone安全技術(shù),但引入了動態(tài)域技術(shù),它對操作系統(tǒng)及管理程序來說是完全不透明的,不會被系統(tǒng)或者軟件提權(quán)攻擊,而且依然可以接受管理及調(diào)度。
總之,ARM今天公布的ARMv9指令集極具創(chuàng)新,是未來10年3000多億ARM芯片的基礎(chǔ),不過現(xiàn)在具體的細(xì)節(jié)還很少,只是一個初步的路線圖,今年夏天還會公布更多詳細(xì)內(nèi)容。
至于ARMv9處理器的商業(yè)化,預(yù)計會在2022年早些時候進(jìn)入市場。