本周三,Arm發(fā)布了最新一代架構(gòu)Armv9,這一架構(gòu)是在目前已經(jīng)廣泛使用的Armv8的基礎(chǔ)上,面向未來(lái)十年的新一代架構(gòu)。
雷鋒網(wǎng)了解到,Armv9架構(gòu)有三個(gè)系列,分別是針對(duì)通用計(jì)算的A系列,實(shí)時(shí)處理器的R系列,微控制器的M系列,預(yù)計(jì)未來(lái)兩代移動(dòng)基礎(chǔ)設(shè)施CPU的性能提升將超過(guò)30%。首款基于Armv9架構(gòu)CPU的移動(dòng)處理器最快將在今年底問(wèn)世,可能來(lái)自MediaTek。
Armv9架構(gòu)的初代版本增強(qiáng)了安全性、機(jī)器學(xué)習(xí)、DSP性能,Armv9架構(gòu)未來(lái)也將持續(xù)增強(qiáng)這些性能,并將加入新特性。
最近幾年,Arm架構(gòu)處理器已經(jīng)從智能手機(jī)為代表的終端向?qū)π阅芤蟾叩腜C、數(shù)據(jù)中心延伸。從最新的發(fā)布可以看到,Arm希望Armv9架構(gòu) CPU以及基于其GPU、NPU處理器能夠無(wú)處不在。如果Arm的目標(biāo)能夠?qū)崿F(xiàn),是否可以實(shí)現(xiàn)CPU計(jì)算統(tǒng)治?Arm的第三個(gè)1000萬(wàn)出貨目標(biāo)多久能夠達(dá)成?
安全是發(fā)揮計(jì)算架構(gòu)潛能最大的挑戰(zhàn)
Armv9架構(gòu)的發(fā)布會(huì)上,安全性被頻頻提及,與安全相關(guān)的技術(shù)和介紹的篇幅也很長(zhǎng)。Arm高級(jí)副總裁、首席架構(gòu)師兼技術(shù)院士Richard Grisenthwaite解釋稱,“我看來(lái),計(jì)算若要充分發(fā)揮潛能,安全是最大的挑戰(zhàn),越來(lái)越多的私人數(shù)據(jù)被存放在計(jì)算系統(tǒng)中,這讓這些數(shù)據(jù)成為安全攻擊的誘人目標(biāo)。今年網(wǎng)絡(luò)犯罪損失的金額預(yù)估高達(dá)6萬(wàn)億美元。”
因此,Armv9架構(gòu)在安全性方面做了多方面的工作。首先是引入了Arm機(jī)密計(jì)算架構(gòu)(Confidential Compute Architecture, CCA),機(jī)密計(jì)算通過(guò)打造基于硬件的安全運(yùn)行環(huán)境來(lái)執(zhí)行計(jì)算,保護(hù)部分代碼和數(shù)據(jù),免于被存取或修改,甚至不受特權(quán)軟件的影響。
Arm CCA將引入動(dòng)態(tài)創(chuàng)建機(jī)密領(lǐng)域(Realms)的概念,機(jī)密領(lǐng)域面向所有應(yīng)用,運(yùn)行在獨(dú)立于安全或非安全環(huán)境之外的環(huán)境中,實(shí)現(xiàn)保護(hù)數(shù)據(jù)安全的目的。比如,在商業(yè)應(yīng)用中,機(jī)密領(lǐng)域可以保護(hù)系統(tǒng)中商用機(jī)密數(shù)據(jù)和代碼,無(wú)論它們正被使用、閑置或正在傳輸中。
據(jù)悉,Arm會(huì)在今年下半年公布Arm CCA的更多信息。
內(nèi)存標(biāo)簽擴(kuò)展是Armv9架構(gòu)的另一項(xiàng)安全技術(shù)。Richard Grisenthwaite說(shuō):“在分析了全球軟件報(bào)告的大量安全問(wèn)題后,我們發(fā)現(xiàn)許多問(wèn)題的根源實(shí)際上與過(guò)去內(nèi)存安全的老問(wèn)題有關(guān)。這些問(wèn)題已經(jīng)困擾計(jì)算領(lǐng)域50年,兩個(gè)持續(xù)多年特別常見(jiàn)的內(nèi)存安全問(wèn)題——緩存溢出和釋放后重用。很大一部分的問(wèn)題是,這些內(nèi)存安全漏洞被利用之前就能發(fā)現(xiàn)問(wèn)題,這是提高全球軟件安全至關(guān)重要的一步。”
Arm持續(xù)與谷歌合作開(kāi)發(fā)的“內(nèi)存標(biāo)簽擴(kuò)展”技術(shù),可以在軟件中查找空間和時(shí)間內(nèi)存安全的問(wèn)題,允許軟件將指向內(nèi)存的指針與標(biāo)簽建立關(guān)聯(lián),并在使用指針時(shí)檢查這個(gè)標(biāo)簽是否正確。
Richard稱,內(nèi)存標(biāo)簽擴(kuò)展是明年上市的第一代Armv9 CPU不可或缺的一部分。支持內(nèi)存標(biāo)簽擴(kuò)展的軟件也正被引入到安卓11系統(tǒng)和OPENSUSE。
Arm還與劍橋大學(xué)在其CHERI架構(gòu)上合作多年,從架構(gòu)底層來(lái)提升安全性。據(jù)介紹,CHERI架構(gòu)定義了可提供這種封裝能力的硬件功能,這在未來(lái)將可能促成一個(gè)本質(zhì)上更為安全的計(jì)算平臺(tái),但這也會(huì)使某些系統(tǒng)的變成方式產(chǎn)生重大改變。
不過(guò),這種架構(gòu)Arm已經(jīng)在和其合作伙伴探索,如果成功,會(huì)在未來(lái)5-6年引入Armv9架構(gòu),成為Armv9架構(gòu)主要的組件之一。
未來(lái)兩代Armv9架構(gòu)CPU性能提升將超過(guò)30%
安全性是計(jì)算架構(gòu)的基礎(chǔ),性能提升則是滿足越來(lái)越高的計(jì)算需求以及多樣化計(jì)算需求的關(guān)鍵。Arm預(yù)計(jì),新一代架構(gòu)Armv9將保持超過(guò)業(yè)界CPU性能提升的速度,未來(lái)兩代移動(dòng)和基礎(chǔ)設(shè)施CPU的性能提升將超過(guò)30%。
Richard強(qiáng)調(diào):“這個(gè)數(shù)據(jù)是根據(jù)業(yè)界標(biāo)準(zhǔn)評(píng)測(cè)工具來(lái)衡量,30%的算力提升完全是憑借于本身架構(gòu)而不是借助于制程工藝來(lái)實(shí)現(xiàn)。”
計(jì)算性能提升非常重要的驅(qū)動(dòng)力就是AI,Statista Research Department今年1月發(fā)布的最近報(bào)告估計(jì),到21世紀(jì)20年代中期,全球?qū)⒂谐^(guò)80億臺(tái)搭載AI語(yǔ)音輔助的設(shè)備。不同設(shè)備對(duì)于AI性能的需求不同,也就需要不同的AI處理器。
Arm與富士通合作開(kāi)發(fā)了可伸縮矢量擴(kuò)展(Scalable Vector Extension, SVE)技術(shù)并用在了全球最快的超級(jí)計(jì)算機(jī)“富岳”上。在SVE的基礎(chǔ)上,Armv9中使用了新開(kāi)發(fā)的SVE2技術(shù),增強(qiáng)了對(duì)在CPU上本地運(yùn)行的5G系統(tǒng)、虛擬和增強(qiáng)現(xiàn)實(shí)以及ML工作負(fù)載的處理能力,能夠提供實(shí)現(xiàn)增強(qiáng)的機(jī)器學(xué)習(xí)和數(shù)字信號(hào)處理能力。
“我們還將通過(guò)提升頻率、帶寬、緩存大小、并減少內(nèi)存延遲,以最大化CPU 性能。”Richard表示。
在解決新問(wèn)題的過(guò)程中,Arm加入了一些復(fù)雜技術(shù),這是否違背了精簡(jiǎn)指令集(RISC)的初衷?Richard的觀點(diǎn)是:“Arm架構(gòu)的精簡(jiǎn)指令(RISC)核心沒(méi)有改變,我們依然遵循著注冊(cè)到注冊(cè)(registration to registration) 的操作原則,所以從硬件的角度來(lái)看,Arm指令集仍然保持著精益性。”
Arm稱,除了大幅增強(qiáng)CPU內(nèi)的矩陣乘法,Mali GPU和Ethos NPU也會(huì)持續(xù)進(jìn)行AI創(chuàng)新,擴(kuò)展Arm的技術(shù)能力。
統(tǒng)治CPU計(jì)算
目前,CPU領(lǐng)域最成功的架構(gòu)當(dāng)屬x86,不過(guò)x86的成功和統(tǒng)治力在于PC和高性能計(jì)算市場(chǎng),在Arm擅長(zhǎng)的智能終端市場(chǎng)并不成功。近幾年,Arm架構(gòu)在高性能計(jì)算領(lǐng)域取得了一些進(jìn)展,包括上面提到的“富岳”超級(jí)計(jì)算機(jī),以及推出采用Arm架構(gòu)的多款服務(wù)器。去年,蘋果M1處理器Macbook Pro電腦的推出,也讓業(yè)界看到了x86架構(gòu)在PC市場(chǎng)的統(tǒng)治地位并非牢不可破。
Arm首席執(zhí)行官Simon Segars說(shuō),“Arm芯片實(shí)現(xiàn)1000億顆的出貨花了26年,如果預(yù)測(cè)準(zhǔn)確,接下來(lái)一年,我們的合作伙伴出貨的Arm芯片將累計(jì)達(dá)到2000億顆。也就是說(shuō),我們的第二個(gè)1000億的出貨將在短短5年內(nèi)達(dá)成。”
雷鋒網(wǎng)了解到,目前Arm架構(gòu)的芯片出貨已經(jīng)超過(guò)1800億顆,Armv9架構(gòu)會(huì)成為實(shí)現(xiàn)Arm芯片3000億顆芯片出貨的先驅(qū)。沒(méi)有人能準(zhǔn)確預(yù)估Arm實(shí)現(xiàn)第三個(gè)1000億顆芯片出貨的時(shí)間,但可以明確的是Arm希望其芯片能夠?yàn)樗兄悄苡?jì)算提供算力,也就是讓其芯片在未來(lái)無(wú)處不在。
為了實(shí)現(xiàn)這個(gè)目標(biāo),同時(shí)滿足行業(yè)從通用計(jì)算向普遍的專用處理發(fā)展的需求,Arm也開(kāi)始強(qiáng)調(diào)全面計(jì)算的理念。全面計(jì)算設(shè)計(jì)方法包含Arm的CPU、GPU、NPU,通過(guò)將全面計(jì)算的設(shè)計(jì)原則應(yīng)用在包含汽車、客戶端、基礎(chǔ)設(shè)施和物聯(lián)網(wǎng)解決方案的整個(gè)IP組合中。
與此配合,Arm也需要在標(biāo)準(zhǔn)化程度上取得平衡。Richard說(shuō):“如果過(guò)多的標(biāo)準(zhǔn)化,那么合作伙伴將無(wú)法開(kāi)發(fā)合適的專用解決方案。而如果太少的標(biāo)準(zhǔn)化,我們得承擔(dān)低價(jià)值、形同實(shí)異的解決方案的風(fēng)險(xiǎn)。這將讓軟件生態(tài)系統(tǒng)的成本增加、且毫無(wú)益處。”
Arm在服務(wù)器領(lǐng)域中已經(jīng)看到了標(biāo)準(zhǔn)化平衡的價(jià)值,推出了“服務(wù)器基礎(chǔ)架構(gòu)SBSA”和相關(guān)的認(rèn)證計(jì)劃“服務(wù)器就緒”。
“我們也正在擴(kuò)大標(biāo)準(zhǔn)化的范圍,Arm SystemReady將服務(wù)器就緒計(jì)劃的概念從云端延伸到物聯(lián)網(wǎng)邊緣等廣泛的設(shè)備上,以實(shí)現(xiàn)通用操作系統(tǒng)及虛擬機(jī)管理程序之間的交互運(yùn)作。”Richard說(shuō)。
如果Arm的全面計(jì)算以及標(biāo)準(zhǔn)化探索成功,從終端到邊緣再到云端,Arm是否就能夠?qū)崿F(xiàn)在未來(lái)的計(jì)算統(tǒng)治?實(shí)現(xiàn)3000億顆甚至更多芯片出貨又會(huì)有多快呢?
小結(jié)
現(xiàn)在看來(lái),有兩大方面的阻礙,一方面是在復(fù)雜的國(guó)際形勢(shì)下,同屬精簡(jiǎn)指令集的RISC-V正在快速發(fā)展,加上x(chóng)86陣營(yíng)intel和AMD也在加強(qiáng)x86的競(jìng)爭(zhēng)力,Arm要真正撼動(dòng)x86的優(yōu)勢(shì)領(lǐng)域并非易事。
另一方面,中國(guó)作為芯片進(jìn)口的大國(guó),Arm與Nvidia的收購(gòu)交易,以及美國(guó)對(duì)中國(guó)領(lǐng)先芯片設(shè)計(jì)公司的出口限制,讓客戶產(chǎn)生擔(dān)憂。
對(duì)于Armv9是否以供給包括華為在內(nèi)的中國(guó)企業(yè)的問(wèn)題,Arm的官方回復(fù)是:“Arm既有源于美國(guó)的IP,也有非源于美國(guó)的IP。經(jīng)過(guò)全面的審查,Arm確定其Armv9架構(gòu)不受美國(guó)出口管理?xiàng)l例(EAR)的約束。Arm已將此通知美國(guó)政府相關(guān)部門,我們將繼續(xù)遵守美國(guó)商務(wù)部針對(duì)華為及其附屬公司海思的指導(dǎo)方針。”
這樣的回復(fù),不知你怎么看?