11月11日,英特爾正式發(fā)布其全新服務(wù)器GPU,即首款數(shù)據(jù)中心的獨(dú)顯產(chǎn)品,該服務(wù)器基于Xe LP微架構(gòu),專為高密度、低時(shí)延的安卓云游戲和流媒體服務(wù)而設(shè)計(jì)。同時(shí),英特爾還宣布將于12月正式交付相應(yīng)的軟件堆棧oneAPI Gold工具。
英特爾此次同時(shí)推出了全新服務(wù)器GPU和oneAPI軟件,意味著英特爾開始釋放XPU的強(qiáng)大實(shí)力。
英特爾率先定義XPU時(shí)代
10年前,美國數(shù)據(jù)科學(xué)家舍恩伯格在《大數(shù)據(jù)時(shí)代》一書中對(duì)“大數(shù)據(jù)時(shí)代”作出系統(tǒng)闡釋。
10年后,互聯(lián)網(wǎng)、人工智能、云計(jì)算的發(fā)展正飛速推動(dòng)全球數(shù)據(jù)量的增長。國際數(shù)據(jù)公司IDC統(tǒng)計(jì)顯示,預(yù)計(jì)到2025年,全球數(shù)據(jù)量將比2016年的16.1 ZB(1 ZB=十萬億字節(jié))增加10倍,達(dá)到163 ZB。
盡管越來越多的數(shù)據(jù)讓現(xiàn)代人置身于信隱私泄露的恐慌之中,但不可否認(rèn)的是,大數(shù)據(jù)正為硬件、軟件乃至服務(wù)等市場(chǎng)帶來前所未有的經(jīng)濟(jì)增長。
中國通信院發(fā)布的《大數(shù)據(jù)白皮書(2019)》顯示,預(yù)計(jì)到2020年,全球大數(shù)據(jù)硬件、軟件和服務(wù)的市場(chǎng)規(guī)模將分別達(dá)到150億美元、200億美元和210億美元。這意味著基于大數(shù)據(jù),將產(chǎn)生一個(gè)全球范圍內(nèi)價(jià)值560億美元的市場(chǎng)。
但在這之前需要解決一個(gè)關(guān)鍵問題,在單一芯片算力受限的情況下,如何更好地發(fā)揮海量數(shù)據(jù)的真正價(jià)值?
對(duì)于這一問題,英特爾早已給出了答案。2015年,英特爾就開始斥資167億美元收購當(dāng)時(shí)全球第二大FPGA廠商Altera,此后,又接連收購主攻深度學(xué)習(xí)方向的Nervana Systems、計(jì)算視覺公司Movidius、自動(dòng)駕駛視覺處理公司Mobileye和云端AI推理芯片已經(jīng)商用的Habana Labs。
英特爾成為業(yè)界唯一一家擁有全類別AI芯片的公司之后,緊接著吸納業(yè)界頂尖的芯片人才,并于2018年架構(gòu)日提出制程、封裝、架構(gòu)、存儲(chǔ)、互聯(lián)、安全、軟件的六大技術(shù)戰(zhàn)略。
2018年的架構(gòu)日在英特爾歷史上具有劃時(shí)代的意義,XPU異構(gòu)愿景就誕生于此,即由標(biāo)量(Scalar)、矢量(Vector)、矩陣(Matrix)、空間(Spatial)組成的SVMS架構(gòu),分別對(duì)應(yīng)CPU、GPU、加速器和FPGA,可以進(jìn)行多種異構(gòu)組合。
這是英特爾首次、也是業(yè)界首次明確將單一架構(gòu)之后的發(fā)展方向定義為XPU。
英特爾數(shù)據(jù)中心XPU產(chǎn)品和解決方案副總裁Jeff McVeigh表示:“XPU戰(zhàn)略的提出,在于我們意識(shí)到需要不同類型的架構(gòu)來服務(wù)于各種不同的工作負(fù)載,其中一些工作負(fù)載在本質(zhì)上是標(biāo)量的,另一些是向量、矩陣、空間等等。”
從Xe架構(gòu)到獨(dú)立顯卡,實(shí)現(xiàn)XPU愿景的重要一步
英特爾在XPU戰(zhàn)略上進(jìn)展迅速,在其它芯片公司還處于大規(guī)模并購階段時(shí),就已經(jīng)基于其豐富的技術(shù)經(jīng)驗(yàn)推出了自有的首款面向數(shù)據(jù)中心的獨(dú)顯產(chǎn)品。
英特爾表示,這款GPU采用的是英特爾能效最高的圖形架構(gòu),英特爾Xe LP微架構(gòu),擁有低功耗、獨(dú)立片上系統(tǒng)(SoC)設(shè)計(jì),并配備128比特管道和8GB專用板載低功耗DDR4顯存。
另外,如果將英特爾服務(wù)器GPU同英特爾至強(qiáng)可擴(kuò)展處理器組合,服務(wù)提供商可以在不改變服務(wù)器數(shù)量的情況下,單獨(dú)擴(kuò)展顯卡容量,得以在每個(gè)系統(tǒng)上支持更多流和訂閱用戶,并且同時(shí)實(shí)現(xiàn)較低的總體擁有成本(TCO)。
通過在新華三3/4長、全高的x16 PCIe 3.0擴(kuò)展卡內(nèi)封裝四個(gè)英特爾服務(wù)器GPU,即可在一個(gè)典型雙卡系統(tǒng)中支持超過100個(gè)安卓云游戲并發(fā)用戶。這一數(shù)量最高可擴(kuò)展至160個(gè)并發(fā)用戶,實(shí)際數(shù)量取決于具體的游戲和服務(wù)器配。
之所以說英特爾XPU戰(zhàn)略進(jìn)展迅速,是因?yàn)槠鋸?019年底發(fā)布Xe架構(gòu)到推出基于Xe架構(gòu)的集成GPU和獨(dú)立GPU產(chǎn)品,以及用于數(shù)據(jù)中心獨(dú)顯產(chǎn)品,間隔時(shí)間不到一年,就兌現(xiàn)了產(chǎn)品交付計(jì)劃。
事實(shí)上,Xe架構(gòu)作為一個(gè)基礎(chǔ)GPU架構(gòu),屬性靈活且擴(kuò)展性強(qiáng),能夠衍生出多種針對(duì)不同領(lǐng)域和場(chǎng)景的GPU產(chǎn)品。
在英特爾2020年架構(gòu)日上,英特爾官方首次詳細(xì)介紹了可實(shí)現(xiàn)全擴(kuò)展的Xe圖形架構(gòu)。按照不同的應(yīng)用場(chǎng)景分,可將Xe架構(gòu)分成四個(gè)系列:Xe LP、Xe HP、Xe HPC和Xe HPG。
Xe LP屬于低功耗系列,是針對(duì)PC和移動(dòng)計(jì)算平臺(tái)的最高效架構(gòu),最高配置EU單元多達(dá)96組,并具有新架構(gòu)設(shè)計(jì),包括異步計(jì)算、視圖實(shí)例化 (view instancing)、采樣器反饋(sampler feedback)、帶有AV1的更新版媒體引擎以及更新版顯示引擎等。TigerLake SoC里集成的GPU、英特爾銳炬 Xe MAX 獨(dú)立顯卡和此次發(fā)布的面向數(shù)據(jù)中心的獨(dú)顯產(chǎn)品均采用這一架構(gòu)。
作為首批使用英特爾首款數(shù)據(jù)中心獨(dú)顯產(chǎn)品的客戶之一,騰訊先游云游戲總經(jīng)理方亮認(rèn)為:“SG1的編碼能力非常強(qiáng),它能夠提供一個(gè)高密度、低延遲、靈活多樣的視頻編碼能力,另外在我們所測(cè)試的產(chǎn)品中,英特爾SG1的性價(jià)比高,英特爾技術(shù)團(tuán)隊(duì)的支持也非常給力。”
Xe HP屬于高性能系列,是業(yè)界首個(gè)多區(qū)塊(multi-tiled)、高度可擴(kuò)展的高性能架構(gòu),可提供數(shù)據(jù)中心級(jí)、機(jī)架級(jí)媒體性能,GPU可擴(kuò)展性和AI優(yōu)化。目前處于同客戶共同測(cè)試的階段,Xe HP產(chǎn)品將于明年推出。
Xe HPC屬于高性能計(jì)算系列,可用于超級(jí)計(jì)算機(jī)。Xe HPG是一種為游戲優(yōu)化的微架構(gòu),將具有加速的光線跟蹤支持,Xe HPG產(chǎn)品預(yù)計(jì)將于2021年開始發(fā)貨。
天下大同oneAPI,實(shí)現(xiàn)XPU的“靈魂互通”
一般而言,基于底層硬件架構(gòu)的不同,完成同一項(xiàng)開發(fā)往往需要開發(fā)者使用不同的代碼重寫一次,需要付出極大的人力成本和財(cái)力成本。如果將硬件層面XPU的實(shí)現(xiàn)比喻成一個(gè)語言互不相通的團(tuán)隊(duì),那么要想更好地釋放團(tuán)體的真正實(shí)力,還需要一臺(tái)能夠降低隊(duì)員們溝通成本,甚至能夠?qū)崿F(xiàn)“靈魂互通”的機(jī)器。
雖然從生物算法的角度,目前還沒有辦法實(shí)現(xiàn)意識(shí)和“靈魂”的交換和交流,計(jì)算機(jī)應(yīng)用程序的跨平臺(tái)優(yōu)化也一直是業(yè)界難點(diǎn),但對(duì)于XPU而言,英特爾已經(jīng)開發(fā)出幫助XPU團(tuán)隊(duì)釋放真正實(shí)力的工具,即英特爾軟件級(jí)oneAPI工具包。
英特爾官方表示,如果用上了oneAPI工具包,開發(fā)者就能夠訪問英特爾XPU的通用、開放且基于行業(yè)標(biāo)準(zhǔn)高的編程模型,釋放底層硬件性能的同時(shí)降低軟件開發(fā)和維護(hù)成本。
同時(shí),Jeff也告訴雷鋒網(wǎng):“oneAPI能夠把人們熟悉的語言和庫上的代碼,比如所有目前已經(jīng)在至強(qiáng)處理器上運(yùn)行的代碼,無縫地遷移到GPU和其他的架構(gòu)上。所以它確實(shí)有很多好處,比如代碼重用,能夠利用現(xiàn)有的庫等等。如果你已經(jīng)熟悉了一些庫,比如TBB和其他來自英特爾的庫,我們把它們進(jìn)行了擴(kuò)展以支持多種架構(gòu)。這樣已經(jīng)使用過這些庫的開發(fā)者可以繼續(xù)做開源,支持GPU和其他XPU架構(gòu)。”
“oneAPI讓你不必有兩種不同的配置,兩種不同的構(gòu)建,但是能夠在設(shè)計(jì)點(diǎn)之間為完全相同的服務(wù)提供一些靈活性。”英特爾數(shù)據(jù)平臺(tái)事業(yè)部副總裁,視覺基礎(chǔ)架構(gòu)事業(yè)部和NPG戰(zhàn)略總經(jīng)理LynnComp補(bǔ)充道。
oneAPI是英特爾在SuperComputing2019大會(huì)上首次提出且為實(shí)現(xiàn)統(tǒng)一、簡化的跨架構(gòu)編程模型的一個(gè)愿景,即不受限于單一廠商專用的代碼構(gòu)建,且能實(shí)現(xiàn)源有代碼的集成。借助oneAPI,開發(fā)者可以針對(duì)他們要解決的特定問題選擇最佳的加速器架構(gòu),且無需為此一個(gè)架構(gòu)和平臺(tái)再重寫軟件。
英特爾初次提出這一愿景時(shí),很多人認(rèn)為其實(shí)現(xiàn)難度大,能夠完成的可能性幾乎為零。但今天英特爾卻如期交付了oneAPI開發(fā)者工具包,足以證明其軟件實(shí)力。
英特爾宣布,英特爾oneAPI工具包將于12月在本地和英特爾DevCould上免費(fèi)提供,同時(shí)還將提供包括英特爾技術(shù)咨詢工程師全球支持的商業(yè)版本。英特爾還會(huì)將英特爾Parallel Studio XE和英特爾System Studio工具套件遷移到oneAPI產(chǎn)品中。
值得一提的是,即便沒有使用英特爾的芯片,oneAPI也能包容和支持,具有實(shí)現(xiàn)“天下大同”的能力,擁有廣泛的生態(tài)系統(tǒng),這也促使oneAPI得到更加廣泛的業(yè)界支持。近期,微軟Azure和谷歌的TensorFlow已經(jīng)宣布支持oneAPI,眾多領(lǐng)先的研究機(jī)構(gòu)、公司和大學(xué)也支持oneAPI。
雷鋒網(wǎng)小結(jié)
從收購FPGA公司到吸納圖形處理器頂尖人才,從發(fā)展單一架構(gòu)到定義XPU時(shí)代,從Xe架構(gòu)提出到如期交付產(chǎn)品,近些年英特爾一直在釋放大數(shù)據(jù)潛力的產(chǎn)業(yè)領(lǐng)域探索,如今成長為業(yè)界唯一一家能夠提供XPU芯片的全能性公司,且能為其應(yīng)將提供相適配的軟件、應(yīng)用程序和生態(tài),英特爾在數(shù)據(jù)在數(shù)據(jù)中心擁有獨(dú)一無二的實(shí)力。
未來的英特爾,又會(huì)在實(shí)現(xiàn)XPU的路上取得什么樣的成績呢?
關(guān)鍵詞: