在今天凌晨召開的NVIDIA GTC 2021開發(fā)者大會上,NVIDIA CEO黃仁勛正式發(fā)布了旗下首款A(yù)rm服務(wù)器CPU, 代號“Grace”,主要面向超大規(guī)模AI人工智能、HPC高性能計(jì)算,最大特點(diǎn)就是海量的帶寬,號稱是全球首款專為TB級加速計(jì)算而設(shè)計(jì)的CPU。
與此同時(shí),NVIDIA還發(fā)布了基于Arm IP的BlueField-3 DPU,以及集成了Arm IP的首款算力高達(dá)1000TOPS的自動(dòng)駕駛汽車芯片NVIDIA DRIVE Atlan。
黃仁勛在會上也表示:“我們每年都會發(fā)布激動(dòng)人心的新品。三類芯片,逐年飛躍,一個(gè)架構(gòu)。”黃仁勛說,數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類芯片,而Grace和BlueField是其中必不可少的關(guān)鍵組成部分。每個(gè)芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專注于x86平臺,另一年專注于Arm平臺。
NVIDIA首款A(yù)rm服務(wù)器CPU Grace
雖然在大家印象里NVIDIA是一家GPU公司,但早在多年前就曾推出過自己的Tegra系列CPU,甚至還一度進(jìn)入了智能手機(jī)市場。
此次發(fā)布的NVIDIA Grace的名字,取自Grace Hopper——格蕾絲·霍珀女士,她是計(jì)算機(jī)史上最早的程序員之一,也是編譯語言之母,領(lǐng)導(dǎo)開發(fā)了編程語言Cobol。
據(jù)介紹,NVIDIA Grace基于Arm面向數(shù)據(jù)中心的下一代Neoverse內(nèi)核架構(gòu)每個(gè)CPU能在SPECrate2017_int_base基準(zhǔn)測試中單位時(shí)間運(yùn)行超過300個(gè)實(shí)例。
NVIDIA Grace還采用了第四代NVIDIA NVLink技術(shù),從CPU到NVIDIA的GPU連接速度超過900GB/s,達(dá)到相當(dāng)于目前服務(wù)器14倍的帶寬。而從CPU到CPU的連接速率也超過了600GB/s。另外,NVIDIA Grace還擁有目前最高的內(nèi)存帶寬,搭配LPDDR5X內(nèi)存可提供超過500GB/s的帶寬,而且支持ECC錯(cuò)誤校驗(yàn)。
在此次會議上,黃仁勛并未公布NVIDIA Grace具體的核心數(shù)量、頻率、緩存、功耗等數(shù)據(jù)。不過,黃仁勛表示,明年瑞士國家計(jì)算中心(CSCS)和美國洛斯阿拉莫斯國家實(shí)驗(yàn)室分別將推出一款性能強(qiáng)大的AI超級計(jì)算機(jī)面世,都將采用NVIDIA Grace CPU,據(jù)稱其與NVIDIA GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)高出10倍。其中,瑞士國家超級計(jì)算中心(CSCS)、慧與(HPE)將聯(lián)合使用NVIDIA Grace CPU及下一代NVIDIA GPU,共同打造號稱世界最快AI超算的“ALPS”(阿爾卑斯山),算力高達(dá)20ExaFlops(每秒2千億億次計(jì)算),主要用于天氣研究與預(yù)報(bào)、材料科學(xué)等。
據(jù)介紹,NVIDIA Grace處理器計(jì)劃2023年正式推出,2025年將會推出下一代。NVIDIA還同時(shí)強(qiáng)調(diào),會繼續(xù)支持x86架構(gòu),未來將堅(jiān)持x86、Arm兩條路線并行。
新一代數(shù)據(jù)處理器Bluefield-3 DPU
NVIDIA同時(shí)還發(fā)布了新一代數(shù)據(jù)處理器BlueField-3 DPU,為數(shù)據(jù)中心提供強(qiáng)大的軟件定義網(wǎng)絡(luò)、存儲和網(wǎng)絡(luò)安全加速功能。
據(jù)介紹,BlueField-3 DPU的晶體管數(shù)量達(dá)到了220億個(gè),集成了16個(gè)Arm Cortex-A78內(nèi)核、18M IOPs彈性塊存儲。與上一代的BlueField-2 DPU相比,BlueField-3 DPU實(shí)現(xiàn)了10倍的加速計(jì)算性能提升和4倍的加密速度。BlueField-3也是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時(shí)間同步加速的DPU。
一個(gè)BlueField-3 DPU所提供的數(shù)據(jù)中心服務(wù)相當(dāng)于300個(gè)CPU核才能實(shí)現(xiàn)的工作負(fù)載,以400Gbps的速率,對網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速。
BlueField-3可為NVIDIA Morpheus提供實(shí)時(shí)的網(wǎng)絡(luò)可視化、網(wǎng)絡(luò)威脅的檢測與響應(yīng)、以及監(jiān)控、遙測和代理服務(wù),Morpheus是一個(gè)先進(jìn)的基于AI的云原生網(wǎng)絡(luò)安全平臺。
BlueField-3還利用NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開發(fā)包的優(yōu)勢,為開發(fā)者提供一個(gè)完整、開放的軟件平臺,開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理等應(yīng)用。DOCA已于今日發(fā)布并提供下載。
黃仁勛表示: “現(xiàn)代超大規(guī)模云技術(shù)推動(dòng)數(shù)據(jù)中心從基礎(chǔ)上走向了新的架構(gòu), 利用一種專門針對數(shù)據(jù)中心基礎(chǔ)架構(gòu)軟件而設(shè)計(jì)的新型處理器, 來卸載和加速由虛擬化、網(wǎng)絡(luò)、存儲、安全和其它云原生AI服務(wù)產(chǎn)生的巨大計(jì)算負(fù)荷。BlueField DPU正是為此而生。”
BlueField-3是首款為AI和加速計(jì)算而設(shè)計(jì)的DPU,助力各企業(yè)在任何規(guī)模的應(yīng)用上都能實(shí)現(xiàn)領(lǐng)先的性能和數(shù)據(jù)中心的安全性。這款DPU針對多租戶、云原生環(huán)境進(jìn)行了優(yōu)化,提供數(shù)據(jù)中心級的軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理等服務(wù)。
據(jù)介紹,服務(wù)器制造商戴爾、浪潮、聯(lián)想和超微正在將BlueField DPU集成到他們的系統(tǒng)中。全球云服務(wù)供應(yīng)商都在使用BlueField DPU來加速他們的業(yè)務(wù),如百度、京東和UCloud。隨著眾多企業(yè)對BlueField-3的支持,BlueField生態(tài)系統(tǒng)也在不斷擴(kuò)大,這些企業(yè)包括:領(lǐng)先的混合云平臺合作伙伴Canonical、Red Hat和VMware;頭部網(wǎng)絡(luò)安全提供商Fortinet、Guardicore;存儲供應(yīng)商DDN?、NetApp和WekaIO;以及邊緣平臺供應(yīng)商Cloudflare、F5和Juniper Networks。
另外值得一提的是,BlueField-3完全向下兼容BlueField-2,提供更加出色的數(shù)據(jù)中心應(yīng)用轉(zhuǎn)移、加速和隔離性能。BlueField-2有雙端口100Gb/s以太網(wǎng)或雙端口100Gb/s InfiniBand兩種選擇,最多可支持8個(gè)Arm核。BlueField-2 DPU還集成了各種不同的加速引擎來加速軟件定義存儲、網(wǎng)絡(luò)、安全、流媒體、線速TLS/IPSEC加密、5G電信的精確定時(shí)、數(shù)據(jù)中心的時(shí)間同步以及其它云基礎(chǔ)設(shè)施服務(wù)等。
根據(jù)預(yù)計(jì),BlueField-3 DPU將于2022年第一季度發(fā)布樣品,后續(xù)的BlueField-4 DPU將包含640個(gè)晶體管,算力達(dá)1000TOPS,網(wǎng)絡(luò)速率達(dá)800Gbps。
自動(dòng)駕駛汽車芯片DRIVE Atlan
NVIDIA在此次會議上還正式發(fā)布了最新一款智能汽車和自動(dòng)駕駛汽車芯片組——DRIVE Atlan,單顆芯片的算力能夠達(dá)到1000TOPS,這也是業(yè)內(nèi)首款達(dá)到1000TOPS算力的芯片,將應(yīng)用于L4及L5級別自動(dòng)駕駛。
作為參考,上一代Orin算力為254TOPS,而特斯拉自研的芯片算力則為144 TOPS。足以可見,英偉達(dá)Atlan的強(qiáng)大實(shí)力。
Atlan SoC集成了NVIDIA最新的安培架構(gòu)GPU核心、以及Arm架構(gòu)的Grace CPU核心、深度學(xué)習(xí)和計(jì)算機(jī)視覺加速器單元以及BlueField DPU核心,該平臺將實(shí)現(xiàn)每秒執(zhí)行1000萬億次操作(1000 TOPS),是上一代產(chǎn)品的4倍,且預(yù)估其SPECint得分將超過100(SPECrate2017_int),高于當(dāng)今大多數(shù)robotaxi的總計(jì)算量。Atlan還是首款配備NVIDIA BlueField DPU的SoC,可提供可信賴的安全性、高級網(wǎng)絡(luò)和存儲服務(wù)。
Atlan SoC將于2023年向開發(fā)者提供樣品,2025年左右上市的車型就可能搭載。
同時(shí),英偉達(dá)也公布了最新L4級自動(dòng)駕駛開發(fā)車Hyperion 8,車輛搭載2顆英偉達(dá)Orin SoC用作自動(dòng)駕駛計(jì)算,并用1顆Orin SoC監(jiān)測車內(nèi)安全員,同時(shí)用4顆Orin SoC與4顆MLNX芯片記錄3D環(huán)境。
車外傳感器使用8個(gè)800萬像素、4個(gè)300萬像素魚眼攝像頭、3個(gè)座艙內(nèi)攝像頭、9個(gè)毫米波雷達(dá)以及2個(gè)激光雷達(dá)。
這輛開發(fā)車將在今年年底面向開發(fā)者開放。黃仁勛還宣布自動(dòng)駕駛仿真平臺DRIVE Sim將于今年夏季開放使用。
關(guān)于對Arm的收購進(jìn)展
去年10月宣布以400億收購Arm之后,僅6個(gè)月之后,NVIDIA就一口氣發(fā)布了三款基于Arm IP的產(chǎn)品,這也足見NVIDIA對于Arm技術(shù)及其生態(tài)的看重。
值得一提的是,目前Arm服務(wù)器CPU陣營當(dāng)中的兩大玩家——華為和飛騰接連遭到了美國的制裁,這也對于剛有起色的Arm服務(wù)器生態(tài)帶來了不小的打擊。此番NVIDIA的加入確實(shí)有助于Arm服務(wù)器生態(tài)的建設(shè)。但是,如果NVIDIA成功收購了Arm,那么則可能對于Arm生態(tài)建設(shè)帶來負(fù)面的影響。此前不論是Arm聯(lián)合創(chuàng)始人赫爾曼·豪澤,還是眾多的Arm CPU廠商都對此NVIDIA收購Arm表達(dá)了反對意見。
關(guān)于對Arm的收購進(jìn)展,黃仁勛表示,目前收購工作正在穩(wěn)妥有序進(jìn)行。“NVIDIA和各國監(jiān)管部門進(jìn)行了積極有效的溝通,我們相信,監(jiān)管部門會支持NVIDIA收購Arm,因?yàn)檫@有利于市場競爭,有利于半導(dǎo)體行業(yè)的技術(shù)研發(fā),相信這筆交易會在2022年有個(gè)積極正面的結(jié)果。”
值得一提的是,NVIDIA此次還公布了與亞馬遜AWS、Ampere Computing、聯(lián)發(fā)科和Marvell等基于Arm的CPU平臺的合作伙伴關(guān)系與合作進(jìn)展,具體內(nèi)容包括為亞馬遜AWSGraviton2 CPU提供GPU加速、為科學(xué)和AI應(yīng)用開發(fā)提供支持的全新HPC開發(fā)者套件、提升邊緣視頻分析和安全功能、打造新一類基于Arm并搭載NVIDIA RTX GPU的新款PC等。