英偉達(dá)B200芯片及新架構(gòu)發(fā)布,加碼具身智能
發(fā)布最強芯片B200,可組超級芯片GB200
英偉達(dá)全新推出的GPU平臺Blackwell,兼容Hopper的普通系統(tǒng)以及連接Grace CPU的專用系統(tǒng)。
該平臺催生了B200芯片,其晶體管數(shù)量高達(dá)2080億,遠(yuǎn)超H100的800億。
這一顯著增長意味著B200芯片具有強大的并行計算能力,英偉達(dá)宣稱其為全球領(lǐng)先的人工智能芯片。
B200能夠在十萬億級參數(shù)模型上實現(xiàn)高效的AI訓(xùn)練和實時的LLM(大語言模型)推理。
B200由兩個超大型Die(裸片)封裝組合而成,內(nèi)含超過2080億個晶體管,較前一代的800億個晶體管數(shù)量翻了一番。
此外,整塊芯片還封裝有192GB高速HBM3e顯存,以滿足高性能計算的需求。
通過將Grace CPU與兩個B200 GPU結(jié)合,形成了超級芯片GB200。
與H00芯片相比,GB200為大模型推理負(fù)載提供了30倍的性能提升,同時降低了25%的成本和能耗。
與相同數(shù)量的英偉達(dá)H100 Tensor Core GPU相比,GB200 NVL72在LLM推理工作負(fù)載方面的性能最多可提升30倍,成本和能耗最多可降低25倍。
此外,英偉達(dá)還發(fā)布了基于GB200的DGX Super Pod一站式AI超算解決方案。
該方案采用高效液冷機架,配置8套DGX GB200系統(tǒng),即288顆Grace CPU和576顆B200 GPU,內(nèi)存總量達(dá)240TB。
其FP4精度計算性能高達(dá)每秒11.5百億億次,相比上一代產(chǎn)品,推理性能提升30倍,訓(xùn)練性能提升4倍。
值得注意的是,英偉達(dá)此次轉(zhuǎn)向多芯片設(shè)計,放棄了傳統(tǒng)的單體芯片策略。
這一轉(zhuǎn)變源于B200所采用的臺積電改進(jìn)版N4P工藝,在晶體管密度上并未實現(xiàn)顯著突破。
與此同時,H100芯片已接近其理論最大尺寸。因此,采用雙芯片設(shè)計似乎是一種合理的選擇。
[Blackwell]成為下一代AI平臺
Blackwell是一款專為數(shù)據(jù)中心設(shè)計的先進(jìn)芯片平臺,針對當(dāng)前熱門的AI大模型進(jìn)行優(yōu)化,顯著提升了訓(xùn)練和推理性能以及能效。
與英偉達(dá)的Grace CPU和新一代網(wǎng)絡(luò)芯片等產(chǎn)品相結(jié)合,Blackwell共同構(gòu)成了一個完整的生成式AI解決方案。
Blackwell不僅僅是一款芯片,更是一個全新的技術(shù)平臺。
基于該平臺,英偉達(dá)衍生出了包括GPU、AI超級芯片、服務(wù)器、大型計算集群和云服務(wù)在內(nèi)的多套解決方案,為用戶提供全方位的技術(shù)支持。
新款GPU架構(gòu)[Blackwell]以美國數(shù)學(xué)家David Harold Blackwell命名,其中的GPU芯片B200采用了臺積電4NP制造工藝。
在訓(xùn)練方面,Blackwell架構(gòu)展示了顯著效率。以往90天內(nèi),訓(xùn)練一個1.8萬億參數(shù)規(guī)模的模型需要8000個Hopper架構(gòu)的GPU,并消耗15兆瓦的功率。
而現(xiàn)在,僅需2000個Blackwell架構(gòu)的GPU,功率降低至4兆瓦,即可在相同時間內(nèi)完成任務(wù)。
在推理領(lǐng)域,Blackwell架構(gòu)的芯片性能是先前Hopper架構(gòu)芯片的30倍。
除了硬件性能的提升,Blackwell還引入了第二代Transformer引擎。
該引擎通過為每個神經(jīng)元使用4位而不是8位,實現(xiàn)了計算、帶寬和模型大小的兩倍提升。
同時,配備的第五代NVLink技術(shù)為每個GPU提供了1.8TB/s的雙向吞吐量,確保了多達(dá)576個GPU之間的無縫高速通信。
目前,亞馬遜云科技、戴爾科技、谷歌、Meta、微軟、OpenAI、甲骨文、特斯拉和xAI等知名企業(yè)已計劃采用Blackwell產(chǎn)品,以推動其AI技術(shù)和應(yīng)用的進(jìn)一步發(fā)展。
發(fā)布人形機器人,加碼具身智能
英偉達(dá)在達(dá)到上一個萬億市值的過程中,主要得益于其在GPU與算力領(lǐng)域的卓越表現(xiàn)。展望未來,公司預(yù)測機器人開發(fā)領(lǐng)域?qū)⒊蔀槠涫兄翟鲩L的新動力。
今年初,英偉達(dá)資深科學(xué)家Jim Fan宣布成立GEAR工作室,其研究成果和研究環(huán)境為英偉達(dá)的新機器人解決方案奠定了堅實的基礎(chǔ)。
英偉達(dá)近期發(fā)布了名為Project GR00T的人形機器人基礎(chǔ)模型。這一模型具備通用性,可以作為機器人的核心處理器,使機器人具備學(xué)習(xí)和執(zhí)行各種任務(wù)的能力。
通過語言、視頻和人類演示,GR00T能夠理解自然語言,模仿人類動作,并快速學(xué)習(xí)協(xié)調(diào)性、靈活性以及其他技能,從而與現(xiàn)實世界融合并與人類進(jìn)行互動。
此外,英偉達(dá)對其針對機器人市場的Isaac機器人平臺進(jìn)行了重大更新。
新推出的Jetson Thor人形機器人計算機,基于Thor芯片,能夠執(zhí)行復(fù)雜任務(wù)并處理多個傳感器數(shù)據(jù)。
該計算機具備每秒800萬億次8位浮點運算的AI性能,可以運行GR00T等多模態(tài)生成式AI模型,并簡化設(shè)計和集成流程。
英偉達(dá)正在構(gòu)建三大平臺——IAI、Omniverse和ISAAC,這些平臺均與機器人產(chǎn)業(yè)緊密相關(guān)。
IAI搭載DGX系列產(chǎn)品,用于模擬物理世界;Omniverse搭載RTX和OVX系列產(chǎn)品,驅(qū)動數(shù)字孿生的計算系統(tǒng);而ISAAC則搭載AGX系列,驅(qū)動人工智能機器人。
同時,ISAAC Lab整合了ISAAC MANIPULATOR加速庫平臺和ISAAC PERCEPTOR軟件庫,分別用于提升機械臂的靈敏度和精確度以及服務(wù)機器人的感知能力。
英偉達(dá)透露,他們正在與多家人形機器人公司合作開發(fā)一個綜合AI平臺,包括1X Technologies、Agility Robotics、Apptronik、波士頓動力公司、Figure AI、傅利葉智能、Sanctuary AI、宇樹科技和小鵬鵬行等。
這一戰(zhàn)略舉措有望為英偉達(dá)帶來下一個萬億市值的增長空間。
結(jié)尾:
在黃仁勛看來,英偉達(dá)站在計算科學(xué)和物理等一切科學(xué)的交叉點,成為新工業(yè)革命的引擎。
除了硬件系統(tǒng),英偉達(dá)也利用生成式 AI 構(gòu)建了一系列元宇宙、工業(yè)數(shù)字孿生、機器人訓(xùn)練軟件體系。
如今,黃仁勛已經(jīng)在生成式AI領(lǐng)域拔得頭籌,帶領(lǐng)著下一場工業(yè)革命的開啟。
