英偉達(dá)并非沒(méi)有對(duì)手,英特爾發(fā)布最新AI芯片
4月9日,英特爾推出了其最新的人工智能芯片Gaudi 3。這家芯片制造商急于生產(chǎn)可以訓(xùn)練和部署大型AI模型的半導(dǎo)體,例如支持OpenAI的ChatGPT的模型。
新的 Gaudi 3 芯片的能效是英偉達(dá)前一代產(chǎn)品H100 GPU的兩倍多,并且可以比H100 GPU 快一倍半。同時(shí)Gaudi 3 還有不同的配置,例如在一塊主板上捆綁八個(gè) Gaudi 3 芯片或可以插入現(xiàn)有系統(tǒng)的卡。
英特爾在Meta 的開(kāi)源 Llama 和阿布扎比支持的 Falcon 等模型上測(cè)試了該芯片。Gaudi 3可以幫助訓(xùn)練或部署模型,包括Stable Diffusion或OpenAI的Whisper語(yǔ)音識(shí)別模型。
英特爾表示,其芯片使用的功率低于英偉達(dá)的芯片。
據(jù)估計(jì),英偉達(dá)擁有80%的AI芯片市場(chǎng),其圖形處理器(GPU)在過(guò)去一年中一直是AI構(gòu)建者的首選高端芯片。
新的Gaudi 3芯片將在第三季度向客戶提供,包括惠普、超微等在內(nèi)的公司將使用這些芯片構(gòu)建系統(tǒng)。但是英特爾沒(méi)有提供 Gaudi 3 的價(jià)格范圍。
運(yùn)行生成式 AI 和購(gòu)買 Nvidia GPU 可能很昂貴,不少公司正在尋找其他供應(yīng)商來(lái)幫助降低成本。除了性能、功耗外,Gaudi 3具有競(jìng)爭(zhēng)力的價(jià)格、獨(dú)特的開(kāi)放式集成片上網(wǎng)絡(luò),正在使用行業(yè)標(biāo)準(zhǔn)的以太網(wǎng)。通過(guò)超級(jí)以太網(wǎng)聯(lián)盟 (UEC),英特爾正在引領(lǐng)面向 AI 架構(gòu)的開(kāi)放式以太網(wǎng)網(wǎng)絡(luò)。該公司推出了一系列人工智能優(yōu)化的以太網(wǎng)解決方案,包括AI NIC(網(wǎng)絡(luò)接口卡)和人工智能連接小芯片。
隨著云提供商和企業(yè)建立基礎(chǔ)設(shè)施來(lái)部署人工智能軟件,數(shù)據(jù)中心人工智能市場(chǎng)也有望增長(zhǎng),這表明即使英偉達(dá)繼續(xù)制造絕大多數(shù)人工智能芯片,其他競(jìng)爭(zhēng)對(duì)手仍有發(fā)展空間。
為減少對(duì)英偉達(dá)依賴,谷歌推出ARM服務(wù)器芯片
與微軟、亞馬遜一樣,谷歌也推出了多款自研芯片,以減少對(duì)英偉達(dá)GPU芯片的依賴。
美東時(shí)間4月9日周二,谷歌在今年的年度云計(jì)算大會(huì)Cloud Next 2024上宣布推出一款基于Arm架構(gòu)的數(shù)據(jù)中心芯片Google Axion,以及更新TPU v5p芯片。
谷歌表示表示,Google Axion處理器基于Arm Neoverse V2 CPU構(gòu)建,以Titanium為基礎(chǔ),性能比通用ARM芯片高30%,而且比英特爾生產(chǎn)的當(dāng)前一代 x86芯片高50%。預(yù)計(jì)Axion用于多種谷歌服務(wù),并在“今年晚些時(shí)候”向公眾開(kāi)放。
谷歌云副總裁兼計(jì)算和機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施總經(jīng)理 Mark Lohmeyer 表示:“我們正在讓客戶輕松地將現(xiàn)有工作負(fù)載轉(zhuǎn)移到 ARM。Axion 建立在開(kāi)放基礎(chǔ)之上,在任何地方使用ARM的客戶都可以輕松采用 Axion,而無(wú)需重新架構(gòu)或重新編寫(xiě)應(yīng)用程序?!?/span>
“谷歌推出的新型 Axion CPU 標(biāo)志著交付定制芯片的一個(gè)重要里程碑,該芯片針對(duì)谷歌的基礎(chǔ)設(shè)施進(jìn)行了優(yōu)化,并構(gòu)建在我們的高性能 Arm Neoverse V2 平臺(tái)上。數(shù)十年的生態(tài)系統(tǒng)投資,再加上 Google 的持續(xù)創(chuàng)新和開(kāi)源軟件貢獻(xiàn),確保為在各地運(yùn)行 Arm 的客戶最重要的工作負(fù)載提供最佳體驗(yàn)。”Arm 首席執(zhí)行官 Rene Haas表示。
事實(shí)上,Axion 只是眾多定制發(fā)一份芯片中的最新產(chǎn)品。自2015年以來(lái),谷歌已經(jīng)發(fā)布了五代張量處理單元(TPU);同時(shí),2018年,谷歌發(fā)布了第一個(gè)視頻編碼單元 (VCU),視頻轉(zhuǎn)碼效率提高了33 倍;另外,2021年,谷歌通過(guò)投資“片上系統(tǒng)”(SoC) 設(shè)計(jì),加大了定制計(jì)算的投入,并發(fā)布了用于移動(dòng)設(shè)備的三代Tensor芯片中的第一款。
如今,谷歌推出新的芯片意味著,該公司正在追趕亞馬遜和微軟這些云領(lǐng)域競(jìng)爭(zhēng)對(duì)手的步伐。亞馬遜和微軟2021年就已經(jīng)推出Arm架構(gòu)的CPU,作為提供差異化計(jì)算服務(wù)的一種方式。而谷歌之前為YouTube、AI及其智能手機(jī)推出過(guò)定制芯片,但還沒(méi)有打造過(guò)CPU。
具體來(lái)說(shuō),Axion將適用于一系列任務(wù),包括支持谷歌的搜索引擎和 AI 相關(guān)的工作。谷歌表示,該芯片可以通過(guò)幫助處理大量數(shù)據(jù)并為數(shù)十億用戶部署服務(wù),在AI領(lǐng)域發(fā)揮重要的支持作用。同時(shí),未來(lái)谷歌逐步轉(zhuǎn)移到基于Arm云服務(wù)器用例上使用,Datadog、Elastic、OpenX 和 Snap都計(jì)劃采用 Axion。
除了Axion之外,谷歌還宣布全面推出 TPU v5p,用于訓(xùn)練和推理的最強(qiáng)大、可擴(kuò)展且靈活的 AI 加速器,其計(jì)算能力是上一代的 4 倍(400%)。
谷歌CEO桑達(dá)爾·皮查伊表示,生成式 AI的進(jìn)步需要強(qiáng)大的底層基礎(chǔ)設(shè)施。谷歌 AI 超級(jí)計(jì)算機(jī)結(jié)合了我們的 TPU、GPU、AI 軟件等,為訓(xùn)練和服務(wù)模型提供性能和成本優(yōu)勢(shì)。如今,領(lǐng)先 AI 公司和 Google Cloud 客戶(例如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI)正在使用其基礎(chǔ)設(shè)施。
數(shù)據(jù)顯示,雖然廣告依然是谷歌最大收入源,但云計(jì)算的增長(zhǎng)更快,在谷歌的收入中占比不斷提高,已接近占公司總收入的11%。據(jù)Gartner估算,2022 年,谷歌占云基礎(chǔ)設(shè)施市場(chǎng) 7.5% 的份額,而亞馬遜和微軟合計(jì)控制著 62% 左右的份額。
谷歌表示,現(xiàn)在已經(jīng)有超過(guò) 90% 的 AI 獨(dú)角獸企業(yè)在使用谷歌的計(jì)算資源、模型和開(kāi)發(fā)環(huán)境。
如今,谷歌成為繼微軟和亞馬遜之后,第三家用ARM架構(gòu)推出數(shù)據(jù)中心CPU的科技巨頭,這顯示了新的趨勢(shì)。而且,谷歌還利用TPU優(yōu)勢(shì),全面提供服務(wù)器和數(shù)據(jù)中心閉環(huán)服務(wù),降低英偉達(dá)、英特爾、AMD芯片的依賴。
有評(píng)論稱,谷歌開(kāi)發(fā)新芯片是在 AI 競(jìng)賽白熱化之際減少對(duì)外部廠商的依賴。不過(guò),谷歌的官員并沒(méi)有將芯片新品視為一種競(jìng)爭(zhēng)之舉。谷歌負(fù)責(zé)自研芯片業(yè)務(wù)的副總Amin Vahdat說(shuō):“我覺(jué)得這是做大蛋糕的基礎(chǔ)?!?/span>
大規(guī)模AI計(jì)算已經(jīng)進(jìn)入系統(tǒng)競(jìng)賽
在Intel Vision大會(huì)上,“生成式AI”這一主題可以說(shuō)是貫穿全程,從數(shù)據(jù)中心的大規(guī)模AI訓(xùn)練與推理,到AI PC改變端側(cè)生產(chǎn)力,英特爾正竭力展示自己作為先進(jìn)芯片技術(shù)領(lǐng)導(dǎo)者的競(jìng)爭(zhēng)力。
如今談到大模型訓(xùn)練芯片,英偉達(dá)當(dāng)仁不讓是首選供應(yīng)商,但這棵搖錢樹(shù)早已被其他芯片大廠和創(chuàng)業(yè)新秀盯上,英特爾便是其中之一。英特爾正通過(guò)推出更具性價(jià)比的可擴(kuò)展系統(tǒng)來(lái)打破這種一家獨(dú)大的局面,這將為市場(chǎng)帶來(lái)另一種選擇。
大規(guī)模AI計(jì)算已經(jīng)進(jìn)入系統(tǒng)競(jìng)賽,無(wú)論是守擂者英偉達(dá),還是英特爾、AMD、Cerebras、Groq等追擊者,都明顯加大對(duì)先進(jìn)Chiplet封裝、先進(jìn)存儲(chǔ)、先進(jìn)互連技術(shù)的重視,通過(guò)從超越制程和reticle極限的芯片內(nèi)部設(shè)計(jì)優(yōu)化,到擴(kuò)展至大型集群系統(tǒng)的技術(shù)升級(jí),為整個(gè)數(shù)據(jù)中心的AI計(jì)算提供更高性能和能效的加速。
除了Gaudi 3,英特爾還在Intel Vision大會(huì)上分享了數(shù)據(jù)中心至強(qiáng)處理器和AI PC的進(jìn)展,并現(xiàn)場(chǎng)連線遠(yuǎn)在英特爾晶圓廠的同事,演示如何在AI PC上用先進(jìn)AI技術(shù)輔助芯片檢測(cè)。
英特爾宣布面向數(shù)據(jù)中心、云和邊緣的下一代處理器進(jìn)行品牌煥新,即英特爾至強(qiáng)6。配備能效核的至強(qiáng)6(此前代號(hào)為Sierra Forest)將于2024年第二季度推出,配備性能核的至強(qiáng)6(此前代號(hào)為Granite Rapids)將緊隨其后推出。
配備性能核的英特爾至強(qiáng)6包含了對(duì)MXFP4數(shù)據(jù)格式的軟件支持,與使用FP16的第四代至強(qiáng)處理器相比,可將下一個(gè)token的延遲時(shí)間縮短至原來(lái)的15%,能運(yùn)行700億參數(shù)Llama-2模型。
英特爾預(yù)計(jì)將于今年出貨4000萬(wàn)臺(tái)AI PC,以及超過(guò)230種的設(shè)計(jì),覆蓋輕薄PC和游戲掌機(jī)設(shè)備。新一代英特爾酷睿Ultra客戶端處理器家族(代號(hào)Lunar Lake)將于今年推出,具備超過(guò)100 TOPS平臺(tái)算力,NPU算力超過(guò)46TOPS。
英偉達(dá)的“鐵王座”還能做多久?
AI浪潮已經(jīng)勢(shì)不可擋,AI芯片作為其發(fā)展的底層基石也迎來(lái)了前所未有的機(jī)遇。據(jù)Gartner最新預(yù)測(cè),到2024年AI芯片市場(chǎng)規(guī)模將較上一年增長(zhǎng)25.6%,達(dá)671億美元。預(yù)計(jì)到2027年,AI芯片市場(chǎng)規(guī)模將是2023年規(guī)模的兩倍以上,達(dá)到1194億美元。
在這樣的背景下,“算力霸主”英偉達(dá)被捧上神壇,以高達(dá)80%的占有率幾乎壟斷了市場(chǎng),賺得盆滿缽滿。英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)的營(yíng)收再創(chuàng)新高,帶動(dòng)2024年財(cái)年Q4季度總營(yíng)收狂漲265%。由于這份遠(yuǎn)超預(yù)期的財(cái)報(bào)數(shù)據(jù),英偉達(dá)一夜?jié)q出2770億美金市值,相當(dāng)于:一夜?jié)q出阿里巴巴+百度+京東。
英偉達(dá)的“狂飆”也引來(lái)了眾多挑戰(zhàn)者。亞馬遜、谷歌、微軟、華為、百度等巨頭積極推動(dòng)自研芯片,寒武紀(jì)、摩爾線程、燧原科技等新銳力量崛起。據(jù)外媒報(bào)道,英偉達(dá)在提交給美國(guó)證券交易委員會(huì)的文件中,其中包含AI芯片等多個(gè)類別里,首度將華為認(rèn)定為“最大競(jìng)爭(zhēng)對(duì)手”。
理想與狂熱交織下,人們不免好奇:英偉達(dá)的“鐵王座”還能坐多久?
