英偉達(dá)并非沒(méi)有對(duì)手，英特爾發(fā)布最新AI芯片

2024-04-12 來(lái)源：賢集網(wǎng)

2999

4月9日，英特爾推出了其最新的人工智能芯片Gaudi 3。這家芯片制造商急于生產(chǎn)可以訓(xùn)練和部署大型AI模型的半導(dǎo)體，例如支持OpenAI的ChatGPT的模型。

新的 Gaudi 3 芯片的能效是英偉達(dá)前一代產(chǎn)品H100 GPU的兩倍多，并且可以比H100 GPU 快一倍半。同時(shí)Gaudi 3 還有不同的配置，例如在一塊主板上捆綁八個(gè) Gaudi 3 芯片或可以插入現(xiàn)有系統(tǒng)的卡。

英特爾在Meta 的開(kāi)源 Llama 和阿布扎比支持的 Falcon 等模型上測(cè)試了該芯片。Gaudi 3可以幫助訓(xùn)練或部署模型，包括Stable Diffusion或OpenAI的Whisper語(yǔ)音識(shí)別模型。

英特爾表示，其芯片使用的功率低于英偉達(dá)的芯片。

據(jù)估計(jì)，英偉達(dá)擁有80%的AI芯片市場(chǎng)，其圖形處理器（GPU）在過(guò)去一年中一直是AI構(gòu)建者的首選高端芯片。

新的Gaudi 3芯片將在第三季度向客戶提供，包括惠普、超微等在內(nèi)的公司將使用這些芯片構(gòu)建系統(tǒng)。但是英特爾沒(méi)有提供 Gaudi 3 的價(jià)格范圍。

運(yùn)行生成式 AI 和購(gòu)買 Nvidia GPU 可能很昂貴，不少公司正在尋找其他供應(yīng)商來(lái)幫助降低成本。除了性能、功耗外，Gaudi 3具有競(jìng)爭(zhēng)力的價(jià)格、獨(dú)特的開(kāi)放式集成片上網(wǎng)絡(luò)，正在使用行業(yè)標(biāo)準(zhǔn)的以太網(wǎng)。通過(guò)超級(jí)以太網(wǎng)聯(lián)盟（UEC），英特爾正在引領(lǐng)面向 AI 架構(gòu)的開(kāi)放式以太網(wǎng)網(wǎng)絡(luò)。該公司推出了一系列人工智能優(yōu)化的以太網(wǎng)解決方案，包括AI NIC（網(wǎng)絡(luò)接口卡）和人工智能連接小芯片。

隨著云提供商和企業(yè)建立基礎(chǔ)設(shè)施來(lái)部署人工智能軟件，數(shù)據(jù)中心人工智能市場(chǎng)也有望增長(zhǎng)，這表明即使英偉達(dá)繼續(xù)制造絕大多數(shù)人工智能芯片，其他競(jìng)爭(zhēng)對(duì)手仍有發(fā)展空間。

為減少對(duì)英偉達(dá)依賴，谷歌推出ARM服務(wù)器芯片

與微軟、亞馬遜一樣，谷歌也推出了多款自研芯片，以減少對(duì)英偉達(dá)GPU芯片的依賴。

美東時(shí)間4月9日周二，谷歌在今年的年度云計(jì)算大會(huì)Cloud Next 2024上宣布推出一款基于Arm架構(gòu)的數(shù)據(jù)中心芯片Google Axion，以及更新TPU v5p芯片。

谷歌表示表示，Google Axion處理器基于Arm Neoverse V2 CPU構(gòu)建，以Titanium為基礎(chǔ)，性能比通用ARM芯片高30%，而且比英特爾生產(chǎn)的當(dāng)前一代 x86芯片高50%。預(yù)計(jì)Axion用于多種谷歌服務(wù)，并在“今年晚些時(shí)候”向公眾開(kāi)放。

谷歌云副總裁兼計(jì)算和機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施總經(jīng)理 Mark Lohmeyer 表示：“我們正在讓客戶輕松地將現(xiàn)有工作負(fù)載轉(zhuǎn)移到 ARM。Axion 建立在開(kāi)放基礎(chǔ)之上，在任何地方使用ARM的客戶都可以輕松采用 Axion，而無(wú)需重新架構(gòu)或重新編寫(xiě)應(yīng)用程序?！?/span>

“谷歌推出的新型 Axion CPU 標(biāo)志著交付定制芯片的一個(gè)重要里程碑，該芯片針對(duì)谷歌的基礎(chǔ)設(shè)施進(jìn)行了優(yōu)化，并構(gòu)建在我們的高性能 Arm Neoverse V2 平臺(tái)上。數(shù)十年的生態(tài)系統(tǒng)投資，再加上 Google 的持續(xù)創(chuàng)新和開(kāi)源軟件貢獻(xiàn)，確保為在各地運(yùn)行 Arm 的客戶最重要的工作負(fù)載提供最佳體驗(yàn)。”Arm 首席執(zhí)行官 Rene Haas表示。

事實(shí)上，Axion 只是眾多定制發(fā)一份芯片中的最新產(chǎn)品。自2015年以來(lái)，谷歌已經(jīng)發(fā)布了五代張量處理單元（TPU）；同時(shí)，2018年，谷歌發(fā)布了第一個(gè)視頻編碼單元 (VCU)，視頻轉(zhuǎn)碼效率提高了33 倍；另外，2021年，谷歌通過(guò)投資“片上系統(tǒng)”(SoC) 設(shè)計(jì)，加大了定制計(jì)算的投入，并發(fā)布了用于移動(dòng)設(shè)備的三代Tensor芯片中的第一款。

如今，谷歌推出新的芯片意味著，該公司正在追趕亞馬遜和微軟這些云領(lǐng)域競(jìng)爭(zhēng)對(duì)手的步伐。亞馬遜和微軟2021年就已經(jīng)推出Arm架構(gòu)的CPU，作為提供差異化計(jì)算服務(wù)的一種方式。而谷歌之前為YouTube、AI及其智能手機(jī)推出過(guò)定制芯片，但還沒(méi)有打造過(guò)CPU。

具體來(lái)說(shuō)，Axion將適用于一系列任務(wù)，包括支持谷歌的搜索引擎和 AI 相關(guān)的工作。谷歌表示，該芯片可以通過(guò)幫助處理大量數(shù)據(jù)并為數(shù)十億用戶部署服務(wù)，在AI領(lǐng)域發(fā)揮重要的支持作用。同時(shí)，未來(lái)谷歌逐步轉(zhuǎn)移到基于Arm云服務(wù)器用例上使用，Datadog、Elastic、OpenX 和 Snap都計(jì)劃采用 Axion。

除了Axion之外，谷歌還宣布全面推出 TPU v5p，用于訓(xùn)練和推理的最強(qiáng)大、可擴(kuò)展且靈活的 AI 加速器，其計(jì)算能力是上一代的 4 倍（400%）。

谷歌CEO桑達(dá)爾·皮查伊表示，生成式 AI的進(jìn)步需要強(qiáng)大的底層基礎(chǔ)設(shè)施。谷歌 AI 超級(jí)計(jì)算機(jī)結(jié)合了我們的 TPU、GPU、AI 軟件等，為訓(xùn)練和服務(wù)模型提供性能和成本優(yōu)勢(shì)。如今，領(lǐng)先 AI 公司和 Google Cloud 客戶（例如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI）正在使用其基礎(chǔ)設(shè)施。

數(shù)據(jù)顯示，雖然廣告依然是谷歌最大收入源，但云計(jì)算的增長(zhǎng)更快，在谷歌的收入中占比不斷提高，已接近占公司總收入的11%。據(jù)Gartner估算，2022 年，谷歌占云基礎(chǔ)設(shè)施市場(chǎng) 7.5% 的份額，而亞馬遜和微軟合計(jì)控制著 62% 左右的份額。

谷歌表示，現(xiàn)在已經(jīng)有超過(guò) 90% 的 AI 獨(dú)角獸企業(yè)在使用谷歌的計(jì)算資源、模型和開(kāi)發(fā)環(huán)境。

如今，谷歌成為繼微軟和亞馬遜之后，第三家用ARM架構(gòu)推出數(shù)據(jù)中心CPU的科技巨頭，這顯示了新的趨勢(shì)。而且，谷歌還利用TPU優(yōu)勢(shì)，全面提供服務(wù)器和數(shù)據(jù)中心閉環(huán)服務(wù)，降低英偉達(dá)、英特爾、AMD芯片的依賴。

有評(píng)論稱，谷歌開(kāi)發(fā)新芯片是在 AI 競(jìng)賽白熱化之際減少對(duì)外部廠商的依賴。不過(guò)，谷歌的官員并沒(méi)有將芯片新品視為一種競(jìng)爭(zhēng)之舉。谷歌負(fù)責(zé)自研芯片業(yè)務(wù)的副總Amin Vahdat說(shuō)：“我覺(jué)得這是做大蛋糕的基礎(chǔ)?！?/span>

大規(guī)模AI計(jì)算已經(jīng)進(jìn)入系統(tǒng)競(jìng)賽

在Intel Vision大會(huì)上，“生成式AI”這一主題可以說(shuō)是貫穿全程，從數(shù)據(jù)中心的大規(guī)模AI訓(xùn)練與推理，到AI PC改變端側(cè)生產(chǎn)力，英特爾正竭力展示自己作為先進(jìn)芯片技術(shù)領(lǐng)導(dǎo)者的競(jìng)爭(zhēng)力。

如今談到大模型訓(xùn)練芯片，英偉達(dá)當(dāng)仁不讓是首選供應(yīng)商，但這棵搖錢樹(shù)早已被其他芯片大廠和創(chuàng)業(yè)新秀盯上，英特爾便是其中之一。英特爾正通過(guò)推出更具性價(jià)比的可擴(kuò)展系統(tǒng)來(lái)打破這種一家獨(dú)大的局面，這將為市場(chǎng)帶來(lái)另一種選擇。

大規(guī)模AI計(jì)算已經(jīng)進(jìn)入系統(tǒng)競(jìng)賽，無(wú)論是守擂者英偉達(dá)，還是英特爾、AMD、Cerebras、Groq等追擊者，都明顯加大對(duì)先進(jìn)Chiplet封裝、先進(jìn)存儲(chǔ)、先進(jìn)互連技術(shù)的重視，通過(guò)從超越制程和reticle極限的芯片內(nèi)部設(shè)計(jì)優(yōu)化，到擴(kuò)展至大型集群系統(tǒng)的技術(shù)升級(jí)，為整個(gè)數(shù)據(jù)中心的AI計(jì)算提供更高性能和能效的加速。

除了Gaudi 3，英特爾還在Intel Vision大會(huì)上分享了數(shù)據(jù)中心至強(qiáng)處理器和AI PC的進(jìn)展，并現(xiàn)場(chǎng)連線遠(yuǎn)在英特爾晶圓廠的同事，演示如何在AI PC上用先進(jìn)AI技術(shù)輔助芯片檢測(cè)。

英特爾宣布面向數(shù)據(jù)中心、云和邊緣的下一代處理器進(jìn)行品牌煥新，即英特爾至強(qiáng)6。配備能效核的至強(qiáng)6（此前代號(hào)為Sierra Forest）將于2024年第二季度推出，配備性能核的至強(qiáng)6（此前代號(hào)為Granite Rapids）將緊隨其后推出。

配備性能核的英特爾至強(qiáng)6包含了對(duì)MXFP4數(shù)據(jù)格式的軟件支持，與使用FP16的第四代至強(qiáng)處理器相比，可將下一個(gè)token的延遲時(shí)間縮短至原來(lái)的15%，能運(yùn)行700億參數(shù)Llama-2模型。

英特爾預(yù)計(jì)將于今年出貨4000萬(wàn)臺(tái)AI PC，以及超過(guò)230種的設(shè)計(jì)，覆蓋輕薄PC和游戲掌機(jī)設(shè)備。新一代英特爾酷睿Ultra客戶端處理器家族（代號(hào)Lunar Lake）將于今年推出，具備超過(guò)100 TOPS平臺(tái)算力，NPU算力超過(guò)46TOPS。

英偉達(dá)的“鐵王座”還能做多久？

AI浪潮已經(jīng)勢(shì)不可擋，AI芯片作為其發(fā)展的底層基石也迎來(lái)了前所未有的機(jī)遇。據(jù)Gartner最新預(yù)測(cè)，到2024年AI芯片市場(chǎng)規(guī)模將較上一年增長(zhǎng)25.6%，達(dá)671億美元。預(yù)計(jì)到2027年，AI芯片市場(chǎng)規(guī)模將是2023年規(guī)模的兩倍以上，達(dá)到1194億美元。

在這樣的背景下，“算力霸主”英偉達(dá)被捧上神壇，以高達(dá)80%的占有率幾乎壟斷了市場(chǎng)，賺得盆滿缽滿。英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)的營(yíng)收再創(chuàng)新高，帶動(dòng)2024年財(cái)年Q4季度總營(yíng)收狂漲265%。由于這份遠(yuǎn)超預(yù)期的財(cái)報(bào)數(shù)據(jù)，英偉達(dá)一夜?jié)q出2770億美金市值，相當(dāng)于：一夜?jié)q出阿里巴巴+百度+京東。

英偉達(dá)的“狂飆”也引來(lái)了眾多挑戰(zhàn)者。亞馬遜、谷歌、微軟、華為、百度等巨頭積極推動(dòng)自研芯片，寒武紀(jì)、摩爾線程、燧原科技等新銳力量崛起。據(jù)外媒報(bào)道，英偉達(dá)在提交給美國(guó)證券交易委員會(huì)的文件中，其中包含AI芯片等多個(gè)類別里，首度將華為認(rèn)定為“最大競(jìng)爭(zhēng)對(duì)手”。

理想與狂熱交織下，人們不免好奇：英偉達(dá)的“鐵王座”還能坐多久？