今明兩年半導(dǎo)體的“大事”都是AI芯片，GPU出盡風(fēng)頭，CPU還未言敗

2024-01-03 來源：賢集網(wǎng)

1196

據(jù)《巴倫周刊》資深撰稿人Tae Kim在推特上發(fā)表一篇推文，Nvidia每銷售一臺H100GPU加速器，就能獲得高達(dá)1000%的利潤。

以美元計(jì)算，Nvidia 每個(gè)高性能計(jì)算 (HPC) 加速器（最便宜的 PCIe 版本）的市場價(jià)格約為25000至30000美元（約合18.3至21.9萬元人民幣），大概是其每個(gè)芯片和外設(shè)成本3320美元的10倍。

Tae Kim援引的是金融咨詢公司Raymond James數(shù)據(jù)，H100 GPU的成本為3320 美元。目前尚不清楚成本分析有多深入，可能這是一個(gè)純粹的制造成本問題（在考慮良率的情況下平均每片晶圓和其他組件的價(jià)格），那么Nvidia 仍然需要支付大量的費(fèi)用利潤。

此外，產(chǎn)品開發(fā)需要時(shí)間和資源，考慮到工程師和其他參與 H100 等產(chǎn)品開發(fā)生命周期的人員，在得出最終的平均產(chǎn)品開發(fā)成本之前，Nvidia 的研發(fā)成本也必須考慮在內(nèi)。

根據(jù)Glassdoor的數(shù)據(jù)，Nvidia電子硬件工程師的平均年薪約為20.2萬美元，這還只是一個(gè)工程師的年薪，像 H100 這樣的芯片開發(fā)很可能需要多名專業(yè)人員花費(fèi)數(shù)千小時(shí)，所有這些都必須考慮在內(nèi)。

不過，僅從生產(chǎn)成本/ 售價(jià)比來看，英偉達(dá)H100 GPU就已經(jīng)算是一個(gè)“超級印鈔機(jī)”了。

更重要的是，Nvidia GPU不愁賣，很快就被各大科技巨頭搶購一空了。目前，Nvidia GPU的產(chǎn)品訂單似乎已經(jīng)賣到 2024年了，且預(yù)計(jì)到2027年，人工智能加速器市場的規(guī)模將達(dá)到1500億美元左右。

此前文章指出，僅微軟、Meta等四巨頭訂單就足以讓Nvidia實(shí)現(xiàn)本季度的銷售目標(biāo)。伯恩斯坦分析師指出，英偉達(dá)將有可能在2024年創(chuàng)造750億至900億美元的數(shù)據(jù)中心和AI芯片收入。

AI芯片已成為重要議題

考慮到人工智能及其所需的先進(jìn)芯片需要巨額投資和基礎(chǔ)設(shè)施支持，政府的態(tài)度至關(guān)重要。

韓國政府計(jì)劃投資8262億韓元（約合6.31億美元），希望到2030年在韓國塑造一個(gè)以本土高端人工智能芯片為核心的人工智能生態(tài)系統(tǒng)。

“人工智能將對半導(dǎo)體、數(shù)據(jù)和平臺服務(wù)乃至安全產(chǎn)生重大影響?！?韓國總統(tǒng)在九月份的一次政府間會(huì)議上表示。他說：“政府支持應(yīng)該起到催化作用，以促進(jìn)企業(yè)投資和創(chuàng)新?！?/span>

政府的中心倡議項(xiàng)目命名為“K-Cloud ”。參與者包括人工智能芯片設(shè)計(jì)公司、云計(jì)算公司、學(xué)術(shù)專家和科學(xué)技術(shù)部，將花費(fèi)約1000億韓元用于到2025年開發(fā)用于人工智能數(shù)據(jù)中心的神經(jīng)處理單元（NPU）。

K-Cloud 項(xiàng)目旨在建立基于新的NPU的數(shù)據(jù)中心集群，提供39.9 petaflops的人工智能計(jì)算能力，其中公共部門和私營部門分別提供19.95 petaflops。1 petaflop每秒執(zhí)行一千萬億（即一萬億億，或10的15次方）次計(jì)算。

在第二階段，該項(xiàng)目計(jì)劃在2028年基于DRAM技術(shù)創(chuàng)建一種低功耗的內(nèi)存內(nèi)處理（PIM）芯片。PIM芯片整合了存儲(chǔ)和處理功能，以減少延遲并解決馮·諾伊曼瓶頸問題。

最后階段將在2030年之前，升級基于非易失性存儲(chǔ)器和超低能耗的PIM芯片。

根據(jù)市場跟蹤機(jī)構(gòu)Gartner的預(yù)測，全球人工智能芯片市場預(yù)計(jì)到2026年將達(dá)到861億美元，每年增長16%。

數(shù)據(jù)中心加入AI熱潮

另一個(gè)預(yù)計(jì)從人工智能技術(shù)中獲益的行業(yè)是數(shù)據(jù)中心。新冠疫情期間，數(shù)據(jù)中心和云計(jì)算的需求增加，生成式人工智能受到廣泛關(guān)注。公司將需要計(jì)算資源來訓(xùn)練自己的大型語言模型，因此預(yù)計(jì)這一趨勢將進(jìn)一步擴(kuò)大。

韓國三家移動(dòng)運(yùn)營商——SK Telecom、KT和LG Uplus——在全國范圍內(nèi)共擁有31個(gè)數(shù)據(jù)中心，其中18個(gè)位于首爾。根據(jù)元大證券（ Yuanta Securities）的報(bào)告，這三家公司占據(jù)了總數(shù)據(jù)中心容量的93%。

“從2028年開始，互聯(lián)網(wǎng)數(shù)據(jù)中心市場將轉(zhuǎn)向以供應(yīng)商為導(dǎo)向的模式。”元大證券分析師Lee Seung-woong表示：“到2030年，數(shù)據(jù)中心的需求可能會(huì)增加1088億韓元，而同期供應(yīng)可能僅增加609億韓元。由于在短期內(nèi)供應(yīng)很難超過需求，數(shù)據(jù)中心可能會(huì)在中長期內(nèi)提升電信公司的盈利能力。”

在韓國國內(nèi)擴(kuò)大規(guī)模之后，SK Telecom和KT計(jì)劃將它們的數(shù)據(jù)中心基礎(chǔ)設(shè)施出口海外，首選東南亞地區(qū)。

上個(gè)月，一場介紹其人工智能戰(zhàn)略的新聞發(fā)布會(huì)上，SK Telecom的CEO Ryu Young-sang表示，該公司計(jì)劃將其數(shù)據(jù)中心的國內(nèi)容量增加一倍以上（從1億韓元增加到2.07億韓元），并與外國云服務(wù)提供商合作，將其基礎(chǔ)設(shè)施擴(kuò)展到海外。

KT旗下的云計(jì)算子公司KT Cloud于5月從當(dāng)?shù)厮侥脊蓹?quán)公司IMM Credit & Solutions獲得了6000億韓元的資金，用于擴(kuò)大其基礎(chǔ)設(shè)施云和數(shù)據(jù)中心基礎(chǔ)設(shè)施。預(yù)計(jì)到2026年，其年收入將達(dá)到2萬億韓元。

在此趨勢下，國內(nèi)芯片企業(yè)如何分一杯羹？

異構(gòu)計(jì)算：未來將成為主流的計(jì)算方案

異構(gòu)計(jì)算，就是使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式，通常以“CPU+GPU”為主，目的便是為了使二者相互配合，以達(dá)到更好的計(jì)算效果。

CPU是智能設(shè)備的心臟，主要負(fù)責(zé)多任務(wù)管理、調(diào)度，具有很強(qiáng)的通用性，但其更擅長邏輯控制，在面對大規(guī)模并行計(jì)算任務(wù)時(shí)表現(xiàn)并不佳。GPU則在圖像渲染等涉及大量重復(fù)運(yùn)算的領(lǐng)域擁有更強(qiáng)運(yùn)算能力，AI領(lǐng)域中用于圖像識別的深度學(xué)習(xí)、用于決策和推理的機(jī)器學(xué)習(xí)以及超級計(jì)算都需要大規(guī)模的并行計(jì)算，大多都采用GPU進(jìn)行。

隨著算力發(fā)展，多元化計(jì)算需求逐漸增多，算力場景也愈發(fā)多樣。這也導(dǎo)致CPU或GPU都難以獨(dú)立滿足全場景的算力需求，而CPU+GPU的異構(gòu)計(jì)算模式也為此應(yīng)運(yùn)而生。在CPU+GPU異構(gòu)計(jì)算模式中，GPU可作為協(xié)處理器負(fù)責(zé)并行加速計(jì)算，CPU可作為控制中心，在復(fù)雜場景實(shí)現(xiàn)更優(yōu)性能，在高性能計(jì)算、海量數(shù)據(jù)處理等方面明顯更具優(yōu)勢。

可以預(yù)見，隨著計(jì)算產(chǎn)業(yè)的演進(jìn)，CPU+GPU異構(gòu)計(jì)算模式將成為未來的主流方案，擁有廣泛的發(fā)展與應(yīng)用空間。

AI PC或?yàn)镃PU扳回一局

近日，英特爾發(fā)布了全新的酷睿Ultra系列處理器，這一創(chuàng)新產(chǎn)品不僅在工藝、設(shè)計(jì)上取得了重大突破，更為AIPC（AI Personal Computer，人工智能個(gè)人計(jì)算機(jī)）的未來發(fā)展帶來了新的機(jī)遇。

首先，酷睿Ultra系列處理器是英特爾首款基于Intel 4工藝打造的處理器產(chǎn)品。與AMD Ryzen 7 7840U、高通驍龍8cx Gen 3和蘋果自研M3芯片等筆記本電腦處理器相比，酷睿Ultra 7 165H芯片的多線程性能提高了11%。這一提升意味著，無論是進(jìn)行大規(guī)模計(jì)算任務(wù)，還是運(yùn)行復(fù)雜的應(yīng)用程序，酷睿Ultra系列處理器都能提供更高效、更穩(wěn)定的性能支持。

在設(shè)計(jì)層面，酷睿Ultra系列處理器加入了片上AI加速器神經(jīng)網(wǎng)絡(luò)處理單元NPU。這一創(chuàng)新設(shè)計(jì)大幅度提高了設(shè)備本地運(yùn)行AI應(yīng)用的能效比和本地運(yùn)行能力。這意味著，無論是進(jìn)行語音識別、圖像識別等AI任務(wù)，還是運(yùn)行各種智能應(yīng)用，酷睿Ultra系列處理器都能提供強(qiáng)大的計(jì)算支持。

隨著PC硬件層兩大供應(yīng)商相繼發(fā)布主打AI能力的CPU產(chǎn)品，未來AIPC的核心硬件基礎(chǔ)已經(jīng)初步奠定。這意味著，未來AIPC將擁有更強(qiáng)大的計(jì)算能力和更豐富的AI應(yīng)用場景。同時(shí)，這也為產(chǎn)業(yè)鏈帶來了新的機(jī)遇，將不斷涌現(xiàn)出更多的商業(yè)機(jī)會(huì)和創(chuàng)新應(yīng)用。

硬件迭代或加速的同時(shí)，配套軟件生態(tài)也有望進(jìn)一步繁榮。算力和AI應(yīng)用互促之下，各類設(shè)計(jì)、研發(fā)、編輯軟件有望適配更多AI功能。對于個(gè)人而言，目前AIPC可以實(shí)現(xiàn)高實(shí)時(shí)性交互場景的AI應(yīng)用，例如視頻會(huì)議的實(shí)時(shí)轉(zhuǎn)錄和語音修飾，本地文檔信息匯總和摘要，離線場景或小規(guī)模AI輔助設(shè)計(jì)加速等等。而隨著AIPC的普及，更多深度適配的應(yīng)用也將不斷涌現(xiàn)并產(chǎn)生價(jià)值。