今明兩年半導(dǎo)體的“大事”都是AI芯片,GPU出盡風(fēng)頭,CPU還未言敗
據(jù)《巴倫周刊》資深撰稿人Tae Kim在推特上發(fā)表一篇推文,Nvidia每銷售一臺H100GPU加速器,就能獲得高達(dá)1000%的利潤。
以美元計(jì)算,Nvidia 每個(gè)高性能計(jì)算 (HPC) 加速器(最便宜的 PCIe 版本)的市場價(jià)格約為25000至30000美元(約合18.3至21.9萬元人民幣),大概是其每個(gè)芯片和外設(shè)成本3320美元的10倍。
Tae Kim援引的是金融咨詢公司Raymond James數(shù)據(jù),H100 GPU的成本為3320 美元。目前尚不清楚成本分析有多深入,可能這是一個(gè)純粹的制造成本問題(在考慮良率的情況下平均每片晶圓和其他組件的價(jià)格),那么Nvidia 仍然需要支付大量的費(fèi)用利潤。
此外,產(chǎn)品開發(fā)需要時(shí)間和資源,考慮到工程師和其他參與 H100 等產(chǎn)品開發(fā)生命周期的人員,在得出最終的平均產(chǎn)品開發(fā)成本之前,Nvidia 的研發(fā)成本也必須考慮在內(nèi)。
根據(jù)Glassdoor的數(shù)據(jù),Nvidia電子硬件工程師的平均年薪約為20.2萬美元,這還只是一個(gè)工程師的年薪,像 H100 這樣的芯片開發(fā)很可能需要多名專業(yè)人員花費(fèi)數(shù)千小時(shí),所有這些都必須考慮在內(nèi)。
不過,僅從生產(chǎn)成本/ 售價(jià)比來看,英偉達(dá)H100 GPU就已經(jīng)算是一個(gè)“超級印鈔機(jī)”了。
更重要的是,Nvidia GPU不愁賣,很快就被各大科技巨頭搶購一空了。目前,Nvidia GPU的產(chǎn)品訂單似乎已經(jīng)賣到 2024年了,且預(yù)計(jì)到2027年,人工智能加速器市場的規(guī)模將達(dá)到1500億美元左右。
此前文章指出,僅微軟 、Meta等四巨頭訂單就足以讓Nvidia實(shí)現(xiàn)本季度的銷售目標(biāo)。伯恩斯坦分析師指出,英偉達(dá)將有可能在2024年創(chuàng)造750億至900億美元的數(shù)據(jù)中心和AI芯片收入。
AI芯片已成為重要議題
考慮到人工智能及其所需的先進(jìn)芯片需要巨額投資和基礎(chǔ)設(shè)施支持,政府的態(tài)度至關(guān)重要。
韓國政府計(jì)劃投資8262億韓元(約合6.31億美元),希望到2030年在韓國塑造一個(gè)以本土高端人工智能芯片為核心的人工智能生態(tài)系統(tǒng)。
“人工智能將對半導(dǎo)體、數(shù)據(jù)和平臺服務(wù)乃至安全產(chǎn)生重大影響?!?韓國總統(tǒng)在九月份的一次政府間會(huì)議上表示。他說:“政府支持應(yīng)該起到催化作用,以促進(jìn)企業(yè)投資和創(chuàng)新?!?/span>
政府的中心倡議項(xiàng)目命名為“K-Cloud ”。參與者包括人工智能芯片設(shè)計(jì)公司、云計(jì)算公司、學(xué)術(shù)專家和科學(xué)技術(shù)部,將花費(fèi)約1000億韓元用于到2025年開發(fā)用于人工智能數(shù)據(jù)中心的神經(jīng)處理單元(NPU)。
K-Cloud 項(xiàng)目旨在建立基于新的NPU的數(shù)據(jù)中心集群,提供39.9 petaflops的人工智能計(jì)算能力,其中公共部門和私營部門分別提供19.95 petaflops。1 petaflop每秒執(zhí)行一千萬億(即一萬億億,或10的15次方)次計(jì)算。
在第二階段,該項(xiàng)目計(jì)劃在2028年基于DRAM技術(shù)創(chuàng)建一種低功耗的內(nèi)存內(nèi)處理(PIM)芯片。PIM芯片整合了存儲(chǔ)和處理功能,以減少延遲并解決馮·諾伊曼瓶頸問題。
最后階段將在2030年之前,升級基于非易失性存儲(chǔ)器和超低能耗的PIM芯片。
根據(jù)市場跟蹤機(jī)構(gòu)Gartner的預(yù)測,全球人工智能芯片市場預(yù)計(jì)到2026年將達(dá)到861億美元,每年增長16%。
數(shù)據(jù)中心加入AI熱潮
另一個(gè)預(yù)計(jì)從人工智能技術(shù)中獲益的行業(yè)是數(shù)據(jù)中心。新冠疫情期間,數(shù)據(jù)中心和云計(jì)算的需求增加,生成式人工智能受到廣泛關(guān)注。公司將需要計(jì)算資源來訓(xùn)練自己的大型語言模型,因此預(yù)計(jì)這一趨勢將進(jìn)一步擴(kuò)大。
韓國三家移動(dòng)運(yùn)營商——SK Telecom、KT和LG Uplus——在全國范圍內(nèi)共擁有31個(gè)數(shù)據(jù)中心,其中18個(gè)位于首爾。根據(jù)元大證券( Yuanta Securities)的報(bào)告,這三家公司占據(jù)了總數(shù)據(jù)中心容量的93%。
“從2028年開始,互聯(lián)網(wǎng)數(shù)據(jù)中心市場將轉(zhuǎn)向以供應(yīng)商為導(dǎo)向的模式。”元大證券分析師Lee Seung-woong表示:“到2030年,數(shù)據(jù)中心的需求可能會(huì)增加1088億韓元,而同期供應(yīng)可能僅增加609億韓元。由于在短期內(nèi)供應(yīng)很難超過需求,數(shù)據(jù)中心可能會(huì)在中長期內(nèi)提升電信公司的盈利能力。”
在韓國國內(nèi)擴(kuò)大規(guī)模之后,SK Telecom和KT計(jì)劃將它們的數(shù)據(jù)中心基礎(chǔ)設(shè)施出口海外,首選東南亞地區(qū)。
上個(gè)月,一場介紹其人工智能戰(zhàn)略的新聞發(fā)布會(huì)上,SK Telecom的CEO Ryu Young-sang表示,該公司計(jì)劃將其數(shù)據(jù)中心的國內(nèi)容量增加一倍以上(從1億韓元增加到2.07億韓元),并與外國云服務(wù)提供商合作,將其基礎(chǔ)設(shè)施擴(kuò)展到海外。
KT旗下的云計(jì)算子公司KT Cloud于5月從當(dāng)?shù)厮侥脊蓹?quán)公司IMM Credit & Solutions獲得了6000億韓元的資金,用于擴(kuò)大其基礎(chǔ)設(shè)施云和數(shù)據(jù)中心基礎(chǔ)設(shè)施。預(yù)計(jì)到2026年,其年收入將達(dá)到2萬億韓元。
在此趨勢下,國內(nèi)芯片企業(yè)如何分一杯羹?
異構(gòu)計(jì)算:未來將成為主流的計(jì)算方案
異構(gòu)計(jì)算,就是使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式,通常以“CPU+GPU”為主,目的便是為了使二者相互配合,以達(dá)到更好的計(jì)算效果。
CPU是智能設(shè)備的心臟,主要負(fù)責(zé)多任務(wù)管理、調(diào)度,具有很強(qiáng)的通用性,但其更擅長邏輯控制,在面對大規(guī)模并行計(jì)算任務(wù)時(shí)表現(xiàn)并不佳。GPU則在圖像渲染等涉及大量重復(fù)運(yùn)算的領(lǐng)域擁有更強(qiáng)運(yùn)算能力,AI領(lǐng)域中用于圖像識別的深度學(xué)習(xí)、用于決策和推理的機(jī)器學(xué)習(xí)以及超級計(jì)算都需要大規(guī)模的并行計(jì)算,大多都采用GPU進(jìn)行。
隨著算力發(fā)展,多元化計(jì)算需求逐漸增多,算力場景也愈發(fā)多樣。這也導(dǎo)致CPU或GPU都難以獨(dú)立滿足全場景的算力需求,而CPU+GPU的異構(gòu)計(jì)算模式也為此應(yīng)運(yùn)而生。在CPU+GPU異構(gòu)計(jì)算模式中,GPU可作為協(xié)處理器負(fù)責(zé)并行加速計(jì)算,CPU可作為控制中心,在復(fù)雜場景實(shí)現(xiàn)更優(yōu)性能,在高性能計(jì)算、海量數(shù)據(jù)處理等方面明顯更具優(yōu)勢。
可以預(yù)見,隨著計(jì)算產(chǎn)業(yè)的演進(jìn),CPU+GPU異構(gòu)計(jì)算模式將成為未來的主流方案,擁有廣泛的發(fā)展與應(yīng)用空間。
AI PC或?yàn)镃PU扳回一局
近日,英特爾發(fā)布了全新的酷睿Ultra系列處理器,這一創(chuàng)新產(chǎn)品不僅在工藝、設(shè)計(jì)上取得了重大突破,更為AIPC(AI Personal Computer,人工智能個(gè)人計(jì)算機(jī))的未來發(fā)展帶來了新的機(jī)遇。
首先,酷睿Ultra系列處理器是英特爾首款基于Intel 4工藝打造的處理器產(chǎn)品。與AMD Ryzen 7 7840U、高通驍龍8cx Gen 3和蘋果自研M3芯片等筆記本電腦處理器相比,酷睿Ultra 7 165H芯片的多線程性能提高了11%。這一提升意味著,無論是進(jìn)行大規(guī)模計(jì)算任務(wù),還是運(yùn)行復(fù)雜的應(yīng)用程序,酷睿Ultra系列處理器都能提供更高效、更穩(wěn)定的性能支持。
在設(shè)計(jì)層面,酷睿Ultra系列處理器加入了片上AI加速器神經(jīng)網(wǎng)絡(luò)處理單元NPU。這一創(chuàng)新設(shè)計(jì)大幅度提高了設(shè)備本地運(yùn)行AI應(yīng)用的能效比和本地運(yùn)行能力。這意味著,無論是進(jìn)行語音識別、圖像識別等AI任務(wù),還是運(yùn)行各種智能應(yīng)用,酷睿Ultra系列處理器都能提供強(qiáng)大的計(jì)算支持。
隨著PC硬件層兩大供應(yīng)商相繼發(fā)布主打AI能力的CPU產(chǎn)品,未來AIPC的核心硬件基礎(chǔ)已經(jīng)初步奠定。這意味著,未來AIPC將擁有更強(qiáng)大的計(jì)算能力和更豐富的AI應(yīng)用場景。同時(shí),這也為產(chǎn)業(yè)鏈帶來了新的機(jī)遇,將不斷涌現(xiàn)出更多的商業(yè)機(jī)會(huì)和創(chuàng)新應(yīng)用。
硬件迭代或加速的同時(shí),配套軟件生態(tài)也有望進(jìn)一步繁榮。算力和AI應(yīng)用互促之下,各類設(shè)計(jì)、研發(fā)、編輯軟件有望適配更多AI功能。對于個(gè)人而言,目前AIPC可以實(shí)現(xiàn)高實(shí)時(shí)性交互場景的AI應(yīng)用,例如視頻會(huì)議的實(shí)時(shí)轉(zhuǎn)錄和語音修飾,本地文檔信息匯總和摘要,離線場景或小規(guī)模AI輔助設(shè)計(jì)加速等等。而隨著AIPC的普及,更多深度適配的應(yīng)用也將不斷涌現(xiàn)并產(chǎn)生價(jià)值。
