越來越多企業(yè)“相中”AI能力,AI芯片需求強(qiáng)勁增長
Omdia的最新研究表明,經(jīng)過最近幾個季度的戰(zhàn)略庫存調(diào)整,預(yù)計到2024年,全球半導(dǎo)體供應(yīng)鏈將達(dá)到約6000億美元。令人鼓舞的是,隨著企業(yè)越來越多地利用生成式人工智能(AI)的能力,推動整個供應(yīng)鏈的新需求以至半導(dǎo)體行業(yè)的發(fā)展。
純晶圓代工行業(yè),是半導(dǎo)體供應(yīng)鏈不可分割的一部分,呼應(yīng)了半導(dǎo)體供應(yīng)鏈的基本基調(diào)。Omdia預(yù)測,由于需求逐漸恢復(fù)以及越來越多的應(yīng)用端芯片的去庫存完成,純晶圓代工行業(yè)將在2024年增長約16%。
值得注意的是,主要科技公司和企業(yè),對生成式AI技術(shù)的最新進(jìn)展產(chǎn)生了濃厚興趣,對人工智能芯片的需求因而增加。Omdia的研究,將探討除GPU主導(dǎo)地位之外的AI加速技術(shù)未來格局的關(guān)鍵問題,并在即將舉行的2024 Omdia臺灣科技產(chǎn)業(yè)研討會上,闡明AI領(lǐng)域當(dāng)前和未來的競爭動態(tài)。
Omdia半導(dǎo)體研究高級分析師溫璟如(Claire Wen)評論道:“NVIDIA目前在AI加速器市場占據(jù)主導(dǎo)地位,尤其是在云端和數(shù)據(jù)中心部署方面。同時,像谷歌、亞馬遜和微軟這樣的主要超大規(guī)模云服務(wù)提供商,正在開發(fā)自己的AI應(yīng)用專用集成電路(ASIC),以提高針對其獨(dú)特的AI工作負(fù)載量身定制的成本效率和性能。此外,支持離線AI應(yīng)用程序執(zhí)行的緊湊型人工智能模型的問世,邊緣人工智能的采用率顯著提高,尤其是在人工智能電腦和智能手機(jī)中。高通利用其在智能手機(jī)領(lǐng)域AI功能方面的豐富經(jīng)驗,在AI電腦市場取得顯著進(jìn)步。”
HBM需求將增長10倍
韓國存儲巨頭SK海力士的首席執(zhí)行官Kwak Noh-Jung周三表示,預(yù)計到2024年,用于人工智能(AI)芯片組的高帶寬內(nèi)存(HBM)芯片在其DRAM芯片銷售中的比例將從2023年的個位數(shù)上升到兩位數(shù)。高盛也看好HBM市場,認(rèn)為HBM市場供不應(yīng)求的情況未來幾年將持續(xù),并預(yù)計市場規(guī)模將從2022年到2026年前增長10倍。
據(jù)了解,HBM存儲系統(tǒng)自2023年以來因AI芯片需求而呈現(xiàn)爆炸式增長。SK海力士和美光(MU.US)一樣,均已成為英偉達(dá)(NVDA.US)新款A(yù)I GPU的HBM存儲系統(tǒng)供應(yīng)商,提供的產(chǎn)品均為最新款的“HBM3E”。
高盛日前發(fā)布研報稱,由于更強(qiáng)的生成式人工智能(Gen AI)需求推動了更高的AI服務(wù)器出貨量和每個GPU中更高的HBM密度,該行大幅提高了HBM總市場規(guī)模預(yù)估,現(xiàn)在預(yù)計市場規(guī)模將從2022年到2026年前增長10倍(4年復(fù)合年增長率77%),從2022年的23億美元增長至2026年的230億美元。
高盛認(rèn)為,HBM市場供不應(yīng)求的情況未來幾年將持續(xù),SK海力士、三星和美光等主要玩家將持續(xù)受益。與同行的解決方案相比,海力士生產(chǎn)力和產(chǎn)量更佳。高盛預(yù)計,海力士在未來2-3年將保持其50%以上的市場份額。
終端市場格局分析
除了云端市場外,我們預(yù)計人工智能對于終端市場也有更強(qiáng)的需求,這也將推動人工智能成為終端計算芯片中越來越重要的差異化元素。
在手機(jī)端,人工智能的使用頻率將會進(jìn)一步增強(qiáng),這也會推動芯片加入更多相應(yīng)的算力,并且將人工智能支持作為SoC的核心亮點。例如高通發(fā)布的Snapdragon 8 Gen 3就以“低于一秒的延遲實現(xiàn)圖像生成任務(wù)”作為一個重要賣點,估計這樣的人工智能能力將會深度集成到手機(jī)廠商的操作系統(tǒng)中。除了高通這樣的第三方芯片公司之外,自研手機(jī)芯片的系統(tǒng)廠商預(yù)計也會繼續(xù)加碼人工智能;蘋果雖然在這方面保持低調(diào),但是預(yù)計在未來會以各種方式(加大NPU算力,或者是加大軟件支持)的方法來開始賦能更多人工智能在iPhone上的新拍攝用戶體驗。vivo在自研ISP芯片領(lǐng)域已經(jīng)有了數(shù)年積累,而目前生成式人工智能對于拍攝體驗的提升恰好和ISP有很強(qiáng)的協(xié)同作用,這也是2023年8月vivo發(fā)布的v3 ISP芯片強(qiáng)調(diào)了生成式人工智能作為一個核心亮點。未來,預(yù)計會看到越來越多這樣的芯片強(qiáng)調(diào)人工智能對于用戶體驗上的賦能作用。
在智能汽車領(lǐng)域,Nvidia雖然不如在云端強(qiáng)勢,但是其Orin系列芯片仍然是各大車廠考慮的標(biāo)準(zhǔn)芯片模組。我們認(rèn)為,隨著人工智能大模型對于智能駕駛的賦能作用逐漸加強(qiáng),無論是第三方芯片還是車廠自研的芯片都將會進(jìn)一步強(qiáng)化對于人工智能算力的投入,同時也推動芯片性能的快速提升——最近,無論是蔚來發(fā)布新自研芯片的算力規(guī)格,還是特斯拉傳出將使用TSMC 3nm作為下一代芯片的生產(chǎn)工藝,都在提示著我們2024年人工智能將在智能車芯片領(lǐng)域扮演越來越重要的角色。
推理芯片成新戰(zhàn)場
AI芯片大致可分為訓(xùn)練芯片和推理芯片兩大類。訓(xùn)練芯片主要用于深度學(xué)習(xí)模型的訓(xùn)練過程,對算力要求極高,因此追求盡可能強(qiáng)大的并行運(yùn)算能力。而推理芯片則是將訓(xùn)練好的AI模型部署到實際應(yīng)用中,完成預(yù)測和決策任務(wù)。相比之下,推理芯片對算力的需求較小,但對功耗、時延等實時性要求更高。
傳統(tǒng)的CPU和GPU芯片在推理運(yùn)算方面存在著明顯的能效比不足等缺陷,很難完全滿足推理對實時性的苛刻要求。這直接限制了AI技術(shù)在智能手機(jī)、無人駕駛汽車等終端設(shè)備和邊緣應(yīng)用中的落地。因此,專門的AI推理芯片應(yīng)運(yùn)而生,被認(rèn)為是釋放邊緣智能潛能的關(guān)鍵所在。
借助人工智能的東風(fēng),推理芯片市場前景極為廣闊,成為了各路企業(yè)新的必爭之地。無論是傳統(tǒng)IT巨頭,還是新興AI芯片創(chuàng)業(yè)公司,都在加大力度布局推理芯片賽道。
一方面,英特爾、英偉達(dá)、谷歌等科技巨頭憑借資金、技術(shù)和生態(tài)優(yōu)勢,已經(jīng)陸續(xù)推出多款專門的AI推理芯片產(chǎn)品。如英偉達(dá)的Jetson系列、谷歌的TPU推理加速器等,針對不同場景提供高性能的邊緣AI計算解決方案。
另一方面,一批新興的AI芯片創(chuàng)業(yè)公司也站穩(wěn)了腳跟。寒武紀(jì)推出的TerminatorIP產(chǎn)品則提出了一種Cloud-Edge一體化的計算架構(gòu),結(jié)合推理芯片和訓(xùn)練芯片,打造無縫連接的端云協(xié)同AI系統(tǒng)。地平線則設(shè)計了專用于視頻分析的視覺AI芯片及算法,可廣泛應(yīng)用于安防監(jiān)控、智能駕駛等領(lǐng)域。
展望未來,推理芯片市場潛力巨大,預(yù)計在可預(yù)見的幾年內(nèi)將保持高速增長態(tài)勢。這主要得益于人工智能算力需求的持續(xù)增長和推理芯片自身先天優(yōu)勢的釋放。
一方面,隨著AI技術(shù)的深入應(yīng)用,人工智能算力需求正在爆發(fā)式增長。據(jù)第三方研究機(jī)構(gòu)預(yù)測,到2025年,全球AI算力需求將比2022年增長7倍以上。面對如此龐大的算力缺口,單純依賴云端訓(xùn)練模型已不夠,推理芯片將成為釋放算力潛能的關(guān)鍵所在。
另一方面,作為專門設(shè)計用于邊緣推理任務(wù)的芯片,推理芯片具有低功耗、實時響應(yīng)等優(yōu)勢。隨著5G、邊緣計算等技術(shù)發(fā)展,越來越多智能設(shè)備和應(yīng)用將遷移至邊緣側(cè),對推理芯片的需求也將與日俱增。
在這一背景下,云~邊緣一體化的AI計算架構(gòu)正在成為行業(yè)趨勢。企業(yè)期望通過訓(xùn)練芯片和推理芯片的協(xié)同,實現(xiàn)在云端和終端設(shè)備上無縫銜接的AI服務(wù)交付。未來,更多創(chuàng)新的計算架構(gòu)和芯片方案有望出現(xiàn)。
