九色综合狠狠综合久久,色一情一乱一伦一区二区三区,人人妻人人藻人人爽欧美一区,扒开双腿疯狂进出爽爽爽动态图

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

生成式AI浪潮只有GPU受益?打開格局,這些芯片能讓AIGC更大眾化

2023-10-18 來源:賢集網(wǎng)
1282

關(guān)鍵詞: 人工智能 英特爾 芯片

近日,Intel舉辦了一場年度技術(shù)創(chuàng)新大會,AI自然是關(guān)鍵詞中的關(guān)鍵詞,“AI Everywhere”不僅體現(xiàn)在整個大會上,也體現(xiàn)在Intel的全線產(chǎn)品和解決方案中,當(dāng)然,作為軟硬件實力都在這個星球上屬于頂級行列的Intel,自然也是最有資格談?wù)揂I的巨頭之一。

AI無處不在,從產(chǎn)品到技術(shù)再到應(yīng)用都有截然不同的豐富場景,普通用戶能夠最直接感受到的當(dāng)屬AIGC,包括文生文、文生圖、圖生圖、文生視頻、圖生視頻等等。而要想實現(xiàn)足夠?qū)嵱玫腁IGC,從算力強(qiáng)大的硬件到參數(shù)豐富的大模型,從精確合理的算法到高效便捷的應(yīng)用,缺一不可。

我們知道,在過去,AIGC更多在云側(cè)服務(wù)器上,雖然性能、模型、算法都不是問題,但一則需要大量的資金投入,二則存在延遲、隱私等方面的不足。因此,AIGC正越來越多地下沉到終端側(cè),讓普通的PC電腦、智能手機(jī)也能跑AIGC,甚至可以離線執(zhí)行。



人人都能享受到AIGC

Intel中國技術(shù)部總經(jīng)理高宇先生在接受采訪時就表示,關(guān)于終端側(cè)運行AIGC的研究已經(jīng)取得了豐碩的成果,比如最新的13代酷睿電腦,經(jīng)國有化已經(jīng)可以流暢運行70億到180億參數(shù)的大模型,尤其是70億到130億參數(shù)的運行效果相當(dāng)好。

當(dāng)然這些現(xiàn)在還處于起步階段,目前的優(yōu)化主要針對CPU處理器,下一步會充分發(fā)揮GPU核顯的性能潛力,而代號Meteor Lake的下一代酷睿Ultra除了有更強(qiáng)的CPU、GPU算力,還會首次集成NPU單元,一個專用的AI加速器,峰值算力超過11TOPS,三者結(jié)合可以達(dá)到更好的效果。

對于PC端側(cè)運行AIGC應(yīng)用的具體落地實現(xiàn),高宇舉了個例子,Intel正在打造的一個開源框架BigDL-LLM,專門針對Intel硬件的低比特量化設(shè)計,支持INT3、INT4、INT5、INT8等各種低比特數(shù)據(jù)精度,性能更好,內(nèi)存占用更少。

基于這個框架,使用i9-12900K處理器,只開啟4個核心來運行ChatGLM2 60億參數(shù)模型,生成效果就是相當(dāng)迅速的,而打開全部8個P核、8個E核,效果更是堪稱飛快,輸出性能達(dá)到了每個Token 47毫秒左右,已經(jīng)不弱于很多云側(cè)計算。

之所以對比兩種情況,因為有時候需要將全部算力投入AI模型的運算,而有時候可能還得兼顧其他任務(wù)。

可以看出,無論哪種情況,Intel PC側(cè)都已經(jīng)可以很好地完成相應(yīng)的AI工作,提供令人滿意的算力和效率。

此外,在LLaMA2 130億參數(shù)大語言模型、StarCoder 155億參數(shù)代碼大模型上,Intel酷睿處理器也都能獲得良好的運行速度。

換到Arc GPU顯卡上,Intel硬件跑端側(cè)AI同樣神速,甚至更快,無論是ChatGLM2 60億參數(shù),還是LLaMA2 130億參數(shù)、StarCoder 155億參數(shù),都是如此,ChatGLM2模型中甚至可以縮短到20毫秒以下。

當(dāng)然,以上說的大模型可能距離普通人還有些遠(yuǎn),而任何一項技術(shù)要想大范圍普及,關(guān)鍵還是顛覆用戶的切身工作、生活、娛樂體驗,AI當(dāng)然也不例外。

在高宇看來,基于以上大模型,AI在端側(cè)的典型應(yīng)用還是相當(dāng)豐富的,而且會越來越多,有時候效果會更勝于運行在云側(cè)。



AIGC的底層基石:算力

AI的發(fā)展,一方面依賴于模型和算法,另一方面則依賴于芯片的算力。在電腦上,CPU擅長數(shù)值計算,能夠推理出復(fù)雜的邏輯,缺點是計算速度較慢,不能并行處理任務(wù)。如果把CPU比作一個人的大腦 ,那么GPU和FPGA就相當(dāng)于四肢,可以幫助它執(zhí)行任務(wù)。

在訓(xùn)練單位方面,以ChatGPT為代表的人工智能大模型訓(xùn)練和推理需要強(qiáng)大的計算支持。ChatGPT單次訓(xùn)練所需算力約27.5PFlop/s-day,單顆NVIDIA V100芯片深度學(xué)習(xí)算力為125TFlops,則ChatGPT模型的訓(xùn)練至少需要1顆V100芯片計算220天(27.5*1000/125=220)才能完成。

在訓(xùn)練成本方面。GPT-3的數(shù)據(jù)訓(xùn)練需要45TB。訓(xùn)練該模型所需的算力是3640PF,總成本高達(dá)1200萬美元。2021年,全球計算設(shè)備算力總規(guī)模達(dá)到615EFlop/s,而到2023年,全球大模型訓(xùn)練所需全部算力相當(dāng)于超過200萬張A100顯卡。預(yù)計到2030年,全球算力規(guī)模將達(dá)到56ZFlps,年均增長率約為65%。我國計算設(shè)備算力總規(guī)模達(dá)到202EFlops,占全球約33%。

算力硬件層是構(gòu)成AIGC產(chǎn)業(yè)的核心底座,AIGC需要大量的計算和數(shù)據(jù)處理,隨著AIGC產(chǎn)品持續(xù)升級對芯片算力提出更高要求,AI芯片算力和需求旺盛增長。據(jù)Gartner數(shù)據(jù),全球AI芯片市場規(guī)模有望在2021年達(dá)343億美元,2025年將逾700億美元,CAGR約為20%。


四類芯片獲得發(fā)展動力

AIGC算力硬件層,主要包括AI芯片、AI服務(wù)器和數(shù)據(jù)中心,其中AI芯片主要應(yīng)用于模型訓(xùn)練(training)和推斷(inference)兩個步驟,并主要可劃分為CPU、GPU、FPGA和ASIC四類。

具體來看,CPU(Central Processing Unit)中央處理器是計算機(jī)的運算和控制核心(Control Unit),是信息處理、程序運行的最終執(zhí)行單元,主要功能是完成計算機(jī)的數(shù)據(jù)運算以及系統(tǒng)控制功能。

報告指出,在數(shù)據(jù)中心和新一代信息技術(shù)升級帶動下,中國服務(wù)器市場規(guī)模2027年將達(dá)143.7億美元,根據(jù)服務(wù)器成本結(jié)構(gòu)構(gòu)成,CPU為核心芯片,服務(wù)器市場的增長將帶動服務(wù)器CPU需求上升。根據(jù)IDC數(shù)據(jù),2022年全球服務(wù)器出貨量突破1516萬臺,同比增長12%,產(chǎn)值達(dá)1215.8億美金。

市場格局上,在2022年全球數(shù)據(jù)中心CPU市場中,英特爾以70.77%的市場份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠商僅占據(jù)9.39%的市場份額,整體上處于壟斷局面。集微咨詢測算2022年全球CPU市場規(guī)模約為777億美元,其中全球服務(wù)器CPU市場約為233億美元。

目前國內(nèi)CPU廠商主有海光、海思、飛騰、龍芯、申威等。通過產(chǎn)品對比發(fā)現(xiàn),國產(chǎn)服務(wù)器CPU性能已接近Intel中端產(chǎn)品水平,但整體上國內(nèi)CPU廠商仍在工藝制程、運算速度(主頻)、多任務(wù)處理(核心與線程數(shù))方面落后于國際先進(jìn)水平。

GPU(圖形處理器),最初是為了解決CPU在圖形處理領(lǐng)域性能不足的問題而誕生。GPU架構(gòu)內(nèi)主要為計算單元,采用極簡的流水線進(jìn)行設(shè)計,適合處理高度線程化、相對簡單的并行計算,在圖像渲染等涉及大量重復(fù)運算的領(lǐng)域擁有更強(qiáng)運算能力,并演進(jìn)出GPGPU,即通用計算圖形處理器(general-purpose GPU)以更好支持通用計算,GPGPU減弱了GPU圖形顯示部分的能力,將其余部分全部投入到通用計算中,同時增加了專用向量、張量、矩陣運算指令,提升了浮點運算的精度和性能,以實現(xiàn)人工智能、專業(yè)計算等加速應(yīng)用。

GPU因其強(qiáng)大的并行計算能力而廣泛應(yīng)用于人工智能、圖像渲染、科學(xué)計算等領(lǐng)域。AI、自動駕駛與游戲市場是GPU需求增長的主要場景,其中AI領(lǐng)域大語言模型的持續(xù)推出以及參數(shù)量的不斷增長有望驅(qū)動模型訓(xùn)練端、推理GPU需求快速增長,2021年全球GPU市場規(guī)模為334.7億美元,預(yù)計2030年將達(dá)到4773.7億美元,CAGR(2021-2030)為34.35%。

從國內(nèi)市場來看,2020年中國大陸的獨立GPU市場規(guī)模為47.39億元,預(yù)計2027年市場規(guī)模將達(dá)345.57億元,CAGR(2020-2027)為32.8%。

全球GPU芯片市場主要由海外廠商占據(jù)壟斷地位,國產(chǎn)廠商加速布局。全球GPU市場被英偉達(dá)、英特爾和AMD三強(qiáng)壟斷,英偉達(dá)憑借其自身CUDA生態(tài)在AI及高性能計算占據(jù)絕對主導(dǎo)地位,英偉達(dá)高端GPU占據(jù)較大份額(超過70%);國內(nèi)市場中,景嘉微、天數(shù)智芯、壁仞科技、登臨科技等企業(yè)基本處于起步階段。

FPGA,是一種硬件可重構(gòu)的集成電路芯片,通過在硅片上預(yù)先設(shè)計實現(xiàn)具有可編程特性,可通過軟件重新配置芯片內(nèi)部的資源來實現(xiàn)不同功能,廣泛應(yīng)用于數(shù)據(jù)中心、航空航天工程、人工智能、工業(yè)、物聯(lián)網(wǎng)以及汽車等領(lǐng)域。在5G通信、人工智能等迭代升級周期頻繁、技術(shù)不確定性較大的領(lǐng)域,F(xiàn)PGA是較為理想的解決方案。

報告預(yù)測,2020-2026年全球FPGA出貨量有望從5.11億顆增至8.25顆,CAGR為8.3%,F(xiàn)PGA市場規(guī)模從55.85億美元增至96.9億美元,CAGR為9.6%。

中國FPGA市場2020年的市場規(guī)模約150.3億元,預(yù)計2025年中國FPGA市場規(guī)模將達(dá)到332.2億元,復(fù)合增速為17.2%。FPGA需要由FPGA芯片、EDA軟件及IP方案組成的軟硬件生態(tài)系統(tǒng)共同支撐實現(xiàn)功能,邏輯容量、制程、SerDes速率等關(guān)鍵指標(biāo)體現(xiàn)FPGA硬件技術(shù)水平,F(xiàn)PGA EDA軟件工具非常復(fù)雜,F(xiàn)PGA軟硬件生態(tài)系統(tǒng)建立了極高的行業(yè)壁壘。

全球FPGA市場主要被賽靈思(AMD)和Altera(英特爾)占據(jù),目前市占率分別為52%和35%;中國FPGA廠商中紫光國微、復(fù)旦微電和安路科技在2021年中國的本土市場的市占率超過15%。受益于國產(chǎn)化加速推進(jìn),中國FPGA廠商將擁有巨大成長空間。



ASIC芯片,是為特定用途而定制的集成電路,具有高性能、低能耗的特點,專用化程度最高,其特點同時適合AI訓(xùn)練和推理階段的使用。

目前全球ASIC市場并未形成明顯的頭部廠商,國產(chǎn)廠商快速發(fā)展;國外谷歌、英特爾等公司在ASIC布局較早,已經(jīng)有較為成型的產(chǎn)品。目前國產(chǎn)廠商海思、遂原科技和寒武紀(jì)的產(chǎn)品在整體性能上也與谷歌比肩。未來國產(chǎn)廠商有望在ASIC領(lǐng)域繼續(xù)保持技術(shù)優(yōu)勢,突破國外廠商在AI芯片的壟斷格局。

AIGC熱潮帶動AI服務(wù)器需求飆升,也使部分高端存儲芯片受益。

本期報告指出,隨著AIGC的逐漸成熟,為存儲器帶來對應(yīng)顯存量的提升。其中包括單臺服務(wù)器加速卡數(shù)量的增長、單張AI加速卡中顯存容量的增長;AI服務(wù)器中將會有更高的內(nèi)存滿插率及后續(xù)CPU新平臺有望支持更多的內(nèi)存模組通道;相比于普通服務(wù)器固態(tài)硬盤占比有望大幅提升。

在AI服務(wù)器中應(yīng)用的存儲芯片主要包括:高帶寬存儲器(HBM)、DRAM和SSD,針對AI服務(wù)器的工作場景需要提供更大的容量、更高的性能、更低的延遲和更高的響應(yīng)速度。

分品類看,HBM(High Bandwidth Memory,高帶寬存儲器)是可以實現(xiàn)高帶寬的高附加值DRAM產(chǎn)品。HBM將多個DDR芯片3D堆疊在一起后和主芯片封裝在一起,有高帶寬、低功耗等特點。

以HBM為代表的超高帶寬內(nèi)存技術(shù)有力支撐了AIGC開發(fā),而生成式模型也會加速HBM內(nèi)存進(jìn)一步增大容量和增大帶寬,AIGC發(fā)展將帶動第三代HBM量價齊升,預(yù)計2023-2025年HBM市場CAGR有望成長至40-45%以上,至2025年市場規(guī)模有望達(dá)25億美元,市場需求快速提升。

隨著中國智能化、數(shù)字化、信息化技術(shù)的深入發(fā)展,各大領(lǐng)域?qū)τ诟咝阅軆Υ嫫鳟a(chǎn)品的需求將持續(xù)增長,加之HBM應(yīng)用領(lǐng)域向智能駕駛、通信設(shè)備等領(lǐng)域拓展,HBM需求量將保持較高的增速。

而對于服務(wù)器核心存儲器,與消費級SSD相比,企業(yè)級SSD產(chǎn)品需要具備更快傳輸速度、更大單盤容量、更高使用壽命以及更高的可靠性要求。

企業(yè)級SSD下游客戶主要來自云計算,占總市場規(guī)模的份額達(dá)到67%,企業(yè)級SSD將充分受益云基礎(chǔ)設(shè)施增量。根據(jù)Yole數(shù)據(jù),全球SSD市場規(guī)模在2022年為290億美元,總出貨量為3.52億塊,其中大約5500萬塊是企業(yè)SSD,其余為消費級SSD。預(yù)計2028年市場規(guī)模會達(dá)到670億美元,出貨量為4.72億塊,復(fù)合年增長率為15%。

本期報告,集微咨詢詳細(xì)梳理了AI芯片領(lǐng)域國內(nèi)企業(yè)發(fā)展情況,指出AI發(fā)展的海量數(shù)據(jù)對數(shù)據(jù)處理提出極高要求,AI芯片需求快速增長,盡管全球AI芯片市場被英偉達(dá)壟斷,然而國產(chǎn)AI算力芯片賽道正燃起星星之火。目前,國內(nèi)已涌現(xiàn)出了如寒武紀(jì)、海光信息等優(yōu)質(zhì)AI算力芯片上市公司,非上市AI算力芯片公司如沐曦、天數(shù)智芯、壁仞科技等亦在產(chǎn)品端有持續(xù)突破。

從不同細(xì)分市場看,經(jīng)過多年發(fā)展,國產(chǎn)CPU初步形成六大廠商齊頭并進(jìn)格局。“十五”期間,國家啟動發(fā)展國產(chǎn)CPU的泰山計劃,863計劃也提出自主研發(fā)CPU。2006年核高基專項啟動,國產(chǎn)CPU領(lǐng)域迎來了新一輪的國家支持。鯤鵬、飛騰、龍芯、兆芯、海光、申威等一批優(yōu)質(zhì)國產(chǎn)CPU企業(yè)再度啟航。