高通2024年將發(fā)布哪些芯片?更大的“野心”在AI PC
誰能想到,2024年剛開年,高通就在“大沖刺”一般地加快步伐了。
根據(jù)知名爆料數(shù)碼博主@數(shù)碼閑聊站透露,高通將于近期發(fā)布驍龍7+ Gen3以及驍龍8sGen3兩款處理器,從命名方式和現(xiàn)階段透露的參數(shù)來看,兩者的定位應(yīng)該都是中端市場,但有意思的是:驍龍7+ Gen3會(huì)是史上最強(qiáng)的驍龍7系處理器,甚至有可能威脅到當(dāng)今旗艦驍龍8 Gen3的地位。
這就讓小雷有些摸不著頭腦了,按照高通之前的產(chǎn)品策略,一般都是讓8系作為真旗艦,7系則是在兩三千元檔手機(jī)市場中「大殺四方」,為何今年一開年就要推出兩款定位中端且實(shí)力遠(yuǎn)超市場預(yù)期的處理器呢?
驍龍7+ Gen3,人稱“小8 Gen3”?
驍龍7+ Gen3相比去年發(fā)布的驍龍7 Gen3可謂是進(jìn)步明顯,在性能和能耗上都實(shí)打?qū)嵉剡_(dá)到了旗艦水準(zhǔn)。此話并非空穴來風(fēng),驍龍7+ Gen3采用的是驍龍8 Gen 3同款架構(gòu),也就是「1+4+3」的旗艦架構(gòu),內(nèi)部核心也同樣為Cortex-X4(超大核)、Cortex-A720(中核)、Cortex-A520(小核),唯一的區(qū)別在于頻率方面有一定的閹割。不過GPU部分倒是從Adreno 750縮水成了Adreno 732,對于重度手游玩家來說可能有一定的影響。
其中閹割最明顯的莫過于Cortex-X4超大核,從3.3GHz的睿頻降到了2.8GHz,這0.5GHz的差異會(huì)讓驍龍7+ Gen3在超高負(fù)載場景下的性能表現(xiàn)被驍龍8 Gen3拉開一截,但也只是超高負(fù)載場景,像日常使用以及一些常規(guī)的高負(fù)載場景,兩者的差距幾乎可以視為0,你甚至可以把它看作是驍龍8 Gen2的加強(qiáng)版。
而驍龍8s Gen3和8 Gen3的差距就更小了,兩者無論是在核心和GPU方面的差異都在10%以內(nèi),但功耗部分卻有明顯的下降,如此細(xì)微的差距讓小雷有些難以理解。
唯一讓小雷覺得合理的部分是,目前曝光將搭載這兩款處理器的機(jī)型均是兩三千元檔的中端手機(jī),雖說產(chǎn)品力也相當(dāng)不俗,但對比起各家的旗艦仍有不小的差距。
驍龍全新旗艦芯來了!
高通宣布將在 3 月 18 日舉行驍龍旗艦新品發(fā)布會(huì),屆時(shí)將帶來全新的驍龍旗艦芯片產(chǎn)品。雖然目前高通并未透露關(guān)于新芯片的更多信息,不過已經(jīng)有不少可靠消息被披露。
首先高通即將推出的旗艦芯片共有兩款,分別是驍龍 8s Gen3 和驍龍7+ Gen3,其核心架構(gòu)繼承驍龍8 Gen3,技術(shù)上也與之同代同系,均采用臺(tái)積電 4nm 工藝制造,定位新一代次旗艦 5G 芯片平臺(tái)。
在核心規(guī)格上,驍龍 8s Gen3 的 CPU 由 1 × Cortex X4 超大核心(3.01GHz)、4 × A720 大核心(2.61GHz )和 3 × A520 小核心(1.84GHz )組成,圖形處理器 GPU 為 Adreno 735。
從這里可以發(fā)現(xiàn),驍龍 8s Gen3 最高主頻 3.01GHz 要低于驍龍 8 Gen3 的 3.30GHz,換句話來說,前者是后者的降頻版,其綜合性能介于驍龍8 Gen2 和驍龍8 Gen3 之間,預(yù)計(jì)安兔兔跑分在 170 萬分附近,這與大眾“8s”名稱會(huì)強(qiáng)于“8”的普遍認(rèn)知相悖。
沒錯(cuò),驍龍 8s Gen3 可以理解為是驍龍 8 Gen3 青春版,理論上其續(xù)航和發(fā)熱表現(xiàn)會(huì)更好。
高通驍龍7+ Gen 3 同樣采用“1+4+3”的核心架構(gòu),分別是 1 × Cortex X4(2.9GHz)+ 4 × A720(2.6GHz )+ 3 × A520(1.9GHz ),GPU為 Adreno 732。
可以發(fā)現(xiàn),驍龍 7+ Gen3 最高主頻 2.9GHz 要低于驍龍 8s Gen3 的 3.01GHz,也就是說驍龍 7+ Gen3 可以理解為驍龍 8s Gen3 的青春版。
驍龍7+ Gen 3 的綜合性能“plus”如其名,將會(huì)顯著超過驍龍7 Gen3 和驍龍7+ Gen2,安兔兔跑分超 150 萬,性能介于驍龍8+ Gen1 和驍龍8 Gen2 之間。
高通的AI野心
作為全球芯片巨頭,高通公司在本次MWC上也發(fā)布了多款A(yù)I賦能的重磅產(chǎn)品,并帶來多個(gè)生成式AI方面的展示。
去年10月,高通發(fā)布了面向手機(jī)的第三代驍龍8移動(dòng)平臺(tái),以及面向PC的驍龍X Elite平臺(tái),引起了全行業(yè)的轟動(dòng)。
這兩款平臺(tái),都在AI能力上進(jìn)行了重點(diǎn)升級。第三代驍龍8甚至被稱為首款“專為生成式AI”而精心打造的移動(dòng)平臺(tái),采用基于異構(gòu)計(jì)算架構(gòu)的高通AI引擎,其中Hexagon NPU等AI計(jì)算硬件全面加強(qiáng),大幅提升了終端側(cè)的AI能力。
第三代驍龍8可處理的大模型參數(shù)超過100億,每秒可生成高達(dá)20個(gè)Token。而驍龍X Elite更是支持PC運(yùn)行超過130億參數(shù)的大模型,運(yùn)行70億參數(shù)大模型每秒生成30個(gè)Token。如果把這個(gè)衡量標(biāo)準(zhǔn)放在具體情境中,普通人每分鐘可閱讀約200-300個(gè)單詞,這相當(dāng)于每秒處理5-7個(gè)tokens,而驍龍的終端側(cè)AI的書寫速度比人們的閱讀速度還要快。這種底層AI能力堪稱是顛覆性的。
正是基于驍龍強(qiáng)大的平臺(tái),小米、榮耀、OPPO、iQOO、一加、三星等廠商自去年年底發(fā)布的眾多智能手機(jī)旗艦產(chǎn)品,才擁有卓越的終端側(cè)AI能力,能夠?qū)IGC大模型在終端落地提供支持。同時(shí),在即時(shí)性、可靠性、隱私以及個(gè)性化等方面,也帶來了顯著的提升。
高通在本次MWC上的發(fā)布,重點(diǎn)聚焦在通信連接能力上。
他們推出了兩個(gè)重要的解決方案,分別是高通FastConnect 7900系統(tǒng),以及驍龍X80 5G調(diào)制解調(diào)器及射頻系統(tǒng)。
雙管齊下,推動(dòng)終端側(cè)生成式 AI 生態(tài)建設(shè)
而在軟件和應(yīng)用生態(tài)建設(shè)方面,高通則是同時(shí)“兩手發(fā)力”,一方面在軟件層面為開發(fā)者打造生成式 AI 應(yīng)用提供便利,另一方面則是積極和終端以及應(yīng)用廠商合作,推動(dòng)生成式 AI 創(chuàng)意應(yīng)用以及終端產(chǎn)品的落地。
比如高通一開始就意識(shí)到,讓開發(fā)者能夠獲取基于異構(gòu)計(jì)算的 AI 加速,對于終端側(cè)生成式 AI 的規(guī)?;瘮U(kuò)展至關(guān)重要,因此他們打造了 AI 軟件棧(Qualcomm AI Stack)。它能夠支持目前所有的主流 AI 框架,包括 TensorFlow、PyTorch、ONNX、Keras;它還支持所有主流的 AI runtime,包括 DirectML、TFLite、ONNX Runtime、ExecuTorch,以及支持不同的編譯器、數(shù)學(xué)庫等 AI 工具。
此外他們還推出了 Qualcomm AI studio,為開發(fā)者提供開發(fā)過程中需要用到的相關(guān)工具,其中包括支持模型量化和壓縮的高通 AI 模型增效工具包(AIMET),能夠讓模型運(yùn)行更加高效。高通 AI 軟件棧是當(dāng)前邊緣側(cè)的業(yè)界領(lǐng)先解決方案。
同時(shí),高通還專注于 AI 模型優(yōu)化,以實(shí)現(xiàn)能效和性能提升。他們認(rèn)為,快速的小型 Al 模型如果只能提供低質(zhì)量或不準(zhǔn)確的結(jié)果,那么將失去實(shí)際用處。因此,高通采用了全面而有針對性的策略,包括量化、壓縮、條件計(jì)算、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索(NAS) 和編譯,在不犧牲太多準(zhǔn)確度的前提下縮減 Al 模型,使其高效運(yùn)行。即使是那些已經(jīng)面向移動(dòng)終端優(yōu)化過的模型我們也會(huì)進(jìn)行這一工作。
例如,量化有益于提升性能、能效、內(nèi)存帶寬和存儲(chǔ)空間。Hexagon NPU 原生支持 INT4,高通 AI 模型增效工具包(AIMET)5 提供基于高通 AI 研究技術(shù)成果開發(fā)的量化工具,能夠在降低位數(shù)精度的同時(shí)限制準(zhǔn)確度的損失。
對于生成式 AI 來說,由于基于 Transformer 的大語言模型(比如 GPT、Bloom 和 Llama)受到內(nèi)存的限制,在量化到 8 位或 4 位權(quán)重后往往能夠獲得大幅提升的效率優(yōu)勢。
高通的這些努力也帶來了現(xiàn)實(shí)中實(shí)際應(yīng)用的意義,從去年下半年到今年,不少手機(jī)廠商都在自家的產(chǎn)品中引入了端側(cè) AI 大模型,這背后本質(zhì)上就離不開與高通的深入合作攻關(guān)。以 OPPO 為例,他們在 OPPO Find X7 旗艦手機(jī)中搭載了自主訓(xùn)練的 AndesGPT 70 億參數(shù)大模型,在此基礎(chǔ)上實(shí)現(xiàn)了通話摘要、AIGC 消除等熱門出圈的功能。
而 70 億參數(shù)的 AndesGPT 大模型能夠在終端上以低功耗的方式順暢運(yùn)行第三代驍龍 8 平臺(tái)對 INT4 量化技術(shù)的支持也可以提供強(qiáng)大的助力。OPPO 已經(jīng)可以利用 INT4 量化技術(shù)實(shí)現(xiàn)對模型的大幅度壓縮,讓原本占用 28GB 內(nèi)存的模型現(xiàn)在只需要 3.9GB,降低資源需求的同時(shí)也幾乎不影響 AI 模型的輸出效果。
除了終端硬件廠商,高通也在與軟件廠商們合作推動(dòng)生成式 AI 應(yīng)用的落地,比如此前有報(bào)道稱,他們和國內(nèi)的慧鯉科技,面向第三代驍龍 8 開發(fā)了一個(gè)神經(jīng)網(wǎng)絡(luò),能夠重構(gòu)照片缺失的部分,即“照片擴(kuò)充”,它能支持用戶對照片進(jìn)行縮放,讓照片看起來具有廣角效果,即使并非用廣角鏡頭拍攝。
再回到軟件方面,今年的 MWC 上,高通還推出了全新的高通 AI Hub,可以為開發(fā)者提供全面優(yōu)化的 AI 模型庫,包括傳統(tǒng) AI 模型和生成式 AI 模型,能夠支持在驍龍和高通平臺(tái)上進(jìn)行部署。
開發(fā)者只需選擇應(yīng)用所需的模型以及其開發(fā)應(yīng)用所使用的框架,然后確定目標(biāo)平臺(tái),例如一款特定型號(hào)的手機(jī)、或者一款特定型號(hào)的高通平臺(tái),簡單來說,只需要幾行代碼就可以獲取模型,并將模型集成進(jìn)應(yīng)用程序,大大節(jié)省了開發(fā)者在應(yīng)用中部署 AI 大模型的時(shí)間和工作量。
還有在 PC 方面,驍龍 X Elite 最重要的合作者莫過于微軟,高通一直在和微軟工程團(tuán)隊(duì)合作優(yōu)化全新平臺(tái)的特性,微軟表示,絕大多數(shù)頂級應(yīng)用都將以超快速度和能效在搭載驍龍 X Elite 計(jì)算平臺(tái)的 Windows PC 上原生運(yùn)行或通過無縫仿真運(yùn)行,特別是微軟自身的生產(chǎn)力應(yīng)用,包括 Word, Excel, Powerpoint, Edge, Teams, OneDrive, OneNote 和 Outlook 都是原生的。
對于 Windows 11,微軟也改進(jìn)了 Windows Studio Effects、宣布推出了 AI Library,在更新中為 Copilot 和 Paint 等收件箱應(yīng)用程序中引入生成式 AI,還與諸如 Camo、Luminar Neo、WhatsApp 等進(jìn)行合作,共同優(yōu)化 Windows 平臺(tái)的生成式 AI 應(yīng)用體驗(yàn)。
總之,高通正基于 AI 軟件棧和核心硬件 IP,跨過所有不同產(chǎn)品線,將應(yīng)用規(guī)模化擴(kuò)展到不同類型的終端,從智能手機(jī)到 PC、物聯(lián)網(wǎng)終端、汽車等等。這無疑為其合作伙伴以及用戶帶來顯著優(yōu)勢,開發(fā)一次就能覆蓋高通不同芯片組解決方案的不同產(chǎn)品和細(xì)分領(lǐng)域進(jìn)行部署,極大地助力廠商和開發(fā)者將打造生成式 AI 應(yīng)用的效率和收益最大化。
