今年的驍龍峰會大概率會提前到九月份,作為高通每年最隆重的盛會,除了下一代旗艦手機芯片外,PC、音頻等不同領域的下一代芯片也會悉數亮相,堪稱移動智能領域的前沿成果展示。
或許正是因為時間愈發臨近,所以下一代驍龍芯片的參數也開始陸續泄露,比如備受關注的驍龍 X2 Elite。作為驍龍 X 系列的第二代產品,驍龍 X2 Elite 承載了 Windows Arm PC 陣營的諸多寄托,可以說沒有失敗的理由,也不能失敗。
高通也明白這一點,所以從泄露的參數來看,驍龍 X2 Elite 對比前代有著非常明顯的區別,甚至可以說是一款完全自我革新的產品。
在去年的驍龍峰會上,高通為我們帶來了第一代驍龍 X 系列芯片,作為驍龍在 Arm PC 市場的革命性突破產品,雖然性能與旗艦處理器還有一定差距,但是出色的能效表現使其成為輕薄本的最佳選擇之一。
不過,對于 PC 用戶來說,性能仍然是所有人都無法忽視的核心,MacBook 在 PC 市場的份額持續提升,賣點并非只有續航,與 x86 芯片相比也毫不遜色的性能十分關鍵。這也是 Windows 陣營的 Arm PC 所面臨的尷尬問題之一,續航是有了,性能卻因為轉譯等問題損失不低,與傳統 x86 仍然有不小差距。
而且驍龍 X 系列芯片因為采用單片系統級設計(也就是常說的 SoC),所以設計與制造成本都不低,導致前期的驍龍 PC 價格昂貴,直接缺席了銷量最高的中低端市場,錯失了前期的最佳發育期。
即使后續通過優化產品線結構等方法,進一步降低了驍龍 PC 的入門價格,但是仍然面臨不少問題。比如傳統單片系統的設計靈活度不足,導致面向中低端市場的驍龍 X Plus 的輕量版直到 2025 年才陸續上市,而且制造成本其實并不比滿血版低多少。
所以,轉向系統級封裝是必然的選擇,與傳統的 SoC 方案相比,系統級封裝可以根據需求靈活增減芯片,根據設備廠商的需求給出定制級的產品,同時也可以嚴控成本。因為系統級封裝并不強制要求所有單元均采用相同工藝,意味著廠商可以根據需要選擇更具性價比的方案,然后再進行組合。
而且系統級封裝下,芯片之間的連接距離極短,可以顯著減少信號傳輸的延遲和更高的傳輸速率,并且進一步降低芯片功耗。對于 Arm 架構來說,這點非常重要,因為 Arm 的指令集追求精簡,在同等性能下 Arm 芯片執行的指令數量會明顯高于 x86 芯片,這意味著芯片之間的交流會非常頻繁。
簡而言之,系統級封裝可以讓 Arm 的指令以更高的效率在芯片之間流轉,實質上提高了整個芯片系統的性能。蘋果最早在 M1 Ultra 上使用了系統級封裝技術,讓兩顆 M1 Max 能夠以極低的延遲互聯,通過這種 " 量變促質變 " 的方式,在單芯片性能有限的情況下,將初代 M1 系列的性能上限拔高到了恐怖的程度。
說實話,也正是 M1 Ultra 的恐怖性能和能效表現,讓許多人對 Arm 架構的 PC 芯片有了全新的認知,人們不再認為 x86 架構才是高性能 PC 芯片的唯一選擇,因為蘋果已經用 M1 Ultra 證明了 Arm 的潛力。
考慮到系統級封裝在 M 系列芯片上的出色表現,采用相同技術的驍龍 X2 Elite 也讓我十分期待。而且,驍龍 X2 Elite 是否有可能更進一步,學習蘋果折騰出一個 " 雙芯 " 版的驍龍 X2 Ultra 呢?
從曝光的信息來看,除了系統級封裝外,驍龍 X2 Elite 的核心數也迎來暴漲,從最高 12 核心變為 18 核心,同時封裝的統一內存最高可達 64GB。即使不考慮核心架構變動所帶來的性能提升,僅核心數和內存的暴漲就足以讓驍龍 X2 Elite 在高端 PC 市場占有一席之地。
顯然,驍龍 X Elite 的市場表現讓高通明白,用戶對于能效的需求是存在邊際效應的,當 PC 續航超過一定時長后,繼續增加的續航并不會給用戶帶去更多的體驗提升。簡單來說就是吸引力會逐漸下降,多數用戶并不會為了更長的續航去花更多的錢,而是更愿意為 " 性能 " 付費。
畢竟,更高的性能則意味著 Arm PC 可以承擔更多復雜的工作,讓 Arm PC 的定位不再限于移動辦公領域,而是可以拓展到其他生產力領域。其實 Arm PC 的性能競賽早已有端倪,不提蘋果的 M 系列芯片,英偉達此前宣布的 Arm 架構 CPU 也是走的性能至上路線。
從海外媒體曝光的資料來看,英偉達設計的 Arm CPU 將集成封裝一顆高性能的 GPU 核心,其核心性能與 RTX 4070 相同,在目前的 Arm 架構芯片中也是處于前列的存在,可以說僅次于 M4 系列的高端型號。
不過,為了支撐這顆高性能 GPU 的運行,這顆代號 GB10 的芯片功耗可能超過 100W,雖然與傳統的 x86+ 獨立 GPU 方案比功耗明顯降低,但是放在筆記本電腦上仍然有些高了,這也意味著其全性能模式下的續航表現并不會亮眼。
如果說高通是在確保能效的情況下,盡可能提升性能去迎合更多市場,那么英偉達則是走了極致性能路線,能效顯然不是第一考量。在我看來,造成這個差距的原因之一或許是 GB10 還要兼顧桌面市場,英偉達曾經展示過用 GB10 構建桌面小型服務器和 PC,對于桌面設備來說,功耗的優先度顯然不高(參考蘋果的 Ultra 版 M 系列芯片)。
而在蘋果和英偉達之后,高通顯然也不會完全忽視桌面端市場,驍龍 PC 芯片登錄桌面端基本上是板上釘釘的事情,問題只在什么時候發布而已。不過,隨著驍龍 X2 Elite 的參數規格暴漲,配合系統級封裝,我覺得這個時刻離我們并不會遙遠。
另一方面,PC 市場已經進入存量爭奪階段,對于 PC 廠商來說,接下來就是 " 刺刀見紅 " 的階段了。AMD 和英特爾兩大老牌廠商也在吸收 Arm PC 芯片的精髓,通過系統級封裝、先進制程來降低能耗,同時賦予處理器出色的綜合性能。
比如 AMD 的銳龍 AI MAX+395,采用系統級封裝,擁有 16 核 32 線程的 CPU 和 RX 8060S GPU,并且最高支持 128GB 的統一內存,使其成為唯一可以本地流暢運行 70B 版 DeepSeek 模型的移動端 APU。
隨著系統級封裝技術的普及,未來 PC 市場的競爭重心或許也將逐漸轉向高性能的 APU 競爭。而在 APU 層面,Arm CPU 的高能效特點優勢明顯,因為 GPU 本身對功耗的極高要求,就意味著與其搭配的 CPU 必須具有更高的能效比,才能在更小的功耗下給出足夠的性能去支持 GPU 的運算。
簡單來說,在整機功耗恒定為 100W 的情況下,如果說 CPU 的平均功耗可以降低到 15W,那么 GPU 就可以擁有 85W 的功率調度空間。不要小看了 10W 的差距,在英偉達的移動端 GPU 里,同一款 GPU 在 75W 和 85W 的狀態下性能可以相差超過 10%。
所以使用系統級封裝技術將 Arm CPU 與高性能 GPU 整合為一塊芯片,并且配上高規格的統一內存,或許會是未來 Arm PC 的主要方向。這樣的搭配不僅可以滿足游戲需求,同時也可以更好應對 AI 方面的需求,對于普通消費者來說,這樣一場技術與市場的大戰無疑是最值得期待的。