愛伊米

英特爾、英偉達、AMD打響“全面戰役”

一系列接二連三的大事件,為英特爾、英偉達、AMD三大巨頭圍繞數字化時代的異構計算CPU+GPU+FPGA/DPU的“競奪”提供了更多的想象空間,也成為了日後分野的新註解。

英特爾在獨立GPU領域捲土重來,在IPU領域亦不斷出新,藉助在硬體、軟體、架構和製程方面的革新以及IDM2。0戰略重兵壓陣。AMD收購賽靈思落定之後,補齊了FPGA的短板,前不久AMD又宣佈以約19億美元收購雲服務提供商Pensando,至此AMD正式進入DPU領域,為其資料中心藍圖補上關鍵一環。英偉達雖收購Arm被迫“放手”,但已有基於Arm的CPU作為重要“補給”,並透過收購補齊DPU,欲在異構時代大展身手。

三大巨頭的火拼已然深入腹地,英特爾、英偉達、AMD的爭奪已呈現出“全面戰役”的態勢。

英特爾、英偉達、AMD打響“全面戰役”

GPU領域競奪“重啟”

在異構計算領域,GPU可說是必須倚重的“彈藥”。

作為異構時代和新興應用驅動下的最大受益者之一,隨著伺服器、汽車、人工智慧、邊緣計算等領域對算力和AI效能需求的不斷提升,GPU憑藉自身在並行處理和通用計算的優勢高歌猛進,市場得以持續高速成長。

據Verified Market Research的資料,2020年全球 GPU 市場價值為254。1億美元,2027年有望達到 1853。1 億美元,年平均增速高達 32。82%。

英特爾、英偉達、AMD打響“全面戰役”

目前GPU被廣泛地運用於PC、遊戲、資料中心、高效能計算、智慧汽車等領域。值得注意的是,遊戲與PC是其傳統主戰場,而資料中心、高效能計算和智慧汽車將成為GPU增長的新引擎,不同應用對GPU的需求也各有側重。

據瞭解,遊戲主機的設計思路著重提升體驗,側重開發人員對CPU、GPU等硬體最佳化和底層API等軟體最佳化。而PC的GPU需在效能、拓展性、能效方面做到平衡,主要有整合GPU和獨立GPU兩類,大部分整合GPU已與CPU整合為SoC,而獨立GPU多采用PCIe匯流排與CPU實時通訊。從高效能計算和伺服器來看,對GPU具有大資料量的快速吞吐、超強穩定性、長時間執行等嚴格要求;汽車GPU需滿足諸如AEC-Q100等車規認證,並支援專用的圖形API,並且未來的趨勢是汽車CPU將和GPU組成SoC,從分散式向中心化發展。

在多年鏖戰之後,全球GPU呈現寡頭壟斷的格局,英偉達是絕對的霸主,AMD緊隨其後,但在英特爾重返獨立GPU戰場之後,原本的平衡將被打破。

透過技術革新、場景拓展、外延併購,加上依託於CUDA軟體堆疊對GPU通用計算能力的不斷髮掘,英偉達成為GPU領域的佼佼者,引領全球GPU發展。2022財年,英偉達收入創紀錄,達到269。1億美元,同比增長 61%。

翻看英偉達的營收結構可以發現,受益於對英偉達Ampere 架構產品的強勁需求,遊戲成最大動力,資料中心市場增速最快,創106。1億美元新高;而汽車業務雖有下滑,但後續仍將持續收穫。其下一步佈局也是火力全開:已推出新一代桌面GPU 和膝上型電腦 GPU; 面向資料中心的下一代GPU Hopper GH100 晶片或超過1400 億個電晶體,並將採用臺積電5nm節點的多晶片模組 (MCM) 設計。且下一代自動駕駛晶片Orin計劃用於2022年量產,算力將達到254TOPS,目前已經獲得蔚來、理想、沃爾沃、賓士等多家整車廠專案。

經過近些年的“突飛猛進”,AMD在CPU和GPU市場均站穩了市場第二的位置。在GPU佈局上,2022年AMD透過新的頂級、中端和入門級 GPU,進一步擴充套件顯示卡市場,同時配備新的AMD Software支援。在資料中心領域,AMD也激進不止,前不久釋出了基於 GPU 架構的 Instinct MI200 加速卡,致力於HPC和AI加速。其採用第二代CDNA架構(專為最佳化資料中心計算工作負載而設計),是首個多晶片、首個支援128GB HBM2E視訊記憶體的GPU,也是首款Exascale級(百億億次級)GPU。同時還推出了新型面向資料中心GPU——下一代 Radeon Pro V620,旨在滿足雲應用、3D工作負載等對GPU加速日益增長的需求。

在PC等整合GPU領域佔據領先優勢的英特爾,自前幾年宣佈重回獨立GPU戰場之後,招數凌厲,不斷精進。2020年底,英特爾在其架構日中首次推出Xe GPU架構,Xe微架構可滿足從整合/入門圖形需求到資料中心和高效能計算的需求。同時,英特爾釋出了其首款資料中心伺服器GPU,完成了“CPU+GPU+FPGA”混合XPU架構的全面構建。

在2021年架構日上,英特爾即重磅推出兩款獨立GPU。而在前不久舉辦的投資日上,英特爾釋出兩款GPU,分別面向遊戲領域和資料中心。接著,英特爾宣稱,代號為ATS-M的資料中心GPU將於第三季度釋出,其整合多個Xe核心、AV1硬體編碼器、GDDR6記憶體、光線追蹤單元等,可提供每秒150萬億次運算。不止如此,面向傳統陣地PC領域,英特爾也志在必得,分別推出了面向膝上型電腦平臺的Arc銳炫系列顯示卡和麵向桌上型電腦的首款A3系列顯示卡——銳炫A380 GPU。而且,不僅僅是A380,具有更高效能的英特爾銳炫A5系列和A7系列也將於今年夏季面市。

在硝煙四起的GPU領域,火力全開的英特爾或將全方位向AMD與英偉達發起挑戰。

異構計算“短兵相接”

直接來看,英特爾、英偉達和AMD三大巨頭的異構“拼圖”均已大致成形。

在這三大巨頭中,顯然英特爾的異構組合更具底蘊。過去五年來,確立“以資料為中心”轉型目標的英特爾,持續透過併購等動作豐富自身在資料中心領域的佈局,包括收購優質的FPGA、eASIC、ASIC公司,再加上研發獨立GPU、IPU、神經擬態晶片、量子計算晶片,以及研發統一程式設計軟體工具oneAPI,為CPU、GPU、FPGA和其他加速器在內的異構計算提供統一簡化的應用程式開發程式設計模型,實現了覆蓋多重架構的產品組合。

加之最近IDM2。0策略的大舉擴張,以及宣稱開放x86、高調加入RISC-V陣營的一系列動作,讓英特爾在異構化時代手握多張“王牌”,更加遊刃有餘。

而從AMD來看,其業務長期聚焦在CPU和GPU兩大核心領域,FPGA則是其最大短板。但在AMD宣佈以全股份交易方式完成了對賽靈思的收購之後,憑藉賽靈思在FPGA、可程式設計SoC及ACAP領域的深厚積累,為AMD提供了橫向雲端及邊緣計算實力的走強補充了“營養”。AMD與賽靈思的合併,不僅將著力提升其整體的資料中心業務競爭力,還將在資料中心異構化時代獲得更多籌碼。

在Pensando被AMD收入囊中之後,意味著AMD不僅正式切入到DPU領域,也讓AMD的業務已完整涵蓋 CPU、GPU、FPGA、DPU,構建了基本完備的算力“拼圖”。

以GPU縱橫江湖的英偉達,為成全其“GPU+CPU+DPU”的路線,英偉達先是高調宣佈收購Arm,後花費69億美元收購以色列網路裝置商Mellanox補給DPU。儘管最終“毫無意外”地收購Arm折戟,但其已在大力投入CPU開發,並於2021年的GTC大會上正式推出面向資料中心AI和高效能計算應用的自研CPU——基於Arm Neoverse架構的Grace晶片。根據協議,英偉達取得了ARM將近20年的架構授權,未來可透過ARM授權IP來開發ARM架構CPU。

對於英偉達來說,Grace CPU的研發意義深遠,因GPU需搭配CPU運算,此招將使其在CPU方面不再受限,CPU的自立自強也將使其異構融合更綱舉目張。

面臨全面較量,三大巨頭也有著不同的隱憂。

有行業人士分析,AMD還需要時間消化和整合GPU+CPU+DPU+FPGA,擴充套件為雲、企業和邊緣客戶提供領先解決方案的能力;英偉達倚重的GPU未來在資料中心加速領域或面臨ASIC的蠶食;而英特爾還是一個基因屬於CPU的公司,而在GPU上的投入需要配合CPU的成長,因此處理好CPU和GPU之間的發展衝突將是巨大挑戰。此外,在IDM2。0的指揮棒下,投資重心不可避免向先進製造傾斜,如何平衡各大XPU 的創新與整合投入資源也需要仔細掂量。

需要指出的是,隨著Chiplet UCIe協議的確定,設計規模可增加數倍,如CPU、GPU和DPU均可平行擴充套件N倍;或實現垂直整合,CPU+GPU+DPU可合併成一個超異構的單晶片,或是兩兩合併。

因而,不同系統如何並行不悖以及如何高效的自適應互動,將成為巨頭們面臨的全新挑戰。誰能在這方面先行一步,誰將放大未來的贏面。

影響格局的關鍵因素

在重新披掛上陣之後,三大巨頭的對決也將火力全開。

除了應對“xPU+”的架構創新、生態構建和執行力的持續考驗之外,真要實現超異構計算,不得不說,製程和封裝才是將理念化為實際產品的關鍵。

先說工藝,以及相關的產能因素。

無論是CPU、GPU還是DPU、FPGA,都是先進工藝的先行者。要想與一眾高手對決,採用最先進的工藝當是王道。

近期有訊息顯示,臺積電在其3nm工藝良率方面存在困難,如果3nm良率問題繼續存在,許多客戶可能會延長5nm工藝節點的使用時間,從而影響客戶諸如AMD、英特爾、英偉達的晶片出貨。

這使得產能緊缺導致的供應瓶頸成為他們面臨的阻力之一。正如英偉達釋出財報時表示,鑑於全球晶片和晶圓生產能力短缺,未來供應方面限制仍將是一個不利因素。據報道,英偉達已在2021年第三季度預付臺積電約16。4億美元,並將在2022年第一季度支付17。9億美元,整個長期訂單預付款將達到69億美元,遠高於他們之前支付的價格。

相對於英偉達和AMD,英特爾的優勢是其正在大力發展的代工業務。雖然目前在代工方面英特爾技術尚未突破5nm,但如果按照其技術路線圖,2025年將可看齊臺積電的代工水平。或許,屆時英特爾可全力支撐自己的先進製程設計,在x86、Arm和RISC-V的異構整合層面更加遊刃有餘,並在產能保障上優先供應,其IDM 2。0戰略背後的深意或比想象得更加深遠。

此外,異構計算繞不過去的就是異構整合和先進封裝。異構整合與先進封裝技術的進步使在單個封裝內構建複雜系統成為了可能,能夠快速達到異構計算系統內的晶片所需要的功耗、體積、效能的要求。

在先進封裝層面,看起來作為傳統IDM的英特爾似乎更具優勢,而AMD原本也是IDM,只是後來將晶片製造業務剝離出去了,但該公司依然具備製程和封裝的基因。過去幾年,AMD因其率先推向市場的chiplet和互連技術而佔得了先機,在此基礎上,該公司推出了新一代封裝技術,也就是3D堆疊V-Cache。在這方面,賽靈思也可為AMD提供幫助,因為賽靈思已為其自適應FPGA平臺構建了一系列高效能封裝和互連技術。

對於英偉達而言,作為一家純粹的Fabless,在異構整合的製程和封裝方面略遜於英特爾和AMD,不僅在高效能應用領域,在製程和封裝方面對合作夥伴的依賴度更高一些。

對比之下,英特爾多路並進,在Co-EMIB、UCIe、Foveros等方面不斷推進。特別是在3D封裝部分,英特爾已推出Foveros Direct,實現了向直接銅對銅鍵合的轉變,透過HBI技術以實現10微米以下的凸點間距,讓不同晶片之間可實現10倍以上的互聯密度提升。而且前不久其為超算研發的頂級加速卡Ponte Vecchio,整合電晶體數量突破1000億個,使用5種不同的製造工藝,在內部封裝了多達47個不同的單元(Tile),成為採用Foveros的3D堆疊封裝技術和Co-EMIB連線技術的“集大成者”。

據諮詢機構Yole Developpement資料顯示,2021年半導體廠商在先進封裝領域的資本支出約為119億美元。該機構表示,2021年先進封裝市場體量約為27。4億美元,同時預測該市場到2027年將實現19%的複合年化增長率,屆時先進封裝市場體量將達到每年78。7億美元。

英特爾、英偉達、AMD打響“全面戰役”

如此來看,未來的爭奪也將在架構創新、工藝、封裝等全面展開,在這些方面三大巨頭或需面面俱到,未來的勝負手將如何書寫?