愛伊米

英特爾Xe-HPG顯示卡正在出樣,4代可擴充套件至強支援HBM

英特爾Xe-HPG顯示卡正在出樣,4代可擴充套件至強支援HBM

芯東西(公眾號:aichip001)

作者 |

高歌

編輯 |

心緣

芯東西6月29日訊息,今天,英特爾首次公佈,對於第4代至強處理器Sapphire Rapids,其將推出高頻寬記憶體(HBM)版本。

會上,英特爾副總裁兼高效能計算部總經理Trish Damkroger與芯東西等媒體,分享了英特爾第3代至強可擴充套件處理器在高效能計算領域的應用,以及Ponte Vecchio GPU、Sapphire Rapids等產品的最新進展。

一、第3代至強處理器:40個核心,HPC負載效能提升53%,

Trish Damkroger提及,隨著與人工智慧的融合,高效能計算正在快速地演進。透過雲端等方案,高效能計算系統正在改變很多行業。

舉例來說,工業製造商利用高效能計算設計具有更好的器材;鐵路公司使用氣候資料避免火車脫軌事故;製藥企業利用機器學習識別藥物中的有害成分;能源企業則可以透過對電廠機械進行模擬,對執行和維護流程進行改進。

當資料的量級更多、使用者和工作負載型別變得更加複雜時,高效能計算應用對硬體裝置的效能要求也更加全面。

這樣的情況下,Trish Damkroger認為,高效能計算、人工智慧方案供應商不能僅僅專注於如CPU速度、記憶體容量、輸入/輸出或記憶體等某個特定的效能。硬體裝置的效能最佳化需要在各個關鍵領域同時進行。

據Trish Damkroger分享,英特爾正在透過不同的路徑來提升硬體效能。其產品組合涵蓋通用計算、專用加速、記憶體和儲存、高效能互連和安全功能等。其中,oneAPI軟體程式設計框架可以利用單個開源平臺對多種架構進行開發,而第3代至強可擴充套件處理器在效能和靈活性上都有很大的提升。

英特爾Xe-HPG顯示卡正在出樣,4代可擴充套件至強支援HBM

▲英特爾第3代至強處理器

就第3代至強處理器而言,該處理器擁有40個核心,每個核心可以使用8個記憶體通道,可以提供6TB的系統記憶體容量。相較上一代,其HPC負載效能提升了53%。英特爾也對其核心架構進行了改進,使第3代至強處理器每個時鐘的指令條數提升了20%,快取記憶體量也有所增長。

Trish Damkroger強調,至強處理器是業內唯一內建人工智慧加速的CPU。英特爾還內建了Speed Select技術,使單個CPU滿足更多樣化的工作負載需求。他認為,綜合來看,第3代至強處理器效能優於AMD的EPYC Milan處理器。

就實際場景而言,在執行蒙特卡羅演算法(Monte Carlo)時,至強處理器的執行速度比Milan快兩倍多;在金融領域,至強僅用Milan一半的時間就獲得了定價結果;在具體處理工作負載的演示中,64核Milan處理器耗時33秒,而第3代至強處理器僅耗時27秒。

此外,英特爾還選擇了20個機器學習和深度學習模型,相比於64核Milan處理器,其至強處理器在幾何均數方面效能提升了1。5倍。

二、最新GPU研發順利,整合超千億電晶體

在會上,Trish Damkroger也分享了基於Xe-LP的英特爾伺服器顯示卡SG1最新進展,而基於Xe-HPG的產品正在出樣。

此前,英特爾曾宣佈Ponte Vecchio GPU將於今年量產。今天,Trish Damkroger提到,英特爾基於Xe架構的Ponte Vecchio GPU研發已啟動,目前進展順利,正在按照既定日程進行開發。

英特爾Xe-HPG顯示卡正在出樣,4代可擴充套件至強支援HBM

▲英特爾Xe架構產品線

據Trish Damkroger分享,Ponte Vecchio封裝了47顆不同的晶片,集成了超1000億個電晶體,在封裝時採用了Foveros和EMIB(嵌入式多晶片互連橋接)等技術。

在軟體框架方面,英特爾希望提供一種簡單的跨架構、跨供應商的異構程式設計模型。oneAPI就是基於這一理念的產物。

目前,oneAPI的跨架構語言Data Parallel C++(DPC++)已可以在英偉達GPU上執行;在美國國家能源研究科學計算中心NERSC的支援下,oneAPI也能在Arm架構上執行深度學習演算法;另外,華為的部分硬體也支援DPC++。

據悉,oneAPI工具包還提供編譯器、資料庫及分析工具,可支援英特爾AMX、VNNI/DL Boost等技術,能夠進一步提升工作負載處理效率。

三、4代至強:記憶體、吞吐效能最佳化,配備最新AI加速引擎

Trish Damkroger也和媒體聊到了第4代至強處理器Sapphire Rapids的最新動態。

近年來,計算效能的增長速度遠超記憶體頻寬的限制。為此,Sapphire Rapids將採用DDR5以提升記憶體寬頻。英特爾還將提供配有高頻寬記憶體(HBM)的Sapphire Rapids版本,為氣候建模、人工智慧、大資料分析等應用提供更好的支援。

針對吞吐密集型工作負載,Sapphire Rapids則採用了新的PCI express 5。0規範。與上一代相比,Sapphire Rapids實現了吞吐頻寬的倍增。

除了記憶體及吞吐方面的最佳化外,Sapphire Rapids還針對高效能計算及人工智慧工作負載進行了額外最佳化,配備了英特爾AMX(高階矩陣擴充套件)內建AI加速引擎,提升了其深度學習推理和訓練效能。

此外,Sapphire Rapids平臺還將具有Compute Express Link(CXL)1。1規範的新一代I/O,以支援跨計算、網路和儲存的高階用例。

英特爾Xe-HPG顯示卡正在出樣,4代可擴充套件至強支援HBM

▲英特爾4代至強處理器Sapphire Rapids的技術細節

結語:HPC效能要求多元化

過去15年間,HPC成為成長速度最快的IT市場之一。隨著技術的逐步發展,HPC已逐步走向AI和深度學習的研發前線,為自動駕駛、精準醫療、智慧城市、物聯網等新興應用場景提供算力支撐。

隨著應用領域逐漸增多,英特爾也不再聚焦於單獨的CPU效能,而是對軟體、硬體等多款產品進行了同步最佳化。作為行業的頭部玩家之一,這某種程度上也是HPC行業的發展趨勢。

英特爾Xe-HPG顯示卡正在出樣,4代可擴充套件至強支援HBM