愛伊米

衝刺E級超級計算,英特爾會帶來多少種可能?

你能否想象,某種尖端技術,在經歷了半世紀甚至更久的發展演化之後,會有怎樣的嬗變?變得更為精深、更加極致,這或許是一個答案,但並非惟一的答案,與之並存的,很可能還包括:它的應用會更為廣泛,從服務少數人到普惠多數人,還有,它在本原上也會與新興技術產生更多的交集和融合。

▲戳影片,回顧英特爾@HPC China 2021

剛剛落幕的 2021 年第十七屆全國高效能計算學術年會 (CCF HPC China 2021) 就探討了類似問題的答案,它圍繞的主題——高效能計算就是這樣一種技術,而上面三種可能的、甚至更多的答案正在它的身上同步迸現——

向 E 級計算衝刺的“極致”、從學術界走向產業界的“普惠”,以及與 AI 和大資料的“融合”

,已經成為其公認的重要發展趨勢。

衝刺E級超級計算,英特爾會帶來多少種可能?

CCF HPC China 2021 主題演講現場

先繞過極致,談談普惠和融合,雖然對於超算的業內人士來說,這兩個趨勢已不是什麼新鮮事物了,但很多人可能還是想不到,關係到國計民生的油氣勘探,還有讓人望眼欲穿的癌症新藥物及療法的開發,這些事都與高效能計算,尤其是與大資料和 AI 開始融合的高效能計算密不可分。

應英特爾邀請,中石油東方地球物理公司物探技術研究中心計算機技術研究部主任張旭東,以及轉化醫學國家重大科技基礎設施(上海)生信大資料平臺共同負責人呂綱,就在本次年會上現身說法,談了談他們在高效能計算上的應用體驗及核心需求。

張主任的分享,是從 GeoEast 切入,這是中國石油集團具有自主智慧財產權的超大型油氣勘探軟體,整合了地球物理、地質、計算機及 HPC 等多學科先進技術及新方法。由於地質勘探的資料已經實現了從 PB 到 TB 的轉換,加之對精度要求的不斷提高,計算量已經上千倍地增加,當然,也就對計算系統提出了更高的要求。開發人員在這種情況下必須要同時考慮軟體的特性及硬體平臺的效能最佳化,迫切需要

跨平臺支援多語言開發的解決方案,來實現靈活性和高效能水準

。例如面對 CPU 和 GPU 甚至更多種類加速器協同計算的開發和維護難題時,GeoEast 的開發人員就希望有 Java 一樣的方案,可以實現“一次編譯,處處執行”。

衝刺E級超級計算,英特爾會帶來多少種可能?

中石油東方地球物理公司

物探技術研究中心計算機技術研究部主任張旭東

呂老師的需求,則直指高效能計算系統中的儲存應用,他所在的上海交通大學附屬瑞金醫院轉化醫學中心,是中國第一個也是截至目前唯一建成的國家級綜合性轉化醫學中心,而轉化醫學的實現,需要先收集全面多維的患者生物資訊資料,然後基於海量資料的挖掘和分析,最終形成更個性化且精準的診療方案。由於這一過程涉及的資料數量龐大、複雜且持續增長(例如,單個人類全基因測序分析涉及的資料就高達 870 GB)。並且由於招募的患者通常病情比較危急,效率就變得至關重要。同時,由於不同轉化醫學研究團隊都需要高效地並行訪問海量生物資訊資料,這一切歸結之後,

高效能的資料並行訪問能力就成了關鍵。

衝刺E級超級計算,英特爾會帶來多少種可能?

轉化醫學國家重大科技基礎設施(上海)

生信大資料平臺共同負責人呂綱

表面看是技術問題,背後是產業問題、是民生問題,甚至是人類生存和發展的問題

,這就是高效能計算的獨特性或魅力所在。張主任和呂老師談到的,也不僅僅是他們遭遇的個體問題,而是高效能計算從傳統學術圈或科研領域走向工業界或產業界,如工程製造、天氣預報、智慧城市、金融分析、能源勘探、藥物開發等領域,並與更多源、更為海量的資料以及更多樣、更先進的應用和演算法碰撞後,必然面臨的共同問題。

好在,這些問題看似錯綜複雜,但就像再糾纏的繩結也有活釦,它們的活釦,則要回到技術本身,回到極致或者追求極致這個話題上。

就像東方地球物理公司選擇了英特爾 oneAPI 工具包,讓 GeoEast 支援前沿異構架構成為可能——

oneAPI 工具包就是英特爾為充分簡化跨 CPU、GPU、FPGA 及其他加速器的異構計算應用開發及最佳化而生

,它不僅擁有英特爾的編譯器、庫和分析工具,還支援英特爾現有和即將釋出的用於 AI 和 HPC 應用加速的 VNNI/DL Boost和 AMX(高階矩陣擴充套件)等技術,可以為更多相關應用負載提供更優的支援。張主任表示,GeoEast 的開發人員在 oneAPI 研發階段就積極與英特爾進行了交流與測試,發現 oneAPI 十分切合其高效能應用場景,遂決定將在明年推出最新版 GeoEast 5。0 中正式採用 oneAPI 作為編譯構建工具。

衝刺E級超級計算,英特爾會帶來多少種可能?

GeoEast圍繞oneAPI與英特爾開展的合作以及其應用規劃

上海交通大學附屬瑞金醫院轉化醫學中心也在英特爾的幫助下,找到了他們追求的那份“極致“——他們發現,

英特爾®傲騰™持久記憶體 + 分散式非同步物件儲存 (DAOS) 的方案能夠有效破解高效能計算平臺面臨的儲存瓶頸。

該方案在硬體上使用了效能與 DRAM 相近,但容量、耐用性和價效比更高,並且具備資料永續性的傲騰™持久記憶體;軟體上則採用了可顯著提升資料儲存、訪問效率,並能加速資料恢復的 DAOS 系統。雙方目前正在深化合作,期待透過實際應用場景驗證基於該儲存架構打造的高效能臨床醫學深度挖掘系統的效能表現,順便,再打個排位賽,衝擊一下全球 IO500 排行榜中前十名。

衝刺E級超級計算,英特爾會帶來多少種可能?

瑞金醫院轉化醫學中心對DAOS優勢的剖析

看到這裡,你可能會覺得有些意外:英特爾在高效能計算領域得到普遍應用的至強®處理器何在?

至強,其實一直都是基礎!但英特爾現在高效能計算領域幫助合作伙伴或使用者追求極致的助力,早已不再是單一的 CPU,而是

豐富、多維、軟硬兼施的完整產品技術組合

,至強是其核心,oneAPI、傲騰™持久記憶體和 DAOS 也同樣是其不可或缺的部分,將它們組合起來的目標,就是要

實現均衡

均衡與極致,乍一看很矛盾,如果是用中庸或制衡的意思來理解均衡,的確如此。但如果把它解讀為同步且均衡的提升呢?

這正是英特爾對均衡的解讀,

即旨在實現資料全鏈路,包括計算、儲存和傳輸的均衡提升和最佳化

,以避免平臺出現效能短板和瓶頸,同時,它還包含另一層含義,就是要實現

對通用計算和專用加速能力的兼顧和均衡提升

,以滿足高效能計算應用多樣化+差異化+融合化的需求。

英特爾公司市場營銷集團副總裁、中國區行業解決方案部總經理梁雅莉就在本次年會上談到:“幫助更多企業、行業加速探索更多未知與可能,高效能計算也需要進行自我革新和重塑。不論是衝擊 E 級計算的新境界,還是實現與 AI 及資料分析的融合,高效能計算都比以往

更渴求算力的跳躍式進化以及對更多樣化的負載的承載能力。

衝刺E級超級計算,英特爾會帶來多少種可能?

英特爾公司市場營銷集團副總裁、中國區行業解決方案部總經理梁雅莉在本次 CCF 高效能計算學術年會上發表主題演講

她進一步解釋說,作為高效能計算普及大潮的堅定支持者和技術創新引領者,英特爾正致力於提供

基於異構體系,更為豐富也更加靈活易用的高效能計算核心產品技術組合

,包括全新英特爾®至強®可擴充套件處理器、傲騰™持久記憶體和儲存產品,以及為 HPC 和 AI 應用提供特定加速能力的 GPU,還有能充分激發這些硬體效能潛力的全套軟體工具。“我們相信這些產品組合將協助客戶進一步拓展 HPC 應用邊界並實現更多可能,幫助更多企業把面臨的複雜性和挑戰轉化為發展機遇。”

衝刺E級超級計算,英特爾會帶來多少種可能?

目前英特爾已為高效能計算領域提供,及正在進一步打造、強化的產品技術組合

梁雅莉提到的高效能計算產品組合,應該說同時涵蓋了這兩層含義。

計算、儲存和傳輸的均衡都已在至強®平臺上實現。

就現階段而言,最高可整合 40 核,內建了英特爾®深度學習加速技術,並支援 PCI-e 4(這意味著它可與更多高效能 GPU 搭配)的第三代至強®可擴充套件處理器,與傲騰™持久記憶體和英特爾高速乙太網產品的硬體,再鋪以 oneAPI 軟體工具就是其落地的基石。

衝刺E級超級計算,英特爾會帶來多少種可能?

英特爾高效能計算產品組合現階段的核心

——第三代至強®可擴充套件處理器

要談到未來,那麼正蓄勢待發的、代號為 Sapphire Rapids 的下一代至強®可擴充套件處理器,以及英特爾首款主打高效能計算和人工智慧加速,也是 XeHPC 架構首款產品、代號為 Ponte Vecchio的 GPU 產品,就有望形成強化

英特爾高效能計算產品組合均衡優勢的“雙主角配置”

,而這也將意味著英特爾迎來其 XPU 戰略落地、為高效能計算提供異構架構支援,以及衝刺 E 級(Exascale,百億億級)計算的尖峰時刻,這正是高效能計算追求“極致”的最新標誌。

英特爾公司副總裁 Trish Damkroger 特地錄製了一段影片,為本次年會的參會者披露了這兩款產品的關鍵指標及初步的效能結果。她稱從高效能計算和 AI 應用的角度而言,採用全新模組化 SoC 架構的 Sapphire Rapids 的優勢不僅在於整合更多核心(56 核,112 執行緒),更在於其

支援 DDR5、PCIe5 和 CXL 技術後,在進一步增強記憶體、儲存和互聯效能方面帶來的潛能,以及整合 AMX(高階矩陣擴充套件)技術後,即將為 CPU 執行矩陣運算任務帶來的顯著加速效果。

衝刺E級超級計算,英特爾會帶來多少種可能?

英特爾公司副總裁 Trish Damkroger

展望下一代至強®可擴充套件處理器的規格特性

與 Sapphire Rapids 主要提升通用計算效能相匹配的,就是 Ponte Vecchio 為高效能計算和人工智慧帶來的更強加速能力。Trish Damkroger 表示這款由 47 種不同晶片模組組合而成的 GPU,將有助於加速 E 級計算願景的實現。它將

採用靈活的資料並行向量矩陣引擎來處理一系列高度並行的工作負載。它可提供超高的雙精度浮點運算吞吐量並提供超高快取和記憶體頻寬,以滿足需要高記憶體頻寬的應用程式。

衝刺E級超級計算,英特爾會帶來多少種可能?

集領先架構和多種先進製造、封裝技術於一身的 Ponte Vecchio

當然,Sapphire Rapids + Ponte Vecchio 的組合,還只是英特爾異構架構或 XPU 戰略的初探,未來英特爾的高效能計算產品組合,以及面向其他主流企業工作負載的平臺或方案,還將在英特爾 CEO 帕特。基辛格新近提出的四個“超級技術力量”的指引下持續演進。“這個超級技術力量分別是

無處不在的計算、無處不在的連線、從雲到邊緣的基礎設施,以及人工智慧

,”梁雅莉表示:“它們都有自己的特質,同時也相得益彰,創造了強大的全新可能性。”

衝刺E級超級計算,英特爾會帶來多少種可能?

可賦能“萬物智慧化”變革,同樣也會給高效能計算帶來更多可能性的四大超級技術力量

可以想見,這些強大的全新可能性裡,必然會包括有助於高效能計算自身演進的更多的可能性,還有用更為高效、更靈活也更為均衡的高效能計算助力行業和使用者探索出的更多可能性。具體會有多少種可能性?它們又會是什麼樣?沒有人能夠給出確切的答案,我們唯一可以預見的是,英特爾將會不斷進步,就像今年剛提供第三代至強®可擴充套件處理器和全新傲騰™產品,同時又準備推出 Sapphire Rapids 和 Ponte Vecchio 這樣,持續且堅定地交出越來越令人滿意的答卷。

畢竟,英特爾的願景就是

透過創造改變世界的技術,來造福地球上每一個人。

這種創造,沒有止境,也意味著無限的可能性。