愛伊米

伺服器晶片,AMD祭出了Chiplet最強招

英特爾和 AMD 如何規劃未來的封裝晶片以提高整體效能並降低製造成本,這引起了很多關注。對於 AMD,下一步是 V-cache,這是一個額外的 L3 快取 (SRAM) 小晶片,設計為堆疊在現有 Zen 3 小晶片之上的 3D 晶片,使可用的 L3 快取總數增加三倍。

今天,AMD 的 V-cache 技術終於可以在更廣泛的市場上使用,因為 AMD 宣佈他們的 EPYC 7003X “Milan-X”伺服器 CPU 現已全面上市。

伺服器晶片,AMD祭出了Chiplet最強招

正如去年年底首次宣佈的那樣,AMD 正在透過 Milan-X 將其 3D V-Cache 技術引入企業市場,這是其當前一代基於Milan的第三代 EPYC 7003 處理器的高階變體。AMD 正在推出從 16 核到 64 核的四款新處理器,它們都具有 Zen 3 核和透過 3D 堆疊 V-Cache 的 768 MB 三級快取。

AMD 的 Milan-X 處理器是其當前基於米蘭的第三代處理器 EPYC 7003 的升級版本。新增到其先前存在的基於Milan的 EPYC 7003 陣容(我們在去年 6 月回顧過),這是米蘭最重大的進步-X 是透過其 768 MB 的大型 L3 快取使用 AMD 的 3D V-Cache 堆疊技術。AMD 3D V-Cache 使用臺積電的 N7 工藝節點——米蘭的 Zen 3 小晶片所基於的節點相同——尺寸為 36 平方毫米,在 Zen 3 小晶片上現有的 32 MiB 晶片之上有一個 64 MiB 晶片。

伺服器晶片,AMD祭出了Chiplet最強招

專注於關鍵規格和技術,最新的 Milan-X AMD EPYC 7003-X 處理器具有 128 個可用的 PCIe 4。0 通道,可透過全長 PCIe 4。0 插槽和控制器選擇使用。這取決於主機板和伺服器供應商希望如何使用它們。還有四個記憶體控制器能夠支援每個控制器兩個 DIMM,從而允許使用八通道 DDR4 記憶體。

Milan-X 的整體晶片配置是一個巨大的 9 個小晶片 MCM,具有 8 個 CCD 裸片和一個大型 I/O 裸片,這適用於所有 Milan-X SKU。至關重要的是,AMD 選擇為其所有新的 V-cache EPYC 晶片配備最大 768 MB 的 L3 快取,這反過來意味著必須存在所有 8 個 CCD,從頂部 SKU (EPYC 7773X) 到底部 SKU (EPYC) 7373X)。相反,AMD 將改變每個 CCD 中啟用的 CPU 核心的數量。向下鑽取,每個 CCD 包括 32 MB 的 L3 快取,另外還有 64 MB 的 3D V-Cache 分層在頂部,每個 CCD 總共有 96 MB 的 L3 快取 (8 x 96 = 768)。

伺服器晶片,AMD祭出了Chiplet最強招

在記憶體相容性方面,與之前的米蘭晶片沒有任何變化。每個 EPYC 7003-X 晶片每個插槽支援 8 個 DDR4-3200 記憶體模組,每個晶片的容量高達 4 TB,跨 2P 系統的容量高達 8 TB。值得注意的是,新的 Milan-X EPYC 7003-X 晶片與現有系列共享相同的 SP3 插槽,因此透過韌體更新與當前的 LGA 4094 主機板相容。

伺服器晶片,AMD祭出了Chiplet最強招

檢視採用 3D V-Cache 技術的全新 EPYC 7003 堆疊,頂級 SKU 是 EPYC 7773X。它具有 64 個 Zen3 核心和 128 個執行緒,基本頻率為 2。2 GHz,最大升壓頻率為 3。5 GHz。EPYC(霄龍)7573X擁有32核64執行緒,基頻更高2。8GHz,升壓頻率最高可達3。6GHz。EPYC 7773X 和 7573X 的基本 TDP 均為 280 W,儘管 AMD 指定所有四款 EPYC 7003-X 晶片的可配置 TDP 都在 225 和 280 W 之間。

新陣容中規格最低的晶片是 EPYC(霄龍)7373X,它擁有 16 核 32 執行緒,基礎頻率為 3。05 GHz,升壓頻率為 3。8 GHz。向上移動,它還有一個 24c/48t 選項,其基本頻率為 2。8 GHz,升壓頻率高達 3。7 GHz。兩者都包括 240 W 的 TDP,但與更大的部分一樣,AMD 已確認 16 核和 24 核型號的可配置 TDP 介於 225 W 和 280 W 之間。

伺服器晶片,AMD祭出了Chiplet最強招

值得注意的是,所有這些新的 Milan-X 晶片都比常規的 Milan(最大核心效能)晶片具有某種時鐘速度迴歸。在 7773X 的情況下,這是基本時鐘速度,而其他 SKU 在基本和提升時鐘速度上都下降了一點。

V-cache 的下降是必要的,對於完整的 Milan-X 配置,V-cache 需要額外的約 260 億個電晶體,會消耗晶片的功率預算。因此,隨著 AMD 選擇保持 TDP 一致,時鐘速度已被調低一點以進行補償。與往常一樣,AMD 的 CPU 將在熱量和 TDP 餘量允許的情況下以最快的速度執行,但配備 V-cache 的晶片將更快地達到這些限制。

AMD 的新 Milan-X 晶片的目標市場是需要最大化每核效能的客戶;具體來說,從額外快取中受益的工作負載子集。這就是為什麼 Milan-X 晶片沒有完全取代 EPYC 70F3 晶片的原因,因為並非所有工作負載都會響應額外的快取。因此,這兩個陣容都將作為 AMD 最快的每核 EPYC SKU 共享頭把交椅。

就 AMD 而言,他們特別在 CAD/CAM 市場上推銷新晶片,用於有限元分析和電子設計自動化等任務。據該公司稱,在具有和不具有 V-cache 的 Milan 處理器之間的蘋果對蘋果的比較中,他們發現 Synopsys 的 VCS 驗證軟體的 RTL 驗證速度提高了 66% 以上。與包含更大快取的其他晶片一樣,最大的好處將出現在從現代大小的快取溢位的工作負載中,但會巧妙地適應更大的快取。最大限度地減少昂貴的主記憶體訪問意味著 CPU 核心可以更頻繁地保持工作。

伺服器晶片,AMD祭出了Chiplet最強招

微軟在去年11 月釋出了 Azure HBv3 虛擬機器的公開預覽版時發現了類似的情況。當時,該公司釋出了一些內部測試的效能資料,主要針對與 HPC 相關的工作負載。將 Milan-X 直接與 Milan 進行比較,Microsoft 在其 HBv3 VM 平臺中使用了來自 EPYC 7003 和 EPYC 7003-X 的資料。還值得注意的是,測試是在雙插槽系統上完成的,因為今天宣佈的所有 EPYC 7003-X 處理器都可以用於 1P 和 2P 部署。

Microsoft Azure 釋出的效能資料令人鼓舞,並且使用其內部測試,看起來額外的 L3 快取發揮了重要作用。在計算流體動力學中,有人指出,使用更少的元素可以提高速度,因此必須考慮到這一點。微軟表示,與之前與 Milan 合作的 HBv3 VM 系統相比,使用其當前的 HBv3 系列,其客戶可以期望在計算流體動力學方面獲得高達 80% 的最大效能提升。

伺服器晶片,AMD祭出了Chiplet最強招

總結一下,AMD 的 EPYC(霄龍)7003-X 處理器現已普遍向公眾開放。AMD 表示,價格以 1K 單位訂單為基礎,配備 64C/128T 的 EPYC 7773X 售價約為 8800 美元,而 32C/64T 型號的 EPYC 7573X 售價約為 5590 美元。往下看,24C/48T 的 EPYC 7473X 售價 3900 美元,16C/32T 的入門款 EPYC 7373X 售價略高,為 4185 美元。

鑑於所需的大訂單量,一個單位的整體零售價格可能會略高。儘管 AMD 的大多數客戶都是伺服器和雲提供商,但毫無疑問,AMD 會有一些客戶批次購買。AMD 的許多主要伺服器 OEM 合作伙伴也計劃開始提供使用新晶片的系統,包括戴爾、超微、聯想和 HPE。

最後,當AMD 的第二款 V-cache 產品 Ryzen 7 5800X3D 釋出時,消費者將有機會在下個月獲得一些支援 AMD V-cache 的 CPU 。桌面處理器基於單個 CCD,可提供高達 96 MB 的三級快取,所有這些都與更大的 EPYC 晶片形成鮮明對比。