愛伊米

ARM伺服器晶片,火了

圖片來源@視覺中國

文 | 半導體產業縱橫

在資料中心需求增長的趨勢下,核心晶片的角逐越演越烈。各方力量不留餘力的推動自身資料中心的發展時,伺服器作為資料中心最核心的硬體,其晶片也備受關注。

早期的伺服器晶片,由RISC架構一統天下。後來隨著,英特爾推出X86架構,逐漸擠壓RISC處理器市場,在很長的一段時間內,AMD和英特爾都佔據著伺服器市場的主流,其中英特爾市場份額超過90%,AMD則吃掉剩下的部分。

多年來,業界一直在問:“ARM架構能夠在資料中心覓得一席之地嗎?”

早年的折戟

ARM架構進攻伺服器市場並非易事。ARM陣營進入伺服器晶片市場的謀劃已有多年,早在2008年,ARM就開始醞釀伺服器晶片計劃,惠普、AMD、博通、高通等美國企業都曾釋出過ARM架構的伺服器晶片,但全都折戟。

Calxeda早已倒閉,Applied Micro後來將ARM架構伺服器晶片業務賣掉,甚至連三星都在產品開發完成之前就終止了業務,從伺服器領域溜之大吉。

當時,很多人將這些公司失敗的原因歸結於效能。認為ARM伺服器晶片完全無法媲美x86競品的效能。但是在2018年,高通推出了首款ARM的高效伺服器晶片Centriq 2400,最低40核,最高48核,基於三星10nm工藝打造。使用的是自研FalkorCPU核心,三緩為60MB,旗艦級價格為1995刀。

當時高通號稱,當執行SPECint_2006時,Centriq 2460效能比英特爾 Purley鉑金8160高出7%,晶片效能資料非常出色。

儘管高通還請來了阿里、鏗騰、安邁等巨頭撐腰,但一陣吵吵嚷嚷之後,最後也只有一家表示DDOS防禦平臺從X86更換成了ARM。後來,高通宣佈削減在“非核心”產品領域的支出,計劃關閉伺服器晶片部門,而高通一手操辦伺服器晶片的Anand Chandrasekher也離職了。

高通轟轟烈烈的ARM伺服器晶片最終也以失敗結尾。

從效能角度來看,高通當年推出的CPU不輸當時的主流伺服器晶片,但高通仍然失敗了。

這其中,一部分原因在於高通想要削減在“非核心”產品領域的支出,從而減少了在新領域探索的力度,但更大一部分原因在於當時ARM伺服器市場的生態尚未搭建成功。

直到2019年,ARM的Neoverse平臺路線圖的推出,其對伺服器市場的滲透率開始有了實質提升。2020年蘋果、微軟相繼宣佈將釋出基於ARM 的 PC 產品,華為鯤鵬、亞馬遜、Facebook等紛紛佈局基於 ARM 的自研伺服器晶片,完善ARM架構生態。

隨著全球最大雲計算亞馬遜在自己雲計算的ARM架構CPU Graviton真正部署起來,並且佔到自己資料中心絕對量的20%時,這才標誌著ARM架構CPU在伺服器行業上量的轉折。

崛起的背後

根據TrendForce資料預測,隨著雲資料中心的採用逐漸增長,預計到2025年,ARM架構在資料中心伺服器市場滲透率將達到22%。這個資料意味著基於ARM架構的伺服器,將在未來3年實現翻倍增長,這也意味著ARM將帶來不可逆的行業變化。

為什麼曾經使得眾多企業“折戟”的ARM伺服器晶片,現在卻開始嶄露頭角?

這需要從三個方面來看:

第一個方面,是伺服器晶片的巨大市場。伺服器的市場就非常龐大,知名研究公司IDC的資料顯示,去年雲計算基礎設施的總支出為739億美元,同比增長8。8%。彭博行業研究分析師曼迪普·辛格(Mandeep Singh)指出,僅資料中心處理器每年就能創造280億美元的收入。

巨大的伺服器市場,需要的是鉅額的伺服器晶片。而在這個高階計算市場,單顆晶片的售價高達數千美元。以高通為例,目前,高通提供的手機晶片通常定價在幾十美元。相比之下,最高階的伺服器處理器每顆晶片的價格超過1萬美元。這就是伺服器晶片能夠帶來的鉅額利潤,在這種情況下,類似高通的晶片廠商也希望能夠在伺服器市場中分上一杯羹。

第二個方面,是ARM產品的最強優勢——低功耗。在資料中心領域,功耗早就成為了一個重要的問題,隨著伺服器群的擴充套件,每個大伺服器群都將消耗驚人的電量。眾所周知,ARM架構正是憑藉其低功耗的優勢,佔領了手機領域的市場。

現在,憑藉這一優勢,ARM同樣打入了雲伺服器廠商中。許多AWS的客戶表示,與現有英特爾、AMD的伺服器CPU相比,他們租用基於ARM架構的Graviton晶片節省了10%~40%的計算成本。

正因如此,ARM伺服器晶片最先落地的領域就在雲伺服器廠商。對這些雲計算廠商來說,能夠節省鉅額的功耗,就能帶來不少的收益。

第三方面,是曾經被詬病的效能。雖然,在過去的一段時間內,ARM架構處理器效能沒有x86架構處理器效能強,甚至業內一度認為X86架構晶片能夠輕而易舉的阻擋ARM架構晶片。但是,現在ARM架構處理器的效能已經趕上甚至超越X86架構處理器。

ARM單核的面積僅為 X86 核的 1/7,同樣晶片尺寸下可以繼承更多核心數。透過“堆核”的方式,使得ARM架構處理器在效能快速提升下,也能保持較低的功耗。根據Ampere給出的資料,其CPU的效能超越傳統x86處理器3倍,效能功耗比領先近4倍。與 x86 伺服器CPU相比,Ampere Altra 系列可用50%的能耗,提供200%的效能。

ARM奔向戰場

近年來,ARM架構的的興起下,許多巨頭紛紛開始自研ARM架構的伺服器晶片,包括國外的亞馬遜、谷歌甚至微軟,國內的騰訊、阿里巴巴、華為等等都積極參與其中。

曾經失敗的高通似乎也在嘗試再次進軍伺服器晶片市場,去年收購了晶片創業公司Nuvia,而Nuvia創立的目標是打造高效能的ARM伺服器晶片。

ARM的伺服器晶片有三大目標市場即雲計算、HPC和邊緣計算。

雲計算陣營

在雲計算領域上,ARM可以說已經取得了相對領先的成功。亞馬遜雲、甲骨文雲、Azure和阿里雲等巨頭紛紛入局ARM雲主機市場。

騰訊雲在2021年底釋出了CVM 標準型SR1伺服器,可用於各種型別和規模的企業級應用等。這款伺服器吸引人的地方不在於其他配置,而是內建的ARM處理器——2。8GHz的Ampere Altra處理器。根據相關評測,SR1伺服器的算力價效比超過了同等配置的S5(配置Intel至強Platinum 8255C CPU)伺服器,最高有83%的效能提升。

去年,阿里旗下的平頭哥釋出自研雲晶片倚天 710,它基於 ARM 架構,官方稱之為 “全球效能領先的雲原生處理晶片”,效能超過業界標杆 20%,能效比提升 50% 以上。

作為少數IT服務商轉型而來的雲廠商,華為雲可以利用華為在伺服器等硬體方面的優勢,可以提供基於華為鯤鵬晶片的ARM例項,作為自研的ARM主機提供商,華為與亞馬遜雲和阿里雲屬於一類,一方面可以靠鯤鵬生態,一方面要靠華為服務行業的經驗。

2021年,UCloud也推出了基於Ampere Altra處理器的主機,UCloud官方列出了與同等配置x86主機的價格差異,大致相差35%,應用場景方面,包括各類資料庫系統、Redis叢集、分散式開源儲存方案,安卓相關的模擬測試和開發測試,雲手機以及嵌入式開發等。

此前一直沒有采用ARM晶片的谷歌雲,在今年也宣佈將開始採用基於ARM技術的晶片,使用將基於Ampere Computing的Altra晶片。

在較大的雲廠商中,似乎只有IBM雲,目前還沒有使用ARM架構晶片。

當然,也有的規模較小的雲廠商覺得,現階段推出ARM主機的做法不划算,並沒有推出ARM伺服器的的打算,對於採用AMD的x86伺服器倒是更熱衷一些,目前,還是x86的實用性更強一些。

自研也好,用第三方的ARM平臺也好,整體而言,ARM伺服器的雲浪潮開始湧起。

雲計算陣營

在HPC方面,日本RIKEN實驗室的“Fugaku”超級計算機憑藉152064個48核富士通A64FX處理器位列世界第二。Fugaku使用的ARM架構CPU,採用定製的ARM V8架構,依託7奈米FinFET製程技術生產。浮點運算部分是與ARM合作開發的SVE指令擴充套件,使用512 bit浮點運算單元,大幅強化運算能力。

美國能源部下屬的桑迪亞國家實驗室宣佈建造ARM處理器的超算Astra,浮點效能達到2。3PFLOPS。

英偉達也推出主要面向大型資料密集型 HPC的Grace ,內建下一代 ARM Neoverse 核心,每個CPU能在 SPECrate2017_int_base 基準測試中單位時間執行超過 300 個例項。

邊緣計算方面,英偉達正擴大與 Marvell 的合作,將基於 ARM 的 OCTEON DPU 與 GPU 相結合,加速 AI 工作負載,實現網路最佳化和安全。

實際上,ARM自身也在不斷推出助力晶片企業進入高效能計算場景的平臺,先後相繼推出了Neoverse V系列、Neoverse N系列和Neoverse E系列。

目前有三家國內的初創公司正進行基於Neoverse N2的相關產品開發。其中,遇賢微電子和鴻鈞微電子是致力於雲原生伺服器 CPU 的開發,雲豹智慧則是針對 DPU 領域。

HPC陣營和邊緣計算陣營

我國廠商在 ARM 生態中佈局甚廣,華為鯤鵬和天津飛騰晶片均有 ARM 架構桌上型電腦和伺服器晶片,ARM 生態整機廠商包括長城、浪潮、同方、曙光等,國產作業系統亦廣泛支援。

從伺服器晶片的發展歷程來看,在2010年,很多企業只能採用X86晶片,經過2010年到2020年的十年攻關,完成了X86向ARM架構的軟體移植。現在,ARM憑藉著自身優勢,開始在伺服器領域衝鋒陷陣。