愛伊米

11代酷睿手動降壓實操:簡單幾步降低20%功耗

英特爾在今年釋出了第11代酷睿處理器桌面版Rocket Lake-S。雖然延續了14nm製程工藝,但它的的變化可以用翻天覆地來形容,核心微架構部分採用了Cypress Cove(Sunny Cove的14nm反向移植版本),帶來了高達19%的平均IPC提升,以及對AVX-512指令集的支援,和在桌面平臺延續5年的Skylake微架構大不相同。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

“大核心”的

代價

將原本基於10nm節點所設計的微架構反向移植到老舊的14nm節點,雖然可以在製程工藝不變的情況下提高效能,但這並非沒有代價。由於Cypress Cove的每核心電晶體數量對比Skylake大幅增長,Rocket Lake-S為了控制芯片面積,最高規格只有8核心16執行緒,比Comet Lake-S家族的10核心20執行緒更少。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

下圖為外媒製作的Skylake與Cypress Cove的面積對比,在同樣14nm製程工藝的情況,Cypress Cove單個核心面積達到10。94mm ,增大約37%,尤其是為了支援AVX-512指令集及拓展子集,Cypress Cove在FPU/SIMD部分的增加了非常多的電晶體。因此即便減少了2個核心,但Rocket Lake-S的芯片面積依舊達到了270mm ,比上一代10核Comet Lake-S的206mm 要更大。

“14nm、AVX-512、超大芯片面積、5GHz頻率”,這幾個關鍵詞結合在一起,讓Rocket Lake-S效能提升的同時,也產生了新的問題,那就是備受關注的高功耗和與其對應的高發熱量。

不過對於一般使用者來說,在日常使用中Rocket Lake-S功耗真的有那麼誇張嗎?如何改善Rocket Lake-S的能耗表現?Rocket Lake-S高功耗的“罪魁禍首”AVX-512指令集又能帶來哪些提升?帶著這些問題,筆者進行了一些有意思的測試。

烤機壓力測試

本次測試使用了酷睿i7-11700K處理器,和旗艦酷睿i9-11900K同樣是8核心16執行緒規格,但頻率略低一些,在英特爾睿頻加速Max 3。0技術的加持下單核睿頻可達5。0GHz、多核睿頻為4。6GHz。測試平臺搭配Z490晶片組主機板,總容量為32GB的3200MHz雙通道記憶體,以及追風者TC14PE散熱器等配置。測試時採用開放式平臺,環境室溫為26℃。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

進行單烤AIDA64 FPU壓力測試,並能透過HWiNFO64對執行狀態進行監控。可以發現,如果是預設開啟AVX-512指令集的情況下,酷睿i7-11700K跑滿4。6GHz全核心睿頻時的功耗可高達250W以上,追風者C14PE這樣的風冷無法很好壓制,因此烤機時溫度在一瞬間就超過100℃,導致酷睿i7-11700K只能降頻在全核心4。3GHz執行,但即便是降頻後功耗依舊超過了220W。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

為了解決Rocket Lake-S家族處理器烤機時的高功耗問題,華碩、微星等主機板在近期更新的BIOS中均加入了AVX2和AVX-512調整功能,可以靈活的設定頻率offset或者直接關閉。

下圖為華碩ROG STRIX Z490-A GAMING的BIOS介面,預設開啟AVX-512,筆者接下里將手動關閉,並測試能耗表現。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

以下為CPU-Z的識別資訊,分別為手動關閉AVX-512以及預設開啟AVX-512。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

11代酷睿手動降壓實操:簡單幾步降低20%功耗

在手動關閉AVX-512後,繼續進行AIDA64 FPU烤機壓力測試,可以看到在同樣的測試平臺、同樣的測試環境的情況下,酷睿i7-11700K能夠以全核心4。6GHz穩定執行,總功耗控制在200W出頭,10分鐘後溫度穩定在90℃。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

而除了AVX-512指令集之外,筆者在測試時發現Rocket Lake-S的預設電壓普遍偏高,而這也是導致功耗增長的元兇,因此如果採用手動降壓策略,筆者手中的這顆酷睿i7-11700K還有進一步降低功耗的空間。

BIOS中關閉AVX-512後,還將核心電壓鎖定為1。24V,此時再透過AIDA64 FPU烤機,HWiNFO64監控顯示酷睿i7-11700K的功耗可穩定在165W左右,核心溫度為73℃,能耗表現獲得了進一步提高。當然考慮到處理器的體質區別,以及各型號主機板在BIOS調教方面的差異,所以關於降壓的具體操作還需要根據每一刻處理器的情況來具體分析,不能一概而論。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

常規效能測試

透過前面的測試可以得出結論,無論是否手動調整電壓,酷睿i7-11700K關閉AVX-512指令集後的烤機功耗及溫度都做到了大幅降低;那麼在非烤機時的效能方面,關閉AVX-512後又會產生多大影響呢?針對這個問題,筆者又進行了下面的測試:

CPU-Z作為最流行的基準測試軟體之一,目前1。96。1版本包含了4個測試,由於常用的Version 17。01。64測試是不支援AVX-512指令集的,因此在關閉AVX-512後,酷睿i7-11700K的單執行緒和多執行緒效能均未受到影響。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

11代酷睿手動降壓實操:簡單幾步降低20%功耗

Cinebench同樣是流行的基準測試軟體,基於Cinema 4D開發,目前已經同步更新至R23版本。在R23版本中,Cinebench同樣不支援AVX-512指令集,因此酷睿i7-11700K無論開啟還是關閉AVX-512指令集,兩次測試的效能表現也沒有區別。

酷睿i7-11700K關閉AVX-512測試Cinebench R23,單執行緒1595pts、多執行緒14908pts。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

酷睿i7-11700K開啟AVX-512測試Cinebench R23,單執行緒1591pts、多執行緒14914pts。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

再使用5。0。20版的Benchmark進行測試渲染能力,可以看到酷睿i7-11700K開關AVX-512的兩次測試結果完全相同。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

11代酷睿手動降壓實操:簡單幾步降低20%功耗

從結果上可以看到,由於CPU-Z V17、Cinebenh R23、Vray 5等基準測試均不支援AVX-512,所以酷睿i7-11700K無論是否開啟AVX-512,執行這些測試時效能和功耗都不會有顯著變化。

AVX-512帶來的效能提升有哪些?

雖然Rocket Lake-S在呼叫AVX-512指令時會產生較高功耗,且當下消費級市場中支援AVX-512的應用較少,但考慮到這很可能是未來的發展趨勢(第12代酷睿處理器Alder Lake的Golden Cove微架構、以及AMD Zen 4微架構均會支援AVX-512),筆者也針對AVX-512的具體效能提升,做了簡短的測試。

SiSoftware Sandra是一個十分強大的系統分析評測工具,目前已經更新至2021版本,該版本的部分測試專案已經針對AVX-512進行了最佳化,例如多媒體處理器測試中。關閉AVX-512後,酷睿i7-11700K的總體多媒體功效為962。6百萬畫素每秒。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

開啟AVX-512後,即使酷睿i7-11700K因為測試時的溫度較高而觸發了降頻,但總體多媒體功效依舊提升至1。27十億畫素每秒,幅度非常顯著。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

接下來測試y-cruncher,這是一款高速計算圓周率的軟體,不但支援基礎的AVX-512F,還支援額外的指令拓展AVX-512 IFMA(具有52位精度的整數融合乘加)能進一步提升了效率。

為了避免記憶體頻寬瓶頸,使用y-cruncher單執行緒計算250,000,000位數,酷睿i7-11700K關閉AVX-512時花費時間為54。497秒。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

酷睿i7-11700K開啟AVX-512時花費時間僅為34。717秒,縮短了將近20秒,可謂是非常驚人。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

可見在特定場景下,AVX-512確實可以讓效能獲得顯著提升。還要說明一下Rocket Lake-S、Tiger Lake-H45、Tiger Lake-UP3UP4H35、Ice Lake-U等面向普通消費級的酷睿處理器均為半吞吐AVX-512,只有1個512位FMA單元;而像第3代至強可擴充套件處理器Ice Lake-SP這樣面向資料中心的產品,則擁有2個512位FMA單元,理論峰值效能更為強大。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

事實上此前AVX-512指令集是英特爾面向資料中心領域的至強可擴充套件處理器、專業工作站至強W處理器以及酷睿X系列處理器等產品線的專屬,從第11代酷睿處理器桌面版Rocket Lake-S以及第11代酷睿處理器高效能移動版Tiger Lake-H45開始,英特爾才將AVX-512指令集大量下放到主流消費級產品。相信隨著新產品的逐步鋪貨,AVX-512指令集的相關軟體生態也能夠進一步完善。

總結

對於一些已經深度最佳化的應用負載,AVX-512可謂是一把雙刃劍,提升效能的同時也大幅增加了功耗;因此對於少數需求AVX-512的使用者,想要讓Rocket Lake-S系列尤其是酷睿i7、酷睿i9在執行AVX-512負載時獲得穩定的效能釋放,不會因為碰到功耗牆或溫度牆觸發降頻,那還需要同步搭配供電能力較為出色的主機板,以及頂級風冷乃至240冷排以上的水冷散熱器。

11代酷睿手動降壓實操:簡單幾步降低20%功耗

但對於絕大多數普通使用者來說,由於很少有機會使用支援AVX-512指令集的應用程式,同時更不會頻繁開啟AIDA64 FPU及P95烤機壓力測試,因此對於第11代酷睿處理器Rocket Lake-S所支援AVX-512指令集所帶來的高功耗,其實沒有必要過分關心,常規的中高階風冷就能夠滿足Rocket Lake-S在日常使用中的散熱需求。再考慮到Cypress Cove微架構的通用IPC改進,也就是說再執行非AVX-512應用程式也能夠帶來兩位數的效能提升,從這一點來看Rocket Lake-S在架構層面算得上一次中規中矩的升級換代。