愛伊米

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

除了面向64位移動計算的Cortex-X2、Cortex-A710、Cortex-A510三款全新CPU IP,ARM今天還帶來了多達四款新的移動GPU IP,同樣啟用新的命名規則,分別是

Mali-G710、Mali-G610、Mali-G510、Mali-G310。

G710、G510、G310分別定位旗艦、主流、入門級市場,依次取代現有的G78、G57、G310。

G610其實和G710是一回事兒,只是核心數較少時單獨使用的名字。

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

這是ARM Valhall GPU架構的第三代產品,也是第一次完整覆蓋高中低端各個領域。

搭配同時釋出的Cortex-X2/A710/A510 CPU、CoreLink CI-700一致性互連技術、CoreLink NI-700晶片網路一起,它們可以構成完整、強大的SoC解決方案。

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

雖然架構變化不大,只是繼續最佳化提升,但是這一代Mali GPU的效能進步還是很可觀的:

G710號稱綜合性能提升20%、機器學習效能提升35%、紋理效能提升50%、能效提升20%。

G510綜合性能提升100%、機器學習效能提升100%、能效提升22%。

G310雖然定位最低但變化最大,號稱紋理效能提升多達6倍、Vulkan效能提升4.5倍、安卓UI內容效能提升2倍。

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

G710的執行引擎設計和G77、G78十分相似,變化更多是一些細節。

wavefront/warp大小從8翻番到了16,而且

每個執行引擎有兩個資料路徑

,最終形成每個核心32個FMA。

ISA指令集也有了不小的改進,可以更好地滿足Vulkan等現代GPU的需求

,但暫無細節。

G710還新增了一個執行引擎

,每個著色器核心的計算效能因此翻番,同時每核心每時鐘週期的不同吞吐量也有4倍、8倍的增加。

紋理單元也是全新的,每時鐘週期可以處理最多80億紋理,再加上面積最佳化,單位密度紋理效能提升了50%。

16寬度執行單元單例項變成了4寬度四例項,整體吞吐量不變,但是資源分配更合理,效率更高。

新的執行引擎每核心每時鐘週期FMA翻了一番,同時功耗也最佳化降低了20%。

另外,傳統的工作管理器(Job Manager)變成了

新的“指令流前端”(Command Stream Frontend)

,負責排程和處理draw-call,還第一次帶來了韌體層,與硬體緊密配合處理主機需求。

G710可以配置8-16個不同核心數,G610則是最多6個核心

,另外二級快取可以配置2個或4個區塊,每個區塊256KB或者512KB, 也就是整體最小512KB,最多2MB。

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

G510支援2-6個核心配置

,每核心每執行單元的配置也可以定製,紋理單元也大大加強。

執行引擎還是2個,但也可以配置為只用1個

,每時鐘週期64 FMA會因此減少到48 FMA。

ARM列舉了G510 10種可能的不同規格配置,計算能力、填充率各有不同,適合不同應用需求。

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

G310雖然定位最低,但這次升級力度最大,終於拋棄了古老的Bifrost架構。

它因此有了新的執行引擎設計,支援靈活的規模配置,每核心可以有16、32、48、64 FMA,紋理單元最低則是每時鐘週期2個。

不過,

G310僅支援單核心設計。

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍

ARM連發四款Mali GPU:一律全新架構、效能飛躍最多6倍