愛伊米

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

過去30年的計算時代發展大致可以分為三個階段:1995年微軟Windows開啟了以x86架構CPU為主的PC時代;2007年蘋果iPhone開啟了以Arm架構為主的智慧手機時代;2012年基於英偉達GPU的卷積神經網路AlexNet的成功開啟了人工智慧(AI)時代。AI經過10年的快速發展,已經從雲端擴充套件到邊緣和終端,滲透到資料中心、邊緣伺服器、5G基站和各種各樣的智慧終端中。

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

無論應用是否使用定製化ISA擴充套件,RISC-V都可同時支援。(Image:Codasip)

在Arm架構處理器從手機擴充套件到新興物聯網、汽車ADAS/自動駕駛和各種AI應用場景的同時,開源靈活的RISC-V微處理器架構也蓬勃發展起來。在越來越多的計算應用設計中,都可以看到Arm和RISC-V的身影。具體到晶片級別的硬體實現,廣泛應用於嵌入式計算的微控制器(MCU)和麵向邊緣/端側計算的AI晶片成了Arm和RISC-V架構微處理器核心正面對決的主戰場。

可定製化的指令集(ISA)

RISC-V指令集架構從一開始就支援基礎ISA、標準擴充套件,以及定製化ISA擴充套件指令。Arm最初不支援定製化擴充套件,但迫於競爭壓力也開始向Arm生態合作伙伴開放定製化功能了。即便封閉的x86生態也開始鬆動,英特爾最近也開始考慮對外授權,甚至定製化擴充套件也有可能。

因為沒有Arm和X86的歷史包袱,RISC-V ISA在指令規劃上比較簡單。在標準指令集之上根據特定應用的需要進行擴充套件,為各種碎片化的新興應用提供了極大的靈活性。例如,RISC-V向量擴充套件(RVV)可以讓處理器核心加速海量資料集的單指令流計算,特別適合如下計算任務:機器學習、影象壓縮處理、資料加密、音訊和影片多媒體處理、語音識別和自然語言處理。這些正是新興物聯網應用中實施AI所必須的計算任務。

RISC-V對定製化擴充套件指令的支援在某些特定應用中可能是設計成敗的關鍵所在。使用定製化擴充套件指令與其主ISA並不衝突,可以同時支援通用的RISC-V軟體。

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

Codasip CTO ZdeněkP ikryl

在上面的RISC-V軟體堆疊示意圖中,帶定製化ISA擴充套件的RISC-V處理器可以支援對實時性要求比較高的嵌入式OS(比如embOS、FreeRTOS或RT-Thread),也可以支援對處理效能要求比較高的OS(比如Linux、Android或Windows)。其上的App1不需要效能增強,也不採用定製化ISA擴充套件指令,只需要標準的編譯器就行了。而App2和App3採用了定製化ISA擴充套件以增強效能,因此必須使用相容定製化ISA擴充套件的編譯器。

Codasip是一家專注於RISC-V和特定域架構(DSA)處理器方案的歐洲開發商。該公司CTO ZdeněkP ikryl(裴德)在接受《電子工程專輯》採訪時表示,對於任何一個MCU廠商來說,無論基於RISC-V還是Arm架構,如果採用的是通用設計,那麼在效能上就一定會有所妥協。人工智慧通常要求較高的處理效能,而邊緣應用則需要低功耗、小尺寸的MCU。但現實情況是,通用處理器核心很少有適於這種組合的效能要求。對於一些邊緣AI應用,透過在RISC-V處理器核心中新增定製指令可以使演算法在相對有限的處理資源中得到充分執行。而可定製的領域專用架構能夠使處理器更適合AI演算法和軟體工作負載。

微處理器核心對效能的影響

處理器核心架構是影響處理器效能的關鍵因素,先進的架構具有更強大的指令集和更優秀的運算單元,因而擁有更為強大的算力。而在相同處理器架構下,採用不同的實現技術也會影響到效能的發揮。例如,採用匯流排併發架構技術實現CPU無等待指令訪問,可比同級別處理器運算效能提高30%以上。

對於MCU效能,要從兩個維度來衡量,一方面是主頻,另一方面就是核心架構。主頻很容易理解,類似於速度,對於同一種架構的MCU,當然是主頻越高MCU的速度就越快。先進的架構可以使核心在單位時間內執行更多的指令,也就是完成更多的任務。因此,不同架構的MCU如果只看主頻,是無法判斷其效能高低的。一般來說,越先進的核心架構,在單位時間內可以執行的指令數和處理資料的數量就越多。

由此可以看出,主頻越高且核心架構越先進的MCU,其效能就越好。這可以類比為賽跑:當步幅一樣大(即架構相同)的時候,步頻快(主頻高)的選手跑得就快;而當步頻一樣(主頻相同)時,步幅大(即指令執行效率高)的選手跑得就快。

當然還有其他影響因素,記憶體容量大小以及晶圓工藝等也都會在一定程度上影響處理器效能。例如,快取越大,處理器訪問資料的命中率越高,核心計算的效能就越高。

通常情況下,嵌入式MCU對處理器核心的主要訴求為穩定、可靠、安全、實時等控制特性需求,而邊緣AI晶片往往要求更高的計算效能和儲存容量,以及更低的功耗。對MCU來說,不同架構核心的區別更多地體現在軟體和開發生態上,而不是效能上。對於AI晶片,除了通用處理器的功能要求以外,還會有針對演算法和應用的需求,這可能需要相關的算力和效能,比如SIMD/Vector能力、DSP能力、擴充套件指令的開放性等。

MCU:Arm還是RISC-V?

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

國民技術市場總監顏君生

根據國民技術市場總監顏君生的看法,在MCU市場,Arm核心目前佔比最大,其生態比較健全,架構也已經完善成熟了,因此應用十分廣泛。但Arm核心侷限於封閉的指令集架構、授權及專利費用,不方便細分定製。此外,不同Arm核心的效能差異較大,而隨著Arm核心工作頻率的提升,MCU晶片的能耗增加很快。因此,採用高主頻Arm核心的MCU晶片如何降低能耗,這對MCU廠商來說是個不小的挑戰。

對通用MCU來說,採用Arm架構的好處是可以跟主流的生態保持相容,充分複用現有的應用設計,降低design-in的門檻。大多數國產MCU廠商都是基於這個理念而切入MCU市場的,事實證明這也符合中國半導體行業的發展需求。然而,這樣做的危害也日漸凸顯,我們已經看到國產MCU晶片的同質化問題越來越嚴重。如果只能在價格上競爭,這對整個行業和其中的大部分公司都沒有益處。一些有實力和遠見的國產MCU廠商已經意識到這一點,並開始轉向差異化的產品規劃和市場競爭。

在處理器核心的選擇上,除Arm外現在還有RISC-V。RISC-V架構具有低功耗、低成本、開源開放、可模組化、簡潔、面積小和速度快等優點。但其缺點也很明顯,主要表現在:開發工具鏈不夠友好;軟體生態不夠完善;沒有豐富的晶片系列選型。歸結到底,其實是因為發展時間太短,整體生態不完善。

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

愛普特產品市場總監魏璐

據愛普特微電子產品市場總監魏璐稱,其公司從成立之初就一直堅持使用自主產權的核心和MCU所需要的各種IP。雖然透過技術研發創新來實現微處理器的自主可控十分艱難,但堅持下來的價值和優勢也十分明顯。針對目前RISC-V MCU的發展痛點,愛普特與平頭哥一起合作打造了一個“開發編輯工具鏈”。目前編譯器已經可以支援“所見即所得”,支援包括AliOS在內的多個RTOS,整個工具連從底層到基礎系統,再到核心元件都已實現完整生態。

針對工程師和開發者面臨的開發選型豐富度不夠問題,愛普特開發了完整系列的RISC-V產品:引腳從20Pin直到200Pin,頻率從32KHz直到2GHz,處理器從32位到64位。魏璐表示,其公司計劃釋出25個系列,超過300多個型號的RISC-V產品,覆蓋消費類、工控類和車規級應用。

邊緣AI晶片:Arm還是RISC-V?

時擎科技是一家基於RISC-V核心開發邊緣AI晶片的初創公司,其聯合創始人兼總裁於欣在接受《電子工程專輯》採訪時表達了對Arm和RISC-V架構的觀點。Arm擁有更好的生態,包括開發工具、作業系統支援和廣泛的開發者基礎,以及更豐富的可選型號。然而,AI晶片更需要的是對於各類人工智慧演算法的高效支援,而這本身不是通用處理器的強項。如果僅僅透過Arm原生的VFP、NEON等擴充套件,起到的效果還是比較有限的。因此,AI晶片需要更專用的處理器核心,這就在Arm(或者說通用處理器)覆蓋的範圍之外了。

通用MCU和邊緣AI晶片之選:Arm還是RISC-V?

時擎科技總裁於欣

與Arm相反,RISC-V的開放性、模組化及可擴充套件特性會幫助AI處理器更好地與應用和演算法特點及需求相結合。時擎在這方面也做了一些探索,基於RISC-V架構開發的Timesformer處理器就是針對端側語音和視覺演算法特點而設計的DSA處理器,這也是RISC-V所具有的獨特優勢。

在軟體和生態方面,基於RISC-V架構的AI晶片目前還會遇到一些挑戰。但是由於AI應用往往需要晶片原廠提供晶片+演算法的完整解決方案,底層的架構對於大多數下游客戶來說並不是特別敏感,這在一定程度上掩蓋了RISC-V的缺失。

微處理器與應用的最佳匹配

對於處理器架構,沒有絕對的好與壞,而要看具體的應用需求。偏通用型的晶片採用Arm架構會存在得天獨厚的優勢,短時間來看還是難以撼動的。Arm是一個32位精簡指令集(RISC)處理器架構,其應用領域十分廣泛,目前主要有手機、PC、伺服器、汽車、物聯網、人工智慧解決方案等。在新興應用領域,特別是在智慧控制、邊緣計算、行動式產品等嵌入式產品應用領域,Arm架構處理器具有非常好的應用前景。例如,物聯網、工業聯網及工業控制、智慧家電及智慧家庭物聯網終端、消費電子、電機驅動、電池及能源管理、智慧表計、醫療電子、汽車電子、安防、生物識別、通訊、感測器、機器自動化等,都非常適合採用Arm架構的MCU產品。

據顏君生介紹,國民技術目前主要基於Arm Cortex-M0、Cortex-M4、Cortex-M7等核心平臺開發系列晶片產品,其中以通用MCU、安全晶片和無線射頻為主,現已廣泛應用於電控、工業、車載、醫療、物聯網、消費等領域,並正在擴充套件到車規MCU、數字電源、電機控制等細分MCU市場。

物聯網類應用和專用性較強的應用比較適合採用基於RISC-V的MCU。RISC-V是一種適合通用MCU和特定領域專用加速器(例如AI)的ISA,具有模組化和可定製的優勢,這意味著它可以被部署以滿足特定應用的需求,因此可以為物聯網應用的不同需求‘量體裁衣’。物聯網應用屬於長尾市場,碎片化很嚴重,有很多絕對體量不大但種類繁多的應用陸續顯現出來。至於專用性市場,RISC-V憑藉著開源和低成本的特性,更加如魚得水。

據魏璐透露,愛普特計劃2022年同步進軍通用市場和專用市場。在專用市場方面,其新產品將覆蓋公司已經涉足的領域,包括電機驅動、觸控按鍵、HMI、智慧語音等應用場景;通用市場方面,計劃推出具有各種豐富外設的通用型MCU,從48MHz到250MHz,儲存容量從64K/8K到512K/128K全覆蓋,外設方面也包括了USB、CAN、SDIO、加密引擎等關鍵外設。

時擎於欣認為,對於偏專用型的AI晶片,即需要透過底層架構創新來實現更好的演算法和硬體融合的晶片,RISC-V可能是個不錯的選擇,可以讓晶片開發者有更多的靈活性來設計處理器的微架構,並且一些底層和基礎的工具鏈和指令集不需要從零開始去造輪子,也在很大程度上是對現階段RISC-V揚長避短的可行做法。

未來生態發展

Arm的精簡指令集功耗較小、價格便宜、併發處理效率高、升級速度快,而且Arm自帶物聯網基因,在5G網路基礎設施和物聯網應用領域具有競爭優勢。Arm目前的趨勢是往伺服器和高效能計算的方向發展,也許會蠶食更多X86的份額。Arm未來面對的市場主要包括伺服器、移動終端、ICT基礎設施、汽車、嵌入式等場景。Arm生態在以上這些應用方面的整體可參與度和市場上升空間都十分巨大,有著非常好的發展前景。

目前整個MCU生態絕大部分仍被Arm架構主導,許多廠商選擇仿製和相容歐美晶片這條捷徑。但是慢慢地,我們看到越來越多的國產廠商加入RISC-V這個行列。現在終端客戶也開始接受RISC-V MCU了。

談及RISC-V MCU生態建設,魏璐表示愛普特將攜手平頭哥一起打造完整的RISC-V工具鏈和完整MCU生態。除了RISC-V的CSI元件認證外,愛普特還會打造“1520”生態標準,即1天上手、5天出原型,20天量產。目前愛普特已獨立開發了完整的開發套件,包括除錯工具、燒錄工具、編譯軟體等,可以讓工程師很方便地使用RISC-V MCU。

RISC-V生態在嵌入式應用中得到了迅速發展。隨著高效能RISC-V核心的出現,RISC-V生態系統將朝著高效能計算的方向發展。但是,在可以預見的未來(比方說3-5年內),RISC-V想要與Arm分庭抗禮,全面對抗還是比較困難的。於欣認為,RISC-V也許可以先從一些細分領域突破,再去尋求以點帶面,這是比較現實的路徑。某些細分領域對生態不敏感,對差異化要求比較高,比如端側AI晶片。此外,對於國內市場來說,對“自主可控”有著更高要求的領域也是RISC-V發展的沃土,比如信創行業。

總的來說,作為後來者和相對小眾的RISC-V,需要立足其開放、精簡、可擴充套件、模組化這些優勢,充分揚長避短,才有可能一步步發展壯大,最終形成與Arm和X86“三分天下”之勢。

作者:顧正書

EET電子工程專輯原創

END