愛伊米

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

(報告出品方/作者:國信證券,熊莉)

算力晶片研究框架

計算晶片是算力時代下智慧網聯汽車的核心

計算晶片可分為 MCU 晶片與 SoC 晶片。隨著汽車 EE 架構的不斷革新,汽車半導體高速發展,按功能不同,汽車半導體可分為汽車晶片和功率半導體,而在汽車晶片中,最重要的是計算晶片,按整合規模不同,可分為MCU 晶片與SoC 晶片。MCU(Micro Control Unit)微控制器,是將計算機的CPU、RAM、ROM、定時計數器和多種 I/O 介面整合在一片晶片上,形成晶片級的晶片;而SoC(SystemonChip)指的是片上系統,與 MCU 不同的是,SoC 是系統級的晶片,它既像MCU 那樣有內建RAM、ROM,同時又可以執行作業系統。

智慧化趨勢驅動汽車晶片從 MCU 向 SoC 過渡。自動駕駛對汽車底層硬體提出了更高的要求,實現單一功能的單一晶片只能提供簡單的邏輯計算,無法提供強大的算力支援,新的 EE 架構推動汽車晶片從單一晶片級晶片MCU 向系統級晶片SoC過渡。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

SoC 市場高速發展,預計 2026 年市場規模達到 120 億美元。汽車智慧化落地加速了車規級 SoC 的需求,也帶動了其發展,相較於車載MCU 的平穩增長,SoC市場呈現高速增長的趨勢,根據 Global Market Insights 的資料,預計全球車規級SoC 市場將從 2019 年的 10 億美元達到 2026 年的 160 億美元,CAGR 達到35%,遠超同期汽車半導體整體增速。

傳統 MCU:MCU 需求穩步增長,海外寡頭長期壟斷

MCU 是 ECU 的運算大腦。ECU(Electronic Control Unit,電子控制單元)是汽車 EE 架構的基本單位,每個 ECU 負責不同的功能。MCU 晶片嵌入在ECU 中作為運算大腦。當感測器輸入訊號,輸入處理器對訊號進行模數轉換、放大等處理後,傳遞給 MCU 進行運算處理,然後輸出處理器對訊號進行功率放大、數模轉換等,使其驅動如電池閥、電動機、開關等被控元件工作。

MCU 根據不同場景需求,有 8 位、16 位和 32 位。8 位MCU 主要應用於車體各子系統中較低端的控制功能,包括車窗、座椅、空調、風扇、雨刷和車門控制等。16位 MCU 主要應用為動力傳動系統,如引擎控制、齒輪與離合器控制和電子式渦輪系統等,也適合用於底盤機構上,如懸吊系統、電子動力方向盤、電子剎車等。32 位 MCU 主要應用包括儀表板控制、車身控制以及部分新興的智慧性和實時性的安全功能。在目前市場的主流 MCU 當中,8 位和 32 位是最大的兩個陣營。

MCU 市場穩步發展,預計 2026 年全球規模達 88 億美元。在市場規模上,全球MCU市場呈現穩步發展的趨勢,根據 IC Insights 估計,預計全球MCU 市場規模從2020年的 65 億美元達到 2026 年的 88 億美元,CAGR 達到5。17%,略低於同期汽車半導體增速。同時我國 MCU 發展與世界齊頭並進,預計2026 年市場規模達到56億元,CAGR 達到 5。33%,與世界同期基本持平。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

智慧座艙 SoC:高通在中高階數字座艙呈現壟斷局面

一芯多屏不斷普及,高通在中高階數字座艙呈現壟斷地位。伴隨著數字座艙滲透率不斷提升,車內數量不斷增加,螢幕尺寸不斷增大,智慧座艙快速普及,一芯多屏逐漸成為主流,也帶動智慧座艙 SoC 晶片的快速放量。SoC 應用在智慧汽車上主要有智慧座艙以及自動駕駛兩方面,相比於自動駕駛SoC,座艙域SoC由於要求相對較低,成為 SoC 落地智慧汽車的先行者。高通、恩智浦、德州儀器、英特爾、聯發科等各家不斷更新其座艙 SoC 產品,在中高階數字座艙域,目前高通呈現壟斷地位。目前,高通已經贏得全球領先的 20+家汽車製造商的資訊影音和數字座艙專案,高通驍龍 820A 和 8155 兩代平臺成為眾多車型數字座艙平臺的主流選擇,高通也將推出的第四代座艙 SoC SA8295,在算力、I/O 能力等方面表現出色,不斷穩固其在中高階數字座艙的穩固地位。

自動駕駛 SoC:CPU+XPU 是當前主流,英偉達當前領先

自動駕駛晶片是指可實現高級別自動駕駛的 SoC 晶片。隨著自動駕駛汽車智慧化水平越來越高,需要處理的資料體量越來越大,高精地圖、感測器、鐳射雷達等軟硬體裝置對計算提出更高要求,因此在 CPU 作為通用處理器之外,增加具備AI能力的加速晶片成為主流,常見的 AI 加速晶片包括GPU、ASIC、FPGA 三類。CPU 作為通用處理器,適用於處理數量適中的複雜運算。CPU 作為通用處理器,除了滿足計算要求,還能處理複雜的條件和分支以及任務之間的同步協調。CPU晶片上需要很多空間來進行分支預測與最佳化,儲存各種狀態以降低任務切換時的延時。這也使得它更適合邏輯控制、序列運算與通用型別資料運算。以GPU與CPU進行比較為例,與 CPU 相比,GPU 採用了數量眾多的計算單元和超長的流水線,但只有非常簡單的控制邏輯並省去了 Cache。而 CPU 不僅被Cache 佔據了大量空間,而且還有有複雜的控制邏輯和諸多最佳化電路,相比之下計算能力只是很小的一部分。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

“CPU+XPU”是當前自動駕駛 SoC 晶片設計的主流趨勢。根據XPU 選擇不同,又可以分為三種技術路線:CPU+GPU+ASIC、CPU+ASIC 以及CPU+FPGA 三類。(1)“CPU+GPU+ASIC”,主要代表英偉達、特斯拉FSD 以及高通Ride。英偉達Xavier 和特斯拉 FSD 採用“CPU+GPU+ASIC”的設計路線,英偉達Xavier以GPU為計算核心,主要有 4 個模組:CPU、GPU、以及兩個ASIC 晶片Deep LearningAccelerator(DLA)和 Programmable Vision Accelerator(PVA);特斯拉FSD晶片以 NPU(ASIC)為計算核心,有三個主要模組:CPU、GPU 和Neural ProcessingUnit(NPU)。

(2)“CPU+ASIC”,主要代表 Mobileye EyeQ5 系列和地平線征程系列。MobieyeEyeQ5 和地平線征程系列採用“CPU+ASIC”架構,EyeQ5 主要有4 個模組:CPU、Computer Vision Processors(CVP)、Deep Learning Accelerator(DLA)和Multithreaded Accelerator(MA),其中 CVP 是針對傳統計算機視覺演算法設計的ASIC;地平線自主設計研發了 Al 專用的 ASIC 晶片Brain Processing Unit(BPU)。

(3)CPU+FPGA,主要代表 Waymo。與其餘廠商不同,Waymo 採用“CPU+FPGA”的架構,其計算平臺採用英特爾 Xeon12 核以上 CPU,搭配Altera 的Arria 系列FPGA。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

目前各家釋出的最新晶片平臺均可以支援 L3 或 L4 級的算力需求,英偉達當前處於領先位置。英偉達單顆 Orin 的算力可以達到 254TOPS,而2022 年落地的車型中搭載 4顆Orin的蔚來 ET7和威馬M7其巔峰算力將超過1000TOPS,高通驍龍Ride平臺的巔峰算力預計在 700-760TOPS,Mobileye 也推出了面向高階自動駕駛的EyeQ6 Ultra,算力達到 176 TOPS,當前各家最先進的算力平臺均可以支援L3或L4 級的算力需求。從相關量產車型來看,英偉達Orin 成為當下的主流選擇,Mobileye 正在逐漸掉隊。

評價框架:晶片效能,算力、能耗、效率缺一不可

評估晶片的效能,一般採用 PPA 即 Power(功耗),Performance(效能),Aera(面積)三大指標來衡量效能。而智慧駕駛領域,峰值算力成為衡量自動駕駛晶片的最主要指標,常見的指標有 TOPS、FLOPS、DMIPS 三種:

TOPS(Tera Operation Per Second):每秒完成操作的數量,乘操作算一個 OP,加操作算一個 OP。TOPS 的物理計算單位是積累加運算(MultiplyAccumulate, MAC),1 個 MAC 等於 2 個 OP。TOPS 表示每秒進行1 萬億次操作。

FLOPS(Floating-Point Operations Per Second):每秒可執行的浮點運算次數的字母縮寫,它用於衡量計算機浮點運算處理能力。浮點運算,包括了所有涉及小數的運算。MFLOPS(MegaFLOPS)等於每秒1 百萬次的浮點運算;GFLOPS(GigaFLOPS)等於每秒 10 億(=10^9)次的浮點運算;TFLOPS(teraFLOPS)等於每秒 1 萬億次的浮點運算。

DMIPS(Dhrystone Million Instructions Per Second):是測量處理器運算能力的最常見基準程式之一,常用於處理器的整型運算效能的測量。MIPS:每秒執行百萬條指令,用來計算同一秒內系統的處理能力,即每秒執行了多少百萬條指令。不同的 CPU 指令集不同、硬體加速器不同、CPU 架構不同,導致不能簡單的用核心數和 CPU 主頻來評估效能,Dhrystone 作為統一的跑分演算法,DMIPS 比 MIPS 的數值更具有意義。

(1)智慧座艙 SoC: DMIPS 衡量 CPU 算力的主要單位是 DMIPS,基本上SoC 高於20,000 DMIPS才能流暢地執行智慧座艙的主要功能,如 AR 導航或雲導航、360 全景、播放流媒體、ARHUD、多作業系統虛擬機器等。GPU 方面,100 GFLOPS 的算力就可以支援3個720P的螢幕。一般來說,CPU 高於 20,000 DMIPS,GPU 高於100 GFLOPS 的SoC就是智慧座艙 SoC 晶片。 (2)自動駕駛 SoC: TOPS 峰值算力體現的只是晶片的理論上限,不能代表其全部效能。自動駕駛需要的計算機視覺演算法是基於卷積神經網路實現的,而卷積神經網路的本質是累積累加演算法(Multiply Accumulate,MAC),實現此運算操作的硬體電路單元,被稱為“乘數累加器”。這種運算的操作,是將乘法的乘積結果b*c 和累加器a的值相加,再存入累加器 a 的操作。TOPS = MAC 矩陣行* MAC 矩陣列* 2 *主頻,TOPS峰值算力反映的都是 GPU 理論上的乘積累加矩陣運算算力,而非在實際AI應用場景中的處理能力,具有很大的侷限性。以英偉達的晶片為例,Orin、Xavier的利用率基本上是 30%左右,而採用 ASIC 路線,ASIC 晶片針對不同的神經網路模型去最佳化,基本上可以做到 60%~80%之間。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

地平線提出最真實的 AI 效能由理論峰值計算效能、有效利用率、AI 演算法效率組成。地平線在 2020 全球人工智慧和機器人峰會提出了晶片AI 效能評估方式MAPS(Mean Accuracy-guaranteed Precessing Speed),地平線認為最真實的AI效能實際上由三要素組成,分別為理論峰值計算效能、有效利用率、AI 演算法效率。(1)理論峰值計算效能,TOPS/W、TOPS/$,即傳統理論峰值衡量的方法;(2)晶片有效利用率,把演算法部署在晶片上,根據架構特點,動用編譯器等系統化解決一個極其複雜的帶約束的離散最佳化問題,而得到一個演算法在晶片上執行的實際利用率,這是軟硬體計算架構的最佳化目標;(3)AI 演算法效率,每消耗一個TOPS算力,能帶來多少實際的 AI 演算法的效能,它體現的是AI 演算法效率的持續提升。(報告來源:未來智庫)

汽車軟體研究框架

作業系統 OS:QNX+Linux 或 QNX+Android 是當前的主流趨勢

在智慧網聯時代,車機作業系統 OS(operating system)按下游應用劃分,可以分為車控 OS 和座艙 OS 兩大類:(1)車控 OS:主要負責實現車輛底盤控制、動力系統和自動駕駛,與汽車的行駛決策直接相關;(2)座艙OS:主要為車載資訊娛樂服務以及車內人機互動提供控制平臺,是汽車實現座艙智慧化與多源資訊融合的執行環境,不直接參與汽車的行駛決策。 對於車控 OS 而言,可分為嵌入式實時作業系統 RTOS 和基於POSIX 標準的作業系統。(1)嵌入式實時作業系統 RTOS:傳統車控 ECU 中主控晶片MCU 裝載執行的嵌入式 OS,面向經典車輛控制領域,如動力系統、底盤系統和車身系統等。要求實時程式必須保證在嚴格的時間限制內響應,特點包括速度快,吞吐量大,程式碼精簡,程式碼規模小等;(2)基於 POSIX 標準的作業系統:主要面向智慧駕駛系統,主要滿足其高通訊和低延時的要求。

汽車電控 ECU 必須是高穩定性的嵌入式實時性作業系統,主流的嵌入式實時作業系統都相容 OSEK/VDX 和 Classic AUTOSAR 這兩類汽車電子軟體標準。嵌入式實時作業系統具有高可靠性、實時性、互動性以及多路性的優勢,系統響應極高,通常在毫秒或者微秒級別,滿足了高實時性的要求。目前,主流的嵌入式實時作業系統都相容 OSEK/VDX 和 Classic AUTOSAR 這兩類汽車電子軟體標準。歐洲在上世紀 90 年代提出了汽車電子上分散式實時控制系統的開放式系統標準OSEK/VDX。但隨著技術、產品、客戶需求等的升級,OSEK 標準逐漸不能支援新的硬體平臺。2003 年,寶馬、博世、大陸、戴姆勒、通用、福特、標誌雪鐵龍、豐田、大眾 9 家企業作為核心成員,成立 AUTOSAR 組織,致力於建立一個標準化平臺,獨立於硬體的分層軟體架構,制定各種車輛應用介面規範和整合標準,AUTOSAR是基於 OSEK/VDX 發展出來的,但涉及的範圍更廣。

AUTOSAR 主要包括 Classic Platform AUTOSAR(CP)和Adaptive PlatformAUTOSAR(AP)兩個平臺規範:CP AUTOSAR 是基於 OSEK/VDX 標準的,廣泛應用於傳統嵌入式 ECU 中,如發動機控制器、電機控制器、整車控制器、BMS 控制器等;APAUTOSAR基於 POSIX,主要應用於自動駕駛等需求高計算能力、高頻寬通訊、分散式部署的下一代汽車應用領域中。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

狹義 OS 僅包含核心(如 QNX、Linux),廣義 OS 從下至上包括從BSP、作業系統核心、中介軟體及庫元件等硬體和上層應用之間的所有程式。QNX、Linux 是目前常見核心 OS,VxWorks 也有一定應用。隨著WinCE 停止更新逐漸退出,OS 核心的格局較為穩定,主要玩家為 QNX(Blackberry)、Linux(開源基金會)、VxWorks(風河)。其中 Linux 屬於非實時作業系統,而QNX 和VxWorks屬於實時作業系統,WinCE 是微軟開發的嵌入式作業系統,正在逐步退出汽車作業系統市場。 (1)Blackberry QNX: QNX 是遵從 POSIX 規範的類 UNIX 實時作業系統,是全球第一款達到ASILD級別的車載作業系統,優點是穩定性和安全性非常高,QNX 依靠其微核心架構實現效能和可靠性的平衡,主要特點有核心小、程式碼少以及故障影響小,驅動等錯誤不會導致整個系統都崩潰,通用、沃爾沃、奧迪、上汽等均用QNX 作為自動駕駛OS。但缺點是 QNX 作為非開源系統,相容性較差,開發難度大,在娛樂系統開發中應用不多,主要是開放性不夠,應用生態缺乏。 (2)Linux(Android): Linux 是基於 POSIX 和 UNIX 的開源作業系統,可適配更多的應用場景,具有很強的定製開發靈活度,主要用於支援更多應用和介面的資訊娛樂系統場景。Android是谷歌基於 Linux 核心開發的開源作業系統,主要應用在車載資訊娛樂系統、導航領域,在國內車載資訊娛樂系統領域佔據主流地位。由於其完全開源,基於Linux 開發的難度也極大,而且開發週期比較長,這就限制了車機系統進入門檻。(3)VxWorks: VxWorks 由 Wind River 設計開發的嵌入式實時作業系統,以其良好的可靠性和卓越的實時性被廣泛地應用在通訊、軍事、航空、航天等領域,VxWorks 由400多個相對獨立的目標模組組成,但與 Linux 相比,VxWorks 需要收取高昂的授權費,開發定製成本較高,這限制了其市場佔有率的增長。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

QNX、Linux 是當前車機 OS 核心的首選。根據賽迪顧問的統計,QNX 由於其典型的實時性、低延時、高穩定等特徵,2021 年 QNX 市佔率達到43%,是當前市佔份額最高的車機 OS,已應用在包括寶馬、奧迪、賓士等超過40 個品牌,全球使用了QNX 的汽車超 1。75 億輛;Linux(含 Android)Linux 版本豐富,經過改造Linux核心也將具備實時性功能,21 年市佔率 35%;WinCE 當前市佔率8%,呈現快速下滑態勢,未來可能將逐步在市場消失;VxWorks 同時具備實時性及開源特點,但其業務重點一直在複雜工業領域,對於汽車產業投入較少,售價及維修費用極其昂貴,目前僅在部分高階品牌車型上有所嘗試。

隨著智慧座艙和智慧駕駛的進步,OEM 廠商更加關注車機OS。然而,無論是傳統OEM 巨頭或是造車新勢力,從零開始開發作業系統都絕非易事,根據對基礎系統的改造程度不同,一般可以分為三類: (1)定製型車機 OS:在基礎 OS 的基礎上進行深度開發和定製(包括系統核心修改),與 Tier1 和主機廠一起實現座艙系統平臺或自動駕駛系統平臺。例如百度車載 OS、大眾 VW。OS、特斯拉 Version; (2)ROM 型車機 OS:基於 Android 或 Linux 定製開發,無需更改系統核心。海外主機廠多選擇基於 Linux 開發 ROM 型車機 OS,國內自主品牌則主要選擇應用生態更好的 Android。例如賓士、寶馬、蔚來、小鵬等整車廠的車機系統都屬於ROM型車機 OS;(3)超級汽車 APP:並非完整的車機 OS,而是手機對映系統,是指集地圖、音樂、語音、社交等功能於一體的多功能 APP,滿足車主需求。例如百度Carlife、華為HiCar、蘋果 CarPlay、谷歌 AndroidAuto 等。

板級支援包 BSP:主機板硬體與作業系統之間的橋樑

BSP(Board Support Package,板級支援包)是構建嵌入式作業系統所需的載入程式、核心、根檔案系統和工具鏈提供的完整的軟體資源包。對於具體的硬體平臺,與硬體相關的程式碼都被封裝在 BSP 中,由 BSP 向上提供虛擬的硬體平臺,BSP與作業系統透過定義好的介面進行互動。 BSP 介於主機板硬體和作業系統之間的一層,也屬於作業系統的一部分,主要目的是為了支援作業系統,使之能夠更好的運行於硬體主機板,為OS 和硬體裝置的互動操作搭建了一個橋樑。由於所屬的中介位置,BSP 的功能分為兩部分,一方面為 OS 及上層應用程式提供一個與硬體無關的軟體平臺,另一方面OS 可以透過BSP來完成對指定硬體的配置和管理。 不同的作業系統對應於不同定義形式的 BSP。例如,VxWorks 的BSP 和Linux的BSP 相對於某一 CPU 來說盡管實現的功能一樣,但寫法和介面定義是完全不同的,所以寫 BSP 一定要按照該系統 BSP 的定義形式來寫,這樣才能與上層OS 保持正確的介面,良好的支援上層 OS。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

Hypervisor:虛擬化平臺,跨平臺應用的重要途徑

提供平臺虛擬化的層稱為 Hypervisor。虛擬化是透過某種方式隱藏底層物理硬體的過程,從而實現多個作業系統可以透明地使用和共享硬體。Hypervisor是實現跨平臺應用、提高硬體利用率的重要途徑。車載領域的Hypervisor 負責管理並虛擬化異構硬體資源,以提供給執行在 Hypervisor 之上的多個作業系統核心。Hypervisor 支援異構硬體單元(包括控制單元、計算單元、AI 單元)的隔離,在同一個異構硬體平臺上支援不同的作業系統核心,從而支援不同種類的應用。Hypervisor 虛擬機器管理助力多系統融合。Hypervisor(虛擬機器)是執行在物理伺服器和作業系統之間的中間軟體層,可用於同步支援Android、Linux、QNX多系統。根據 ISO26262 標準規定,儀表盤的關鍵資料和程式碼與娛樂資訊系統屬於不同等級,主流市場中,QNX 或 Linux 系統用來驅動儀表系統,資訊娛樂系統則以Android 為主,目前技術只能將兩個系統分開裝置在各自晶片中。然而,虛擬機器可以同時運作符合車規安全標準的 QNX 與 Linux,因此虛擬機器管理的概念被引入智慧座艙作業系統。 隨著液晶儀表以及其他安全功能的普及,供應商不需要裝載多個硬體來實現不同的功能需求,只需要在車載主晶片上進行虛擬化的軟體配置,形成多個虛擬機器,在每個虛擬機器上執行相應的軟體即可滿足需求。引入虛擬機器管理最重要的意義在於虛擬機器可以提供一個同時執行兩個及以上獨立作業系統的環境,比如在智慧座艙中同時執行 Android(座艙 OS)和 QNX(車控 OS),為智慧網聯汽車的應用提供高性價比且符合安全要求的平臺。

中科創達、武漢光庭資訊、南京誠邁科技是黑莓 VAI 專案的系統整合商類的合作伙伴。2017 年 3 月,黑莓公司宣佈正式成立 VAI(Value-Added Integrator)專案,拓展嵌入式軟體市場,成為黑莓公司 VAI 專案合作伙伴,將基於黑莓的嵌入式技術提供整合服務、安全關鍵型解決方案,包括黑莓QNX Neutrino 實時作業系統、QNX Momentics 工具套件、QNX 管理程式、應用程式和媒體QNX SDK、QNX無線架構、QNX 認證作業系統、QNX 醫用作業系統、Certicom 工具包、Certicom管理的公鑰基礎設施以及 Certicom 資產管理系統。目前,黑莓VAI 專案的中國區系統整合商類的合作伙伴主要包括中科創達、武漢光庭資訊、南京誠邁科技等。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

長期看,智慧座艙與自動駕駛兩大系統終將走向融合。由於目前車控域與座艙域兩者的發展目標平行,同時,由於 QNX、Linux 與 Andriod 三大系統各有優劣,因此,透過虛擬機器管理多個獨立系統是當下實現“多快好省”的智慧網聯汽車的發展路徑。但從長期看,想要真正實現高階自動駕駛的必要前提就是車控與座艙的融合,即智慧座艙與自動駕駛系統的容二虎,這樣將會從整體層面給未來留下更系統的升級空間。當然兩大系統的融合也面臨著系統疊加導致的片負載加重,對計算效能形成挑戰。

中介軟體層:助力軟硬體解耦分離,提升應用層開發效率

中介軟體隔離應用層與底層硬體,助力軟硬體解耦。中介軟體位於作業系統、網路和資料庫之上,應用軟體的下層,作用是為處於自己上層的應用軟體提供執行與開發的環境,幫助使用者靈活、高效地開發和整合複雜的應用軟體,實現軟硬體的解耦分離。車企致力於定義更統一的中介軟體通訊和服務,以降低開發成本和系統複雜度,操作軟體(OS)和中介軟體是促進軟硬體分離的底層軟體元件。即使車企選擇自研作業系統,但同時也會依賴於供應商提供標準中介軟體產品,尤其基礎軟體平臺的架構極其重要,可大幅提升應用層軟體的開發效率。所有中介軟體方案中,最著名的是 CP AUTOSAR 的 RTE。AUTOSAR 的兩個平臺AUTOSARClassic 和 AUTOSAR Adaptive 為不同的車輛用例提供了分層的軟體體系結構方法,AUTOSAR 以中介軟體 RTE(Runtime Environment)為界,隔離上層的應用層(Application Layer)與下層的基礎軟體(Basic Software)。RTE 使得硬體層完全獨立於應用層,OEM 廠商可以專注於開發特定的、有競爭力的應用軟體,同時使得廠商不關心的基礎軟體層被標準化。

分散式通訊(Data Distribution Service, DDS)透過實現低延遲資料連線、極高的可靠性和可擴充套件的靈活架構,使資料成為未來移動數字平臺的中心。DDS提供的用於以資料為中心的連線的中介軟體協議、連線框架和API 標準。它集成了分散式系統的元件,提供了低延遲的資料連線、極高的可靠性和可擴充套件的體系結構,滿足業務和任務關鍵型應用程式的需求。AUTOSAR Adaptive 平臺2017 年推出,2018 年便集成了 DDS 標準,將 DDS 與 AUTOSAR 結合使用,不僅可以保證和擴充套件AUTOSAR 系統內部互操作性的功能,而且還可以將其開放給來自不同生態系統等行業的外部系統。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

國產 AUTOSAR 供應商不斷崛起。AUTOSAR 標準發展了十多年,已經形成非常複雜的技術體系。各工具廠商開發了相應的支撐軟體,以助力主機廠加速實現AUTOSAR的落地。目前全球知名的 AUTOSAR 解決方案廠商包括ETAS(博世)、EB(大陸)、Mentor Graphics(西門子)、Wind River、Vector、KPIT 等,國內主要是東軟睿馳、經緯恆潤等。

功能軟體:自動駕駛的核心共性功能模組

功能軟體主要包含自動駕駛的核心共性功能模組。核心共性功能模組包括自動駕駛通用框架、網聯、雲控等,結合系統軟體,共同構成完整的自動駕駛作業系統,支撐自動駕駛技術實現。

(1)智慧駕駛通用模型: 智慧駕駛通用模型是對智慧駕駛中智慧認知、智慧決策和智慧控制等過程的模型化抽象。對應於自動駕駛中環境感知、決策與規劃、控制與執行三大部分,通用模型也可以分為環境模型、規劃模型和控制模型等。自動駕駛會產生安全和產品化共性需求,透過設計和實現通用框架模組來滿足這些共性需求,是保障自動駕駛系統實時、安全、可擴充套件和可定製的基礎。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

(2)功能軟體通用框架: 功能軟體通用框架是承載智慧駕駛通用模型的基礎,是功能軟體的核心和驅動部分,可以分為資料流框架和基礎服務兩部分。 資料流框架向下封裝不同的智慧駕駛系統軟體和中介軟體服務,向智慧駕駛通用模型中的演算法提供與底層系統軟體解耦的演算法框架。資料流框架的主要作用是對智慧駕駛通用模型中的演算法進行抽象、部署、驅動,解決跨域、跨平臺部署和計算的問題。 基礎服務是功能軟體層共用的基本服務,包括可靠冗餘元件、資訊保安基本服務以及網聯雲控服務等。其中,可靠冗餘元件是保證自動駕駛安全可控的關鍵,也是車控作業系統取得作業系統全棧功能安全認證的重要保障;資訊保安基礎服務為車端資料定義了資料型別和安全等級,為車端功能和應用定義的資料處理功能定義;網聯雲控服務可提供作業系統的安全冗餘資訊、超視距資訊和通用模型的資訊。

(3)資料抽象: 資料抽象可以為上層各模型提供資料來源。透過對感測器、執行器、自車狀態、地圖以及來自雲端的介面等資料進行標準化處理,資料抽象的過程可以為智慧駕駛通用模型提供各種不同的資料來源進而建立異構硬體資料抽象,達到功能和應用開發與底層硬體的解耦和依賴。一般來說,資料抽象可以分為分類、聚集與概括三種類型。

工具鏈:提升平臺軟硬體研發效率的重要途徑

車載計算平臺開發的軟硬體環境以及全棧工具鏈成為提升開發效率的重要途徑之一。高階自動駕駛技術不斷迭代,車載計算平臺的研發更需要對產品進行整體持續的迭代,而不只是針對單一的模組,或者其中幾個功能。全棧式工具鏈主要包括開發工具、整合工具、模擬工具、除錯工具、測試工具等。

應用軟體:OEM 品牌智慧化產品力的直接體現

應用軟體作為系統軟體與功能軟體之上獨立開發的軟體程式,更是OEM 品牌智慧化產品力的直接體現。應用軟體主要包括面向自動駕駛演算法、地圖導航類、車載語音、OTA 與雲服務、資訊娛樂等。

(1)自動駕駛演算法 。自動駕駛演算法是決定車輛智慧化水平的關鍵所在。自動駕駛演算法覆蓋感知、決策、執行三個層次。感知類演算法,SLAM(Simultaneous localization and mapping,同步定位與建圖)演算法是一個重要分支,SLAM 演算法根據點雲資料感測器的不同又可分為視覺 SLAM 演算法、鐳射 SLAM 演算法以及多感測器融合演算法;決策類演算法包括自動駕駛規劃演算法、自動駕駛決策演算法;執行類演算法主要為自動駕駛控制演算法。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

(2)高精度地圖。高精度地圖,即 HD Map(High Definition Map)或HAD Map(Highly AutomatedDriving Map),是指絕對精度和相對精度均在 1 米以內的高精度、高新鮮度、高豐富度的電子地圖。其資訊包括道路型別、曲率、車道線位置等道路資訊,路邊基礎設施、障礙物、交通標誌等環境物件資訊,以及交通流量、紅綠燈狀態資訊等實時動態資訊。

百度、四維圖新、高德佔據主要份額,國內市場呈現“三足鼎立”。由於地圖導航類業務的資質限制,國內高精度地圖主要玩家大多是本土公司,根據IDC統計,2020 年國內高精度地圖行業市場份額前五名公司為百度、四維圖新、高德、易圖通以及 Here,其中 CR3 超過 65%,呈現“三足鼎立”的局面。預計 2025 年國內市場規模達 32 億美元。按照 3 億輛汽車保有量及單車百元年服務費測算,國內市場規模將從 2020 年的 6。4 億美元增長到2025 年的32億美元,預計 2025 年全球市場份額將達到 35。6%,CAGR 達到38。0%,高於同期全球增速。

(3)車載語音 。車載語音是車內最簡潔、最人性化、最安全的互動方式,也是未來最主要的車內互動方式。隨著 AI 和硬體效能的增強,語音互動是未來汽車的絕對主流。語音互動主要是依靠 NLP 演算法對語音進行解析,使得自動駕駛系統更容易理解駕駛員的指令。2020 年智慧座艙中自然語音識別搭載率大約為67%,預計2024 年可達84%。目前,國內乘用車車載語音裝配率超過 64。8%,大大提高了行車安全性以及便捷性。 科大訊飛與 Cerence 領先中國車載語音市場,網際網路企業及車廠紛紛入局。競爭格局方面,根據高工汽車統計資料顯示,Cerence 市佔率為39。5%,排名第一,Cerence 作為全球車載語音的龍頭,客戶主要以合資車型為主;科大訊飛是中國車載語音市場的領頭羊,市佔率超過 38%,排名第二;網際網路企業方面,BAT也已分別入局車載語音,其中百度發展更為迅速,市場份額7。2%。騰訊目前主打車載應用“騰訊隨行”和“騰訊愛趣聽”等生態服務上車,排名第五;此外,大眾問問憑藉其主機廠的背景優勢入局,憑藉大眾、奧迪等多款前裝車型市場佔有率快速提升。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

海外對標研究(特斯拉、英偉達、高通、Mobileye)

特斯拉(TESLA):從硬到軟的全棧自研,打造“算力+演算法+資料”的競爭壁壘

特斯拉於 2014 年推出自動駕駛輔助系統 Autopilot 1。0,特斯拉掌握核心資料、AI 演算法以及主控晶片,從硬到軟的全棧自研,這也成為了特斯拉最核心的競爭壁。特斯拉成立於 2003 年,並於 2010 年在納斯達克上市。2008 年至2020 年特斯拉共釋出 Model S、Model X、Model 3、Model Y 四款量產車型。特斯拉於2013年開始自動駕駛輔助系統的研發,並於 2014 年特斯拉推出自動駕駛輔助系統Autopilot 1。0,此後經歷四次升級,並在 2019 年在HW 3。0 平臺上推出了自研的FSD(Full Self-Driving Computer)主控晶片。

特斯拉從 Mobileye 到英偉達,最終走向 FSD 自研晶片。特斯拉從2014年推出HW 1。0 開始,特斯拉 Autopilot 系統共經歷了 4 次大的硬體版本更新。在2014年-2016 年的 HW 1。0 時代,特斯拉完全基於 1 顆 Mobileye EyeQ3 和1 顆NVIDIATegra 3,演算法也完全由第三方供應商 Mobileye 提供,2016 年特斯拉逐漸不滿於Mobileye 程序緩慢以及相關安全事故,並在 2016 年的HW 2。0 版本上,特斯拉切換到了由 1 顆 NVIDIA Parker SoC 和 1 顆 NVIDIA Pascal GPU 組成的NVIDIADRIVEPX 2 計算平臺,而在 2017 年的 HW 2。5 版本升級過程中,將NVIDIA DrivePX2升級為 NVIDIA Drive PX 2+,新增了一個 NVIDIA Parker SoC,獲得了80%左右的運算效能提升。 特斯拉即將釋出 HW 4。0 平臺,基於三星 7nm 工藝的FSD 自研晶片,其效能將是HW 3。0 的三倍。由於英偉達的高能耗,2017 年起,馬斯克決定開始自研主控晶片,尤其是主控晶片中的神經網路演算法和 AI 處理單元全部由特斯拉自主完成。在2019年 4 月份,特斯拉在 Autopilot HW 3。0 平臺上成功推出自研的FSD 主控晶片,實現了自動駕駛晶片+神經網路演算法的垂直整合。特斯拉計劃將在不久的未來HW4。0版本,基於三星 7nm 工藝的全新 FSD 自研晶片,其效能將是HW 3。0 的三倍。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

特斯拉 FSD 晶片是以 NPU(ASIC)為計算核心,採用“CPU+GPU+ASIC”的技術路線,FSD 主要有三個模組 CPU、GPU 和 NPU。特斯拉於2019 年推出自研的FSD晶片,並在其 Model S、Model X、Model 3 上批次交付 FSD 晶片。該晶片採用三星14nmFinFET 工藝製造,面積為 260 平方毫米,封裝了大約60 億個電晶體。(1)CPU:Cortex-A72 架構,共三組、每組 4 個核,一共有 12 核、最高執行頻率2。2GHz,CPU 主要處理通用的計算和任務;(2)GPU:最高工作頻率為1 GHz 的GPU,最高計算能力為 600 GFLPS;(3)NPU:2 個 Neural Processing Unit(NPU),每個NPU 可以執行 8 位整數計算,執行頻率為 2GHz,單個NPU 算力36。86 TOPS,2個NPU 的總算力為 73。73 TOPS。從面積來看,NPU 面積佔比最大,NPU 主要用於執行深度神經網路,GPU 主要用於執行深度神經網路的post processing,處理深度神經網路的部分合計佔據了晶片 70%的面積。

特斯拉 HW 3。0 採用完整的雙系統冗餘。特斯拉 HW 3。0 的主機板上共搭載了兩塊的自研晶片,雙晶片的目的是作為安全冗餘,互相對照,每塊晶片可以獨立運算。每塊晶片周圍有四塊鎂光 DRAM 記憶體,每塊晶片分別配有一塊東芝快閃記憶體晶片,用於承載作業系統和深度學習模型,主機板的右側是影片輸出介面,左側是電源介面和其他另外的輸入/輸出介面。此外,特斯拉還設計了冗餘的電源、重疊的攝像機視野部分、各種向後相容的聯結器和介面。特斯拉 HW 3。0 採用完整的雙系統冗餘,在任何一個功能區域發生損壞時,整個系統依舊可以正常工作,確保車輛能安全行駛。HW 3。0 的效能比上一代 HW 2。5 提高了 21 倍,而功耗降低25%,能效比2TOPS/W。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

特斯拉 FSD 在全球的整體開通率約為 11%,其中北美地區比例最高。根據Troyteslike 資料顯示,受到低價的 Model 3 及 Model Y 高速放量,以及FSD不斷漲價的影響,特斯拉 FSD 在全球的整體開通率持續下滑,截至2021Q2結束,特斯拉 FSD 的整體開通率約為 11%。預計特斯拉 FSD 在全球的累計開通數量近36萬套(北美超過 26 萬套,歐洲接近 9 萬套,亞太地區僅5700 套),平均選裝價格為 6 千美元,其總銷售額超過 210 億美元。特斯拉FSD 在亞洲地區銷量持續攀升,但是 FSD 開通率整體偏低。以北美地區為例,Model S/X 的FSD 選裝率在61%,ModelY 的選裝率在 20%,Model 3 的選裝率在 20%。

特斯拉依託龐大客戶群來收集自動駕駛資料,從而實現對深度學習系統的模型訓練。與一般的汽車廠商和科技公司不同,特斯拉的自動駕駛不是依靠內部測試獲取自動駕駛的資料,而是透過其龐大的客戶群和裝載感測器的特斯拉車輛上收集資料,並進行功能升級。即使沒有啟用,AP 系統仍可以收集有關其環境和潛在自動駕駛行為的資料,以饋送特斯拉的神經網路。該資料收集方法通常被稱為影子模式(Shadow mode),即 AP 系統在車輛的後臺執行而無法在駕駛中進行任何輸入。

釋出 7nm 工藝 AI 訓練晶片 D1,打造 Dojo 超算訓練平臺。在2021 年8 月的特斯拉 AI Day 上,特斯拉釋出了最新的 AI 訓練晶片 D1,D1 晶片採用臺積電7nm工藝製造,核心面積達 645 平方毫米,集成了多達 500 億個電晶體,共有四個64位超標量 CPU 核心,擁有多達 354 個訓練節點,特別用於8×8 乘法,支援FP32、BFP64、CFP8、INT16、INT8 等各種資料指令格式,都是 AI 訓練相關。D1 晶片的FP32單精度浮點計算效能達 22。6 TFlops,BF16/CFP8 計算效能則可達362 TFlops。為了支撐 AI 訓練的擴充套件性,D1 晶片的互連頻寬最高可達10TB/s,由多達576個通道組成,每個通道的頻寬都有 112Gbps,而熱設計功耗僅為400W。Dojo 是一種透過網路連線的分散式計算機架構,它具有高頻寬、低延時等特點,將會使人工智慧擁有更高速的學習能力,從而使 Autopilot 更加強大。Dojo超級平臺的核心是 D1 晶片,25 個 D1 晶片組建成一個“訓練瓦”(Trainingtile),組成 36 TB/s 的頻寬和 9 Peta FLOPS(9 千萬億次)算力。未來,Dojo 還可以組合成為全球最強算力的超級計算機叢集。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

英偉達(NVIDIA):打造全棧式工具鏈,持續領先高階自動駕駛

英偉達自 2015 年推出 NVIDIA Drive 系列平臺,賦能自動駕駛生態。英偉達自2015年開始推出面向座艙的 DRIVE CX 和麵向駕駛的 DRIVE PX,此後先後推出DRIVEPX2、Drive PX Xavier、DRIVE PX Pegasus、DRIVE AGX Orin 等多個自動駕駛平臺,而在 SoC 晶片方面,從 Parker、Xavier、Orin 到最新發布的Atlan。(1)DRIVE PX: 英偉達在 CES 2015 上推出了基於英偉達 Maxwell GPU 架構的第一代平臺:搭載1顆 Tegra X1 的 DRIVE CX,主要面向數字座艙,以及搭載2 顆Tegra X1 的DRIVEPX,主要面向自動駕駛; (2)DRIVE PX2: 英偉達在 CES 2016 推出了基於英偉達 Pascal GPU 架構的第二代平臺DRIVEPX2,主要由 Tegra X2(Parker)和 Pascal GPU 組成,PX2 有多個版本,主要可以分為單晶片版的 Auto Cruise、雙晶片版的 Auto Chauffeur 以及四晶片版的FullyAutonomous Driving。特斯拉自 2016 年 HW 2。0 開始搭載英偉達的定製版DRIVEPX2Auto Cruise 版本,並在 2017 年的 HW 2。5 上升級為2 顆Tegra X2(Parker);

(3)Drive PX Xavier: 英偉達在 CES 2017 上推出了 Xavier AI Car Supercomputer,並在CES2018上重新發布命名為 Drive PX Xavier,搭載一顆 30 TOPS 算力的Tegra Xavier晶片。Xavier 平臺是 PX2 的小型化高能效版,算力稍有提升的前提下,面積縮小為PX2的一半,功率僅為 PX2 的 1/8 左右。該平臺目前搭載在小鵬P5 與P7 車型上。(4)DRIVE PX Pegasus: 英偉達在 2017 年 10 月推出了 DRIVE PX Pegasus,Pegasus 定位更注重效能的提升。Pegasus 共有四顆晶片,2 顆 Tegra Xavier 晶片,2 顆單獨的Turing架構的GPU,每顆 Xavier 集成了一顆 8 核 CPU 和一個英偉達Volta 架構的GPU,透過增加 CPU 和 GPU,Pegasus 平臺可以實現 320 TOPS 的算力,功耗500 W。(5)DRIVE AGX Orin: 英偉達在中國 GTC 2019 大會上推出了 DRIVE AGX Orin 平臺,該平臺由2顆OrinSoC 晶片和 2 顆 Ampere 架構的 GPU,最高算力達到2000 TOPS,功耗800W。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

單顆 Orin SoC 可實現 254 TOPS 算力,功耗低於 55W,可支援單片或多片協同方案,實現算力擴充套件。Orin SoC 晶片集成了 Arm Hercules CPU 核心、新一代架構Ampere 的 GPU 、全新深度學習加速器(DLA)和計算機視覺加速器(PVA),可實現每秒 254 TOPS 運算效能,相比上一代 Xavier 系統級晶片運算效能提升了7倍。在運算效能提升巨大的情況下,Orin 的功耗低於55 W。Orin 可以覆蓋10TOPS到 254 TOPS 的算力需求、可以為終端使用者提供可升級的方案支援單片或多片Orin協同的解決方案,無限擴充套件算力。 Orin 所整合的 GPU 擁有 2048 個 CUDA Core 和 64 個Tensor Core。Orin 內部集成了 Ampere 架構 GPU,該 GPU 擁有 2 個 GPC(Graphics Processing Clusters,圖形處理簇),每個 GPC 包含 4 個 TPC(Texture Processing Clusters,紋理處理簇),每個 TPC 包含 2 個 SM(Streaming Multiprocesor,流處理器),每個SM下包含包含 128 個 CUDA Core,合計 2048 個 CUDA Core,算力為4096 GFLOPS。此外,還包括 64 個 Tensor Core(張量核),Tensor Core 是專為執行張量或矩陣運算而設計的專用執行單元,稀疏 INT8 模型下算力達131 TOPS,或者密集INT8下 54 TOPS。

蔚來 ET7 成為 Orin 系列的首發量產車,NIO Adam 超算平臺搭載四顆Orin晶片,單車算力打造 1016 TOPS。蔚來 NIO Adam 超算平臺,配備四顆Orin 晶片,Adam擁有 48 個 CPU 核心,256 個矩陣運算單元,8096 個浮點運算單元,共計680億個電晶體,總算力高達 1016 TOPS。Adam 平臺集成了安全自主執行所需的冗餘和多樣性,在 4 顆 Orin SoC 中,前兩顆 Orin SoC 負責處理車輛感測器每秒產生的高達 8G 的資料量,第三顆 Orin SoC 作為後備,以確保系統能夠在任何情況下安全執行,第四顆 Orin SoC 可進行本地的模型訓練,進一步提升車輛自身的學習能力,並基於使用者偏好提供個性化駕駛體驗。蔚來 ET7 將作為NVIDIA DRIVE Orin系列的首發量產車於 2022 年 3 月開始交付,同樣搭載NIO Adam 超算平臺的蔚來ET5將於 2022 年 9 月開始交付。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

當前,英偉達在自動駕駛領域遙遙領先,持續獲得大量自動駕駛客戶,英偉達的客戶大致可以分為三類:造車新勢力、傳統車企、自動駕駛公司。(1)造車新勢力:蔚來(ET5、ET7)、小鵬(P5、P7、G9)、理想(X01)、威馬(M7)、上汽智己、R 汽車、FF 等;(2)傳統車企:賓士、沃爾沃、現代、奧迪、Lotus等;(3)自動駕駛 Robotruck/Robotaxi 公司:通用 Cruise、亞馬遜Zoox、中國的滴滴,沃爾沃商用車、Kodiak、圖森未來、智加科技、AutoX、小馬智行、文遠知行等。

英偉達提供包括從晶片、硬體平臺、系統軟體、功能軟體、應用軟體以及模擬測試平臺和訓練平臺在內的全棧工具鏈。以英偉達 DRIVE AGX 硬體開發平臺為起點,在 DRIVE Constellation 上驗證軟體演算法。充分驗證後將部署軟體,透過DRIVEHyperion 參考架構進行上路測試。利用 DGX 高效能訓練伺服器進行深度學習模型訓練,此過程反覆迭代。英偉達提供了從晶片(Xavier/Orin/Atlan)、DRIVEAGX硬體平臺、DRIVE OS、Driveworks、DRIVE AV 自動駕駛軟體棧、DRIVE Hyperion資料採集和開發驗證套件 、DRIVE Constellation 虛擬模擬平臺和DGX 高效能訓練平臺等全棧工具鏈。

(1)應用軟體:DRIVE AV 與 Drive IX 軟體棧。 DRIVE AV 軟體棧主要面向自動駕駛域,包括了從規劃、地圖到感知的應用軟體開發,幫助開發者實現端到端的感知、路徑規劃、地圖構建、決策和控制等功能的開發;Drive IX 主要面向智慧座艙域,集成了視覺、語音和圖形使用者體驗,包括視覺化(盲區視覺化、自動駕駛視覺化以及駕駛員監控視覺化等)、AI 輔助駕駛(DMS、神經網路、攝像頭標定等)以及 AI 助手(語音識別、手勢識別、面容識別等)。

(2)功能軟體(中介軟體):Driveworks 。DriveWorks 是所有自動駕駛汽車軟體開發的基礎,包含了高階自動駕駛開發所需要的處理模組、工具和框架。DriveWorks 是模組化、開放、易於定製的,方便開發人員在自己的軟體堆疊中實現深度定製開發。包括DNN 演算法加速庫、Calibration 標定工具、Drive Core 核心庫(感測器抽象層、車輛I/O、影象處理、點雲處理、DNN 框架等。

(3)系統軟體:DRIVE OS 。DRIVE OS 提供了一套參考作業系統和相關軟體棧,專為在基於AGX 硬體平臺上的開發與部署,相關的基礎軟體棧包括 RTOS、Hypervisor、英偉達CUDA 和TensorRT等其他元件,這些元件經過最佳化後可直接訪問 AGX 硬體平臺。DRIVE OS SDK利用所有軟體、庫和工具、技術和 API,為自動駕駛汽車的構建、除錯、配置和部署應用程式,提供了最佳化的工作流。

(4)硬體平臺:DRIVE AGX 平臺 。英偉達 DRIVE AGX 開發工具包提供了開發展所需要的硬體、軟體及示例應用程式。英偉達的歷代硬體計算平臺 DRIVE PX2、Drive PX Xavier、DRIVE PX Pegasus、DRIVE AGX Orin 等,前文已經詳細介紹。DRIVE AGX 平臺提供開放的軟體框架,以及與硬體計算平臺相配套的完善的開發工具包;此外,英偉達應有眾多Tier1及感測器產業合作伙伴,提供攝像頭、毫米波雷達、超聲波雷達、鐳射雷達等車載感測器。

(5)模擬平臺:DRIVE Constellation 與 DRIVE Sim 。DRIVE Constellation 自動駕駛車輛模擬平臺主要完成對各種虛擬場景的渲染、模擬,產生模擬感測器資料,透過執行 DRIVE Sim 模擬軟體,模擬模擬汽車在模擬環境中行駛可產生的感測器資料。Constellation 模擬平臺提供可擴充套件、全面且多樣化的測試環境。藉助開放的模組化架構,DRIVE Sim 模擬軟體可讓客戶利用自己的模擬模型或生態合作伙伴的自定義車輛、環境、感測器或交通場景。

(6)訓練平臺:NVIDIA DGX 。基於高效能的英偉達 DGX AI 伺服器,客戶可以進行深度網路學習的訓練、推理和資料分析,同時多臺 DGX 構建超級計算機或者人工智慧叢集,為具有挑戰性的自動駕駛海量資料進行深度學習網路模型訓練和建圖提供出色的基礎設施和靈活可擴充套件的 AI 計算效能。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

英偉達釋出全新自動駕駛軟硬體開發參考平臺 DRIVE Hyperion 8。在2021年英偉達 GTC 大會上,英偉達釋出了自動駕駛軟硬體開發參考平臺DRIVE Hyperion8,允許主機廠客戶訪問和調整其需求,包括核心計算和中介軟體以及車輛內部AI功能等。該計算平臺可用於 2024 年車型,硬體方面,搭載了兩顆Orin 晶片,每顆算力 254TOPS,支援 12 顆攝像頭、9 個毫米波、12 個超聲波雷達和1 顆鐳射雷達。提供感測器硬體的供應商包括 Luminar(鐳射雷達)、Hella(短程毫米波雷達)、Continental (遠端毫米波雷達)、Sony(攝像頭元件)、Valeo (攝像頭元件、超聲波雷達)。(報告來源:未來智庫)

高通(Qualcomm):智慧座艙一騎絕塵,自動駕駛不斷追趕

高通是作為消費電子霸主,持續佈局智慧網聯汽車業務。高通(Qualcomm)公司成立於 1985,高通自 2002 年開始佈局汽車業務,早期專注於車載網聯解決方案,高通於 2014 年推出了第一代座艙平臺驍龍 602A,在2016 年推出第二代座艙平820A,在 2019 年推出第三代座艙平臺 8155,並於2021 年釋出第四代座艙平臺8295;在自動駕駛領域,高通於 2019 年釋出了 Ride 自動駕駛平臺。高通目前已擁有 25 家以上的頭部車企客戶,公司業務已經覆蓋全球超過2 億輛的智慧網聯汽車,高通在智慧汽車領域的版圖不斷擴張。

高通基於車雲、座艙、駕駛及車聯四大平臺打造數字底盤。高通在汽車業務領域志在打造“數字底盤”,主要由四部分組成:驍龍車雲平臺(SnapdragonCar-to-Cloud)、驍龍座艙平臺(Snapdragon Cockpit Platform、驍龍駕駛平臺(Snapdragon Ride Platform)、驍龍車聯平臺(Snapdragon Auto connectivityPlatform),打造開放、可定製、可升級、智慧互聯的電子底盤,幫助Tier1和 OEM 主機廠提升客戶體驗。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

高通在智慧座艙晶片領域一騎絕塵。從高通 2014 年推出第一代座艙晶片602A開始,再到第二代 820A 以及第三代 8155 晶片,市場滲透率持續提升,能夠發現,近期最初的新車型其座艙幾乎都是搭載了高通 8155 晶片。目前,包括賓士、奧迪、保時捷、捷豹路虎、本田、吉利、長城、廣汽、比亞迪、領克、小鵬、理想智造、威馬汽車在內的國內外領先汽車製造商均已推出或宣佈推出搭載驍龍汽車數字座艙平臺的車型。

高通驍龍 SA8155P 晶片是目前量產車可以選用的效能最強的座艙SoC 晶片。高通第三代座艙晶片 SA8155P 平臺是基於臺積電第一代7nm 工藝打造的SoC,也是第一款 7nm 工藝打造的車規級數字座艙 SoC,效能上,8155 晶片是目前量產車可以選用的效能最強的座艙 SoC 晶片,目前全球最大的25 家車企已有20 家採用高通第三代座艙 8155 晶片。8155 平臺屬於多核異構的系統,效能是原820 平臺的三倍,該平臺擁有極強的異構計算的能力,包括多核AI 計算單元、SpectraISP、Kryo 435 CPU、Hexagon DSP 第六代 Adreno 640 GPU。Hexagon DSP 中增加了向量擴充套件核心(Hexagon Vector eXtensions,HVX)和張量加速器(HexagonTensorAccelerator,HTA),這些專用 AI 計算模組能大幅提高晶片的AI 算力。

高通釋出第四代智慧座艙 SA8295P 平臺,效能顯著提升。2021 年7 月,高通釋出了第四代座艙平臺的 SA8295P,採用 5nm 製程,採用第六代八核Kyro 680CPU和Adreno 660 GPU,支援同步處理儀表盤、座艙屏、AR-HUD、後座顯示屏、電子後視鏡等多屏場景需求,CPU、GPU 等主要計算單元的計算能力較8155 提升50%以上,主線能力有超過 100%的提升。

百度旗下集度汽車成為高通 8295 的首發,量產車型預計在2023 年交付。2021年11 月 29 日,集度、百度和高通三方在上海進行了簽約儀式,集度汽車成為高通8295 的首發,集度旗下首款汽車機器人預計將於 2023 年量產交付,此外高通8295晶片已經獲得長城、廣汽、通用等車廠的定點,相關車型預計在2023 年交付。中科創達在 CES 2022 釋出基於高通 SA8295 硬體平臺的全新智慧座艙解決方案。該解決方案充分發揮 SA8295 在算力、圖形、影象處理等方面的突出效能,打造了包含數字儀表、中控娛樂、副駕娛樂、雙後座娛樂、流媒體後視鏡和抬頭顯示器的一芯多屏智慧座艙域控。公司基於深厚的車載 OS 技術,創新性地打通座艙和自駕兩大技術域,更好地支援 360°環視和智慧泊車功能,基於座艙域的冗餘算力,在實現安全可靠的低速泊車的同時降低了方案成本。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

Snapdragon Ride 軟體平臺包括:規劃堆疊、定位堆疊、感知融合堆疊、系統框架、核心軟體開發工具包(SDK)、作業系統和硬體系統。高通推出的專門面向自動駕駛的軟體棧,是整合在 Snapdragon Ride 平臺中的模組化可擴充套件解決方案,旨在幫助汽車製造商和一級供應商加速開發和創新。該軟體棧透過面向複雜用例而最佳化的軟體和應用,助力汽車製造商為日常駕駛帶來更高的安全性和舒適性,例如自動導航的類人高速公路駕駛,以及提供感知、定位、感測器融合和行為規劃等模組化選項。Snapdragon Ride 平臺的軟體框架支援同時託管客戶特定的軟體棧元件和 Snapdragon Ride 自動駕駛軟體棧元件。

高通收購維寧爾旗下軟體業務 Arriver,全面補強自動駕駛域。維寧爾(Veoneer)總部位於瑞典斯德哥爾摩,前身是全球最大的安全氣囊和安全帶生產商奧托立夫(Autoliv)公司電子事業部,2018 年從奧托立夫拆分出來,維寧爾致力於自動駕駛汽車的高階輔助系統(ADAS)和協作式自動駕駛系統(AD)領域的研發,擁有雷達系統、ADAS 電子控制單元(ECU)、視覺系統、鐳射雷達系統和熱成像等產品。Veoneer 在 2020 年將 ADAS、協作和自動軟體開發集中在一個部門並命名為Arriver。

整合 Arriver 視覺感知軟體棧,推出 Snapdragon Ride Vision 視覺系統。高通在 CES 2022 上釋出了 Snapdragon Ride Vision 視覺系統,該系統擁有全新的開放、可擴充套件、模組化計算機視覺軟體棧,基於 4 納米制程的系統級SoC 晶片打造,旨在最佳化前視和環視攝像頭部署,支援先進駕駛輔助系統(ADAS)和自動駕駛(AD)。該視覺系統集成了專用高效能 Snapdragon Ride SoC 和Arriver 下一代視覺感知軟體棧,提供多項計算功能以增強對車輛周圍環境的感知,支援汽車的規劃與執行並助力實現更安全的駕乘體驗。利用 Ride 平臺軟體開發套件(SDK),汽車製造商和 Tier 1 可以靈活開發其駕駛策略軟體棧並整合元件,帶來擴充套件靈活性,使其能夠整合地圖眾包、駕駛員監測系統(DMS)、泊車系統、蜂窩車聯網(C-V2X)技術和定位模組,從而支援更優的定製化和向上整合。Snapdragon Ride視覺系統預計將於 2024 年量產上市。

Mobileye:ADAS 賽道的先行者,當前市佔率第一

Mobileye 自 1999 年便開始專注於 ADAS 賽道。Mobileye 於1999 年由以色列希伯來大學的 Amoon Shashua 教授和 Ziv Aviram 創立,靠視覺演算法起家,主要業務是開發自動駕駛相關的系統和 EyeQ 系列晶片。2007 年,Mobileye 的EyeQ1開始在寶馬、通用和沃爾沃等車企量產上車,2008 年釋出了EyeQ2,尤其在2014年推出EyeQ3 後一舉成名,同時於 2014 年在美國納斯達克上市,市值高達80 億美元。在 2017 年由英特爾以 153 億美元收購,從而私有化退市,成為英特爾旗下自動駕駛業務部門。英特爾計劃在 2022 年中讓 Mobileye 獨立在美上市。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

從 2007 年至今,Mobileye EyeQ 系列晶片累計出貨量超過1 億顆。Mobileye的EyeQ1 自 2007 年在寶馬、通用和沃爾沃量產上車以來,截至目前,公司EyeQ系列晶片已經完成 1 億顆的出貨。Mobileye EyeQ 系列晶片出貨量也在持續增加,但是增速逐漸放緩,EyeQ 系列晶片銷量從 2018-2021 年分別為1240 萬、1750萬、1930 和 2810 萬顆,同比增長率 43%/41%/10%/46%。

Mobileye 市場佔有率依舊領先,正在逐漸掉隊。在過去20 年時間裡,Mobileye以視覺感知技術為基礎,推出了演算法+EyeQ 系列晶片組成的一系列解決方案,幫助車企實現從 L0 級的碰撞預警,到 L1 級的 AEB 緊急制動、ACC 自適應巡航,再到 L2 級的 ICC 整合式巡航等各種功能,Mobileye 當前仍然以36。29%的市場份額排名第一,包括寶馬、沃爾沃、奧迪、蔚來、長城等一系列國內外車企,甚至特斯拉都曾搭載過 EyeQ 系列晶片。但是,Mobileye 正在逐漸掉隊,例如,寶馬在2016 年與 Mobileye 組建了自動駕駛聯盟,但是在前不久已經與高通Ride達成合作,蔚來、理想等一批車企則選擇了在新一代車型上搭載英偉達Orin 晶片。

EyeQ5 採用“CPU+ASIC”架構,功耗極低,但生態相對封閉。EyeQ5 主要有4個模組:CPU、Computer Vision Processors(CVP), Deep Learning Accelerator(DLA)、Multithreaded Accelerator(MA),其中CVP 是針對傳統計算機視覺演算法設計的 ASIC 模組,用專有的 ASIC 來執行這些演算法而達到極低功耗而聞名。但是其算法系統相對封閉,對 OEM 和 Tier 1 來說是黑盒,他們無法進行二次修改從而差異化自己的演算法功能。Mobileye 的演算法解決方案還是以傳統計算機視覺演算法為主,深度學習演算法為輔,這也直接決定了其以CVP 為主,DLA 為輔的架構。

計算機行業深度研究:汽車智慧化與工業數字化專題(中)

Mobileye 在近年的 CES 2022 大會上釋出了三款最新的晶片EyeQ Ultra、EyeQ6Light 和 EyeQ6 High。此外,Mobileye 與吉利汽車集團的極氪共同宣佈,將在在2024 年前推出具有 L4 能力的純電新車,新車基於吉利SEA 平臺打造,使用6顆EyeQ 5 晶片,以處理 Mobileye 的駕駛策略及地圖技術的開放協作模型。同時,新車將,雙方將在軟體技術方面進行有效整合。

EyeQ Ultra:面向 L4 級自動駕駛,基於 5nm 製程打造,算力176 TOPS,大約為 10 顆 EyeQ5 晶片的效能。EyeQ Ultra 具備12 核、24 執行緒CPU,同時還有兩個通用計算加速器和兩個 CNN 加速器。EyeQ Ultra 預計將在2023年提供樣品,2025 年實現量產上車;

EyeQ6 High:面向 L2 級自動駕駛,基於 7nm 製程打造,算力34 TOPS,EyeQ6High 具備 8 核、32 執行緒的 CPU,兩個通用計算加速器和兩個CNN 加速器。EyeQ6High 預計 2022 年開始提供樣品,2024 年實現量產;

EyeQ6 Light:面向 L1-L2 級自動駕駛,基於7nm 製程打造,算力5TOPS。EyeQ6 Light 具備 2 核、8 執行緒 CPU,1 個通用計算加速器和1 個CNN加速器。為上一代 EyeQ4 的迭代版本,但封裝尺寸為 EyeQ4 的55%。預計2023年實現量產。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關資訊,請參閱報告原文。)

精選報告來源:【未來智庫】。