遠(yuǎn)程參加了2020世界人工智能大會的特斯拉公司創(chuàng)始人兼首席執(zhí)行官馬斯克透漏了一個(gè)信息,特斯拉有望在今年內(nèi)完成L5級別自動駕駛基本功能的開發(fā)。L5級別的自動駕駛就是人們所期望的真正意義上的自動駕駛。如果能夠?qū)崿F(xiàn),將是人類交通史上最大的變革。
馬斯克的野心來自于特斯拉的技術(shù)實(shí)力,核心就是具有AI功能的自動駕駛芯片。事實(shí)上,圍繞著自動駕駛芯片,一場激烈的競賽正在展開。
搖擺的車企,堅(jiān)定的芯片公司
按照美國汽車工程師學(xué)會(SAE)對自動駕駛的劃分,共有L0-L5六個(gè)級別,最頂級的L5定義為系統(tǒng)可完成所有道路環(huán)境下的駕駛操作,不需要駕駛?cè)私槿搿?/span>
對于實(shí)現(xiàn)L5的目標(biāo),一般的行業(yè)人士沒有馬斯克那么樂觀。Gartner認(rèn)為,即使是次于L5的L4級,其技術(shù)實(shí)現(xiàn)時(shí)間也將超過十年。實(shí)際的情況下,自動駕駛技術(shù)正在從L2往前過渡的過程中。
在2019年,業(yè)界開始大張旗鼓地推行L2級自動駕駛,車道偏離輔助系統(tǒng)、城市預(yù)碰撞系統(tǒng)、彎道巡航輔助等功能開始入駐中高端車型。如果順利的話,2020年本該是L3全面鋪開的一年,但是國際車企卻紛紛放棄,只有國內(nèi)部分自主車企依舊以L3為賣點(diǎn)進(jìn)行宣傳。
這里面的原因比較復(fù)雜。最主要的一點(diǎn),L3級自動駕駛屬于有條件下的自動駕駛功能,要求駕駛員要在突發(fā)情況下對車輛進(jìn)行接管。這樣一來,反而需要駕駛員將注意力更多地放在道路環(huán)境上,甚至精神高度集中時(shí)刻應(yīng)對突發(fā)事件,與自動駕駛的意義豈不是相悖。
不過,L3級自動駕駛依舊有其存在的價(jià)值。因?yàn)椋苯訌腖2進(jìn)入到L4,技術(shù)上并非易事。按照國內(nèi)某自駕技術(shù)公司的看法,L2和L4的技術(shù)路線完全不同。L2考慮的是以有限成本實(shí)現(xiàn)部分功能,L4則是先通過無限成本實(shí)現(xiàn)完全自動駕駛,再憑借技術(shù)進(jìn)步讓硬件降價(jià)到可接受的范圍,兩者的芯片、算法和開發(fā)路線都不一樣,L2公司的經(jīng)驗(yàn)未必能對L4領(lǐng)域有所幫助。
先過渡至L3,或是直升L4,車企的態(tài)度比較猶豫,但并不妨礙芯片公司不斷追逐高性能的決心。英偉達(dá)在2019年發(fā)布了SoC Orin,晶體管數(shù)量高達(dá)170億個(gè),集成英偉達(dá)新一代GPU內(nèi)核和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺加速器,性能高達(dá)200TOPS。在今年的GTC上,黃仁勛又從自家烤箱里端出來算力達(dá)到2000TOPS的計(jì)算平臺,將2顆Orin Soc和2塊Ampere架構(gòu)的GPU集成在一起,一舉拿下了自駕平臺的算力冠軍。圍繞自動駕駛的芯片軍備競賽再度升級!
算力為王
“自動駕駛所需要的計(jì)算力,是過去任何一臺計(jì)算機(jī)都沒有達(dá)到過的。”黃仁勛在多個(gè)場合都表示過。
先對多個(gè)傳感器采集信息的融合,再經(jīng)過運(yùn)算處理,識別出障礙物、可行道路等,最后依據(jù)識別的結(jié)果,規(guī)劃路徑、制定速度,自動驅(qū)使汽車行駛。這是一個(gè)瞬時(shí)的過程,延時(shí)必須要控制在毫秒甚至微秒級別,才能保證自動駕駛的行駛安全。要達(dá)成瞬時(shí)處理、反饋、決策規(guī)劃、執(zhí)行的效果,對中央處理器的算力要求非常高。
Orin誕生之前,算力的冠軍是特斯拉的Autopilot HW3.0。該平臺由兩個(gè)相同的計(jì)算單元構(gòu)成,每個(gè)計(jì)算單元上面有特斯拉自研的2 塊FSD(full self-driving computer)計(jì)算芯片,每塊算力位 36 TOPS,設(shè)備總算力位 4 x 36 TOPS = 144 TOPS。
按照業(yè)界的推算,實(shí)現(xiàn)L2自動駕駛需要的計(jì)算力小于10TOPS,L3需要的計(jì)算力為30- 60TOPS,L4需要的計(jì)算力大于100TOPS,L5需要的計(jì)算力至少為1000TOPS。HW3.0已經(jīng)完全具備了L4級的運(yùn)算能力。
特斯拉決定自研FSD芯片,是因?yàn)镠W2.0采用的正是英偉達(dá)Orin的前代Xavier芯片。該芯片為GPU架構(gòu),功耗較大,讓特斯拉也走上了自研芯片之路。
整個(gè)FSD芯片中包含了三個(gè)主模塊,分別是CPU、GPU和NNA(Neural Network Accelerator神經(jīng)網(wǎng)絡(luò)加速單元)。其中CPU采用的是Cortex-A72架構(gòu),一共有12個(gè)核心,最高運(yùn)行頻率為2.2GHz,這部分用于通用的計(jì)算和任務(wù)。NNA是該芯片的核心,采用了特斯拉自研的架構(gòu),有2個(gè)NNA核心,每個(gè)核心都可以執(zhí)行8位整數(shù)計(jì)算,運(yùn)行頻率為2GHz,單個(gè)NNA的峰值計(jì)算能力為36.86TOPS,2個(gè)NNA的總能力為73.73TOPS。
一向在AI領(lǐng)域心高氣傲的英偉達(dá),怎甘心居人之后。在一年多的潛心研發(fā)之后,終于推出了反超先鋒Orin。該芯片內(nèi)置了12個(gè)ARM CPU和1個(gè)Ampere架構(gòu)小型GPU,設(shè)計(jì)功耗僅為45W,僅比Xavier多了15W,甚至低于特斯拉Autopilot HW 2.5的60W,對散熱條件的要求極低,低功耗也使得Orin穩(wěn)定性更高,在發(fā)布的時(shí)候就已經(jīng)通過了ASIL-D安全認(rèn)證。
Orin的算力達(dá)到了驚人的200TOPS,超越了HW3.0的144TOPS,但功耗只有其1/4不到。比起前代Xavier,Orin的性能更是達(dá)到了6.7倍(Xavier為30TOPS)。
提升算力,已經(jīng)成為自動駕駛芯片的常規(guī)升級途徑。
來自國內(nèi)的挑戰(zhàn)者
在這場競賽中,國內(nèi)芯片并沒用充當(dāng)看客,而是向國際巨頭下了戰(zhàn)書。
據(jù)測算,2020年國內(nèi)自動駕駛市場規(guī)模844億元,同比增長19.3%,2025年達(dá)到2250億元,復(fù)合增速21.3%。如此大好的市場,怎能輕易拱手送人。
黑芝麻科技在2020年6月正式推出了“華山二號”A1000自動駕駛芯片,這也是繼去年推出“華山一號”以后的一次全新產(chǎn)品升級。華山二號單芯片AI算力最高可達(dá)70TOPS(A1000)。由兩顆華山二號組成的域控制器,最高可實(shí)現(xiàn)140TOPS的AI算力,功耗25W。
與特斯拉和英偉達(dá)的產(chǎn)品做個(gè)比較,可以看出A1000毫不落下風(fēng)。當(dāng)前英偉達(dá)主流的Xavier芯片,單顆算力30TOPS,能效比1-2TOPS/W,而“華山二號” 單顆算力達(dá)到40TOPS,能效比可達(dá)6TOPS/W;對比特斯拉的HW3.0的72W功耗,A1000組成的域控制器功耗只有其一半不到。
黑芝麻自研的兩大IP:DynamAI DL引擎和NeuralIQ ISP流水線,也讓芯片更具競爭力,有助于實(shí)現(xiàn)其看得懂(AI)、看得清(Imaging)、看得遠(yuǎn)(Interconnected)的AI3戰(zhàn)略。
在華山二號之后,黑芝麻還計(jì)劃在 2021 年的某個(gè)時(shí)點(diǎn)推出華山三號,主要面向的是 L4/L5 級自動駕駛平臺,其算力將超越 200 TOPS,同時(shí)會采用更先進(jìn)的 7nm 制程工藝。200 TOPS 的算力水平將追平英偉達(dá)的 Orin 芯片。
同時(shí),另一家國內(nèi)AI芯片公司地平線也傳來好消息,其車規(guī)級AI芯片征程二代正式量產(chǎn)上車。隨著長安汽車UNI-T的正式上市,該款車型搭載的由長安汽車和地平線共同開發(fā)的“智能駕駛艙NPU計(jì)算平臺也開始投入使用,該平臺就內(nèi)置征程二代芯片。
征程二代是2019年8月推出的,該芯片采用了地平線自研的高性能計(jì)算架構(gòu)BPU2.0(伯努利架構(gòu)),可提供超過4TOPS(萬億次每秒)的等效算力,典型功耗只有2W。征程二代的上車量產(chǎn)也將開啟國產(chǎn)車規(guī)級 AI 芯片的前裝量產(chǎn)元年。
不滿足于此,地平線還將在今年推出高等級自動駕駛芯片征程5,該芯片具備96 TOPS的AI算力,支持16路高清攝像頭,實(shí)際性能將超過特斯拉FSD芯片。
黑芝麻和地平線是國內(nèi)自動駕駛芯片行業(yè)的兩個(gè)代表,還有不少國內(nèi)企業(yè)也正在研發(fā)芯片的路上,當(dāng)然其中也包括了華為。所以,一個(gè)國內(nèi)自動駕駛芯片大爆發(fā)的時(shí)代即將開啟。
算法與開放
實(shí)現(xiàn)自動駕駛,芯片和算法二者缺一不可。芯片的算力是基礎(chǔ),算法就是靈魂。
很多車企已在量產(chǎn)車上搭載了滿足特定自動駕駛能力需求的傳感器和計(jì)算平臺,但算法卻還要等到一年半載后才能通過OTA“上車”,由此可見,算法面臨的挑戰(zhàn)比算力還大。
阿里達(dá)摩院自動駕駛實(shí)驗(yàn)室負(fù)責(zé)人王剛就曾表示:“算力面臨的考驗(yàn)是‘好不好’,而算法面臨的考驗(yàn)則是‘能不能’。”
算法對于雄心勃勃的車企都是一個(gè)大考。實(shí)現(xiàn)自動駕駛,面對的將是真實(shí)世界的復(fù)雜情況。即使調(diào)教過的算法已經(jīng)能適應(yīng)一個(gè)地區(qū)的路況,換了一個(gè)地區(qū)往往會就會失靈。在這方面,Mobileye和特斯拉都有著深刻的教訓(xùn)——這兩家公司的自動駕駛算法都是基于歐美國家的道路狀況訓(xùn)練而成的,但在中國道路上經(jīng)常失靈。因此,特斯拉宣布將在中國組建Autopilot團(tuán)隊(duì)。該團(tuán)隊(duì)最重要的任務(wù),便是針對中國的道路環(huán)境對算法進(jìn)行優(yōu)化。
普通的企業(yè)沒有算法開發(fā)能力,就必須依靠芯片企業(yè)的幫助。但是,這其中也存在這弊病。Intel旗下的Mobileye是ADAS市場的領(lǐng)頭羊,其就采取了芯片和算法捆綁在一起的軟硬一體化方案。用戶要委托Mobileye寫一些針對特殊駕駛場景定制的算法,后者要收一筆巨額的開發(fā)費(fèi)用。如果車企開始具備了開發(fā)能力和意愿,依然沒法獲得開發(fā)自主權(quán)。所以,業(yè)內(nèi)對 Mobileye 的評價(jià)就是過于封閉。回首當(dāng)年,正是因?yàn)镸obileye的封閉,馬斯克才決定與其分道揚(yáng)鑣。
相對來說,以GPU起家的英偉達(dá)則要開放的多。在2019年,英偉達(dá)向自動駕駛汽車開發(fā)者開源其預(yù)訓(xùn)練AI模型和訓(xùn)練代碼。通過這一套NVIDIA AI工具,英偉達(dá)生態(tài)系統(tǒng)內(nèi)的開發(fā)者們可以自由擴(kuò)展和自定義模型,從而提高其自動駕駛系統(tǒng)的穩(wěn)健性與能力。通過這種方法,英偉達(dá)收獲了一眾國內(nèi)客戶,包括滴滴、Pony.ai、文遠(yuǎn)知行、AutoX 在內(nèi)的 Robotaxi 運(yùn)營商都采用了英偉達(dá)的自動駕駛計(jì)算平臺。
后起的國內(nèi)芯片公司也看到了這一趨勢,紛紛采取了開放的態(tài)度。比如,地平線在提供軟硬一體化選項(xiàng)的同時(shí),還會幫助客戶掌握算能力。為此,地平線選擇在至少兩個(gè)層面向客戶開放:
一是將感知環(huán)節(jié)的原始數(shù)據(jù)開放出來,充分賦能Tier 1和車企做具體的功能;二是把更底層的工具鏈開放出來,并在這個(gè)工具鏈上面提供豐富的軟件模型、算法模型的樣板庫,客戶可以根據(jù)自己的場景數(shù)據(jù)進(jìn)行迭代,甚至可在此基礎(chǔ)上開發(fā)自己特有的算法模型。
地平線創(chuàng)始人余凱就表示:“我們不是交付算法,而是做主機(jī)廠的顧問,幫助他們開發(fā)自己的算法。其實(shí),技術(shù)上的know-how有時(shí)候就是捅一層窗戶紙的事情,車企也有大量很聰明的人,一點(diǎn)就通了。”
地平線跟長安合作成立了長安-地平線人工智能聯(lián)合實(shí)驗(yàn)室,UNI-T的智能座艙項(xiàng)目便是這個(gè)實(shí)驗(yàn)室的首個(gè)重大成果。在這個(gè)聯(lián)合實(shí)驗(yàn)室里,地平線為長安提供技術(shù)指導(dǎo),協(xié)助長安的算法工程師自己開發(fā)算法。
結(jié)語
自動駕駛的臨界點(diǎn)到了嗎?目前看來,還不能這么樂觀。商業(yè)化、資本、供應(yīng)鏈、政策等問題,仍然沒有明確的答案。對于國內(nèi)的自動駕駛芯片來說,任務(wù)更重。
黑芝麻聯(lián)合創(chuàng)始人劉衛(wèi)紅就指出,急需國產(chǎn)高算力的芯片打破國外龍頭企業(yè)的壟斷,國產(chǎn)AI芯片能夠降低自動駕駛系統(tǒng)的成本。而功能定制化需要開放合作的芯片平臺,定制化的功能開發(fā),需要深入對接和強(qiáng)有力的客戶支持。
芯片的完成,只是破局第一步,更漫長的探索還在后面。