一個自動駕駛工程師眼中的自動駕駛

taotao_2016 2019-02-11

展開全文

編者按：本文是百度Apollo一名自動駕駛工程師對自動駕駛的一篇見解文章。文章先講解了自動駕駛的發(fā)展意義；然后從我在那兒？周圍有什么？接下來會發(fā)生什么？我該怎么做？等方面展開講解自動駕駛技術(shù)；最后以極客邦和百度Apollo聯(lián)合發(fā)布的自動駕駛工程師技能圖為例，說明了如何幫助非專業(yè)自動駕駛領(lǐng)域的工程師轉(zhuǎn)行和進入該領(lǐng)域。

未來的出行生活

2018年12月5日，Google旗下的Waymo推出自動駕駛首個用于服務乘客的商業(yè)叫車服務——Waymo One，該服務在美國鳳凰城及其錢德勒、坦佩、梅薩和吉爾伯特4個郊區(qū)24小時運行。乘客只需通過APP呼叫無人車，選定上下車地點，然后通過自動駕駛系統(tǒng)就可以方便地前往任何地方。車上沒有駕駛員，只有一塊HMI（人機交互界面）來告知乘客目前車輛的狀態(tài)、周圍情況以及后續(xù)路線。

從Google的自動駕駛項目開始再到如今的Waymo，其自動駕駛技術(shù)在10年間取得了不小進步。Waymo測試車累計公路行駛距離已達1000萬英里，遍及美國25個城市，還有著100億英里的模擬行駛數(shù)據(jù)。而這些駕駛數(shù)據(jù)配合人工智能技術(shù)將無人駕駛帶到了我們身邊。

同樣，在北京的海淀公園18年也被改造成了全球首個AI公園，11月1號正式對外開放。在這整個智能化公園中，最引人矚目的就是阿波龍自動駕駛小巴。這款迷你小巴每輛可搭載6-7人，沒有駕駛座也沒有方向盤，等乘客落座系好安全帶，阿波龍就會自動關(guān)上車門妥妥地起步。在行駛過程中，拐彎和掉頭之前會主動降速，遇到前方有行人或障礙物，也會主動減速避讓或者停車。

這些都是人類見證歷史的偉大時刻，也是邁向未來生活的開始，標志著一個新的時代正在悄然來臨。

普通汽車終將退出歷史舞臺，可能就在不久的將來，汽車即將成為我們可以放心托付自己生命的第一代自主式機器人。在歷經(jīng)了數(shù)十年不斷失敗的嘗試后，借助速度更快的電腦、更可靠的傳感器技術(shù)以及基于深度學習的新一代人工智能軟件，汽車可以獲得與人類相似的能力，在無法預測的環(huán)境中自主安全地駕駛。

為什么我們需要關(guān)注自動駕駛？不僅僅是因為這項具有偉大影響力的技術(shù)能夠替代司機提升交通出行的效率和安全性；更重要的是自動駕駛會改變?nèi)祟惖纳罘绞?，讓人們重新享受出行的樂趣?/span>

當前，我們的汽車是非智能的，其標準的四個輪子、一個機身和一個發(fā)動機的配置近100年來沒有了本質(zhì)性的改進，而世界上其它產(chǎn)業(yè)的根基你都發(fā)生著根本性的變化。而得益于機器人技術(shù)和人工智能技術(shù)在近期取得的成就，平凡普通的汽車也即將進化成自動化移動機器人。目前，汽車的便利在一個世紀中不斷給我們帶來了自由、快捷，同時也帶了新的工作機會和社交機會。商業(yè)貿(mào)易也因此變得前所未有的方便。

但是，在獲得移動便捷性的同時人們也付出了極高的代價。每年全球交通事故死傷人數(shù)近100萬，中國每年傷亡20萬人左右；人類駕駛的汽車也帶了城市的交通擁堵和空氣惡化。粗略估計，全球有十億由人類駕駛的汽車在陸地上漫游，對汽車的依賴已經(jīng)不可能減少，只會越來越多，汽車是我們現(xiàn)代生活不可缺少的一部分。

事實上，解決汽車引發(fā)系列問題最好的方式就是讓它們變得智能。當AI接管人類駕駛員時，無人汽車將給世界數(shù)十億人提供一種更安全、更簡潔甚至是更方便的出行模式。在理想的未來，我們的街道和高速路上會充滿成群的、分布緊密的無人駕駛汽車，想魚群一樣，這些無人駕駛汽車會展現(xiàn)出驚人的防沖撞能力，在充滿行人的街道上機智而快速地穿行，在漫長而空曠的高速路上以最經(jīng)濟的消耗方式靈活停靠。有些車會攜帶一輛名乘客，有些車完全沒有乘客，因為它們可能要去接送外賣或快遞。而坐在車里的人們，也講有完全自由時間和私密的空間進行任何事情，比如購物、看電影和孩子享受親子時光。

自動駕駛技術(shù)

自動駕駛技術(shù)從人們開始嘗試到現(xiàn)在其實已經(jīng)經(jīng)歷了近50年的歷史，從上世紀70年代就有國外機構(gòu)和大學開始研究自動駕駛技術(shù)。

美國國防高級研究計劃署（DARPA）在1984年研制出自主地面陸軍戰(zhàn)車項目，可以說是真正自動駕駛技術(shù)的開端。當時的技術(shù)還比較落后，只能通過固定規(guī)劃路線在動態(tài)障礙物的情況下達到目的地。到了2004年，DARPA接連舉辦了3屆無人駕駛挑戰(zhàn)賽，可以說真正拉開了現(xiàn)代自動駕駛的序幕，其中CMU（卡內(nèi)基梅隆大學）、MIT（麻省理工學院）、Stanford（斯坦福大學）等著名高校接連著力研發(fā)自動駕駛技術(shù)，將自動駕駛的發(fā)展推向高潮。

而產(chǎn)業(yè)界，最早在2009年Google成立X事業(yè)部開始了自動駕駛技術(shù)的研發(fā)，緊接著科技公司、傳統(tǒng)車企都紛紛加入自動駕駛這場技術(shù)競賽中，不甘落后。中國當然也是其中重要的一員，無數(shù)技術(shù)精英、專家回國參與自動駕駛研發(fā)，百度、華為、騰訊、阿里等大公司花重金投入其中，每年招攬大批人才，高校的生源供不應求，薪資也水漲船高。

2013年，美國機動工程師協(xié)會（SAE）給出了車輛自動化的標準，分別是L0~L5。不同的Level所實現(xiàn)的自動駕駛能力時逐層增加的。對應的中文翻譯可以參見表格：

目前，自動駕駛技術(shù)發(fā)展中，科技類公司主要尋求從L4級別自動駕駛?cè)胧?，一步將智能化完成到一個非常高的程度；而大部分傳統(tǒng)車企目前主要是從L3級別入手，從高級輔助駕駛開始逐漸往全自動方向滲透。這兩種發(fā)展思路也是充分提現(xiàn)了目前各自的優(yōu)勢，但大家的終極目標都是希望實現(xiàn)L5的全自動駕駛狀態(tài)。

下面，我們以Google的無人車為例，簡單介紹L4級別自動駕駛技術(shù)是如何構(gòu)成的。Google時最早開始研發(fā)自動駕駛的公司，擁有最豐富的技術(shù)積累和最強的研發(fā)人員。但是無人駕駛系統(tǒng)的復雜性是遠超人們想象的，經(jīng)過近10年的研究，目前也僅僅是試驗性的推出了無人駕駛體驗服務。無人駕駛系統(tǒng)主要由三部分組成：算法端、車端和云端。其中算法端包括傳感器、感知和決策等智能關(guān)鍵步驟的算法；車端包括機器人操作系統(tǒng)、各種計算硬件和車輛底盤硬件等；云端包括數(shù)據(jù)挖掘、仿真模擬、高精地圖以及深度學習訓練等等。

通過這一套系統(tǒng)我們能夠解決無人車的四個關(guān)鍵問題：我在哪？我周圍有什么？接下來會發(fā)生什么？我應該怎么做？

我在哪？

定位問題是無人車首先要解決的問題，只有明白自身的位置才能最優(yōu)的開往目的地。定位需要依靠一種稱為高精地圖的技術(shù)，該技術(shù)會將無人車要走的所有靜態(tài)環(huán)境進行描述，包括車道線、行人斑馬線、標志牌等等。這些靜態(tài)信息可以提供交通信號的關(guān)鍵信息，也會作為定位方案的錨定物對自身的位置進行校準，比如通過攝像頭看到距離左邊標志牌的距離是2.5m，那么在地圖中知道了標志牌的坐標也就知道了自身車輛的坐標。同時，還會依靠GPS/IMU等全局設(shè)備來定位自身位置，不過這可比我們目前智能手機里的GPS精度要求高很多，通過差分融合技術(shù)可以達到厘米級精度。

我周圍有什么？

有了定位后，無人車的感知系統(tǒng)將通過傳感器和人工智能算法將周圍的障礙物位置、大小、狀態(tài)、類別等標識出來。目前主流L4級別的傳感器包括GPS/IMU、LIDAR、Camera、Radar等，LIDAR、Camera和Radar都是用于感知周圍障礙物的主要傳感器，分別在不同環(huán)境下能夠有不同的優(yōu)勢。這些信息猶如人類駕駛員的眼睛一樣看到周圍動態(tài)環(huán)境物體，并將其識別出來，而無人車會利用自己多傳感器和計算效率達到遠超人類的水平，比如精準識別車輛后方任何物體、同時關(guān)注左右兩邊的車輛狀態(tài)，在黑暗狀態(tài)時可以通過激光雷達精準識別。

接下來會發(fā)生什么？

無人車知道周圍動態(tài)物體后，還需要能夠盡可能的預測這些物體的走向，包括行為預測和速度預測。例如這個車是要左轉(zhuǎn)還是直行，這輛車會不會闖紅燈等等，匯入車流時速度是多少。這些問題都將決定我們無人車后續(xù)應該怎么走，如何避免碰撞發(fā)生危險。當然由于人的主觀意志具有很多不確定性，在人類司機和自動駕駛司機混合的道路上，人工智能程序還需要學習人類的行為習慣和約定俗成的禮讓方式，這些都大大增加了無人車的難度。

我應該怎么做？

最后一步就是根據(jù)上述信息綜合來選擇一條最適合無人車的道路，如同人類的大腦一樣對車輛最終的行為負責，選擇最合適的方式達到目的地。這需要考慮行車的體感、安全和快捷等因素，通過最優(yōu)化算法、搜索算法、蒙特卡洛樹采樣等多種算法來得到未來的駕駛行為，也有通過模仿優(yōu)秀老司機的駕駛行為等方式來提升駕駛性能等等。

上述四個問題表面上僅僅是車輛端的問題，但是其背后的技術(shù)棧是異常龐大復雜的，這些人工智能技術(shù)會用到云端的仿真系統(tǒng)、模型訓練系統(tǒng)等等。要做好其中任何步驟都是學術(shù)界長期以來不斷積累而得，也是需要工程能力非常強大的工程師才能實現(xiàn)的高效算法。無人駕駛作為人工智能的一個重大應用方向，不是某一項單一的技術(shù)可以實現(xiàn)的，它是一個目前人類技術(shù)巔峰的一個整合創(chuàng)新。需要有算法上的創(chuàng)新、系統(tǒng)上的融合以及云平臺的支持。那如此復雜的技術(shù)我們應該如何入門，如何進入這個領(lǐng)域？

如何入門自動駕駛？

自動駕駛技術(shù)的發(fā)展目前最大的瓶頸不是傳感器的昂貴、不是產(chǎn)業(yè)發(fā)展不完善更不是公司投入不足，而是研發(fā)人才的缺乏。目前我國汽車從業(yè)人員達到360萬，但其中技術(shù)人才不到50萬，占比不到15%。這其中雖然很難明確界定自動駕駛?cè)瞬庞卸嗌?，但是可以想見肯定不多。而且從自動駕駛專業(yè)人才年薪動輒幾百萬上千萬，就可以知道人才有多緊缺。

我們需要更多的工程師和科學家進入這一領(lǐng)域，將現(xiàn)有的技術(shù)進行整合落地。但是如何幫助開發(fā)者們進入這一新興領(lǐng)域成了業(yè)界非常關(guān)注的事情，我們就以極客邦和百度Apollo聯(lián)合發(fā)布的自動駕駛工程師技能圖為例，來說明如何幫助非專業(yè)自動駕駛領(lǐng)域的工程轉(zhuǎn)行和進入該領(lǐng)域。先來看看這一份技能圖譜：

一個新的技術(shù)領(lǐng)域往往建立在當前成熟技術(shù)的基礎(chǔ)之上，而自動駕駛需要的技能種類繁多，我們需要首先全面了解整體技術(shù)，再選擇感興趣的方向進行深入挖掘。從這份技能圖譜可以看到包括兩大主要模塊，首先是基礎(chǔ)層，就是Apollo開發(fā)會用到的共性的語言和編程方式；其次是自動駕駛技術(shù)層，既包括感知、決策規(guī)劃、智能控制、End-to-End等自動駕駛核心能力，也包括硬件，比如GPS、雷達、傳感器、車輛相關(guān)的知識和技能。

作為一個非自動駕駛專業(yè)的同學，根據(jù)這份技能圖譜可以很好的完善自己的技能棧，剛?cè)腴T能夠做一個全面的了解是非常好的選擇，對以后職業(yè)發(fā)展會有很大的幫助，而不是專攻自己的領(lǐng)域，這樣容易在前沿探索時出現(xiàn)路線偏移的情況。另外，從目前的人才分布來看，自動駕駛方向還需要培養(yǎng)更多的全棧工程師來總攬全局，推動行業(yè)進步。