編者按:本文是百度Apollo一名自動駕駛工程師對自動駕駛的一篇見解文章。文章先講解了自動駕駛的發(fā)展意義;然后從我在那兒?周圍有什么?接下來會發(fā)生什么?我該怎么做?等方面展開講解自動駕駛技術(shù);最后以極客邦和百度Apollo聯(lián)合發(fā)布的自動駕駛工程師技能圖為例,說明了如何幫助非專業(yè)自動駕駛領(lǐng)域的工程師轉(zhuǎn)行和進入該領(lǐng)域。 未來的出行生活 2018年12月5日,Google旗下的Waymo推出自動駕駛首個用于服務乘客的商業(yè)叫車服務——Waymo One,該服務在美國鳳凰城及其錢德勒、坦佩、梅薩和吉爾伯特4個郊區(qū)24小時運行。乘客只需通過APP呼叫無人車,選定上下車地點,然后通過自動駕駛系統(tǒng)就可以方便地前往任何地方。車上沒有駕駛員,只有一塊HMI(人機交互界面)來告知乘客目前車輛的狀態(tài)、周圍情況以及后續(xù)路線。 從Google的自動駕駛項目開始再到如今的Waymo,其自動駕駛技術(shù)在10年間取得了不小進步。Waymo測試車累計公路行駛距離已達1000萬英里,遍及美國25個城市,還有著100億英里的模擬行駛數(shù)據(jù)。而這些駕駛數(shù)據(jù)配合人工智能技術(shù)將無人駕駛帶到了我們身邊。 同樣,在北京的海淀公園18年也被改造成了全球首個AI公園,11月1號正式對外開放。在這整個智能化公園中,最引人矚目的就是阿波龍自動駕駛小巴。這款迷你小巴每輛可搭載6-7人,沒有駕駛座也沒有方向盤,等乘客落座系好安全帶,阿波龍就會自動關(guān)上車門妥妥地起步。在行駛過程中,拐彎和掉頭之前會主動降速,遇到前方有行人或障礙物,也會主動減速避讓或者停車。 這些都是人類見證歷史的偉大時刻,也是邁向未來生活的開始,標志著一個新的時代正在悄然來臨。 普通汽車終將退出歷史舞臺,可能就在不久的將來,汽車即將成為我們可以放心托付自己生命的第一代自主式機器人。在歷經(jīng)了數(shù)十年不斷失敗的嘗試后,借助速度更快的電腦、更可靠的傳感器技術(shù)以及基于深度學習的新一代人工智能軟件,汽車可以獲得與人類相似的能力,在無法預測的環(huán)境中自主安全地駕駛。 為什么我們需要關(guān)注自動駕駛?不僅僅是因為這項具有偉大影響力的技術(shù)能夠替代司機提升交通出行的效率和安全性;更重要的是自動駕駛會改變?nèi)祟惖纳罘绞?,讓人們重新享受出行的樂趣?/span> 當前,我們的汽車是非智能的,其標準的四個輪子、一個機身和一個發(fā)動機的配置近100年來沒有了本質(zhì)性的改進,而世界上其它產(chǎn)業(yè)的根基你都發(fā)生著根本性的變化。而得益于機器人技術(shù)和人工智能技術(shù)在近期取得的成就,平凡普通的汽車也即將進化成自動化移動機器人。目前,汽車的便利在一個世紀中不斷給我們帶來了自由、快捷,同時也帶了新的工作機會和社交機會。商業(yè)貿(mào)易也因此變得前所未有的方便。 但是,在獲得移動便捷性的同時人們也付出了極高的代價。每年全球交通事故死傷人數(shù)近100萬,中國每年傷亡20萬人左右;人類駕駛的汽車也帶了城市的交通擁堵和空氣惡化。粗略估計,全球有十億由人類駕駛的汽車在陸地上漫游,對汽車的依賴已經(jīng)不可能減少,只會越來越多,汽車是我們現(xiàn)代生活不可缺少的一部分。 事實上,解決汽車引發(fā)系列問題最好的方式就是讓它們變得智能。當AI接管人類駕駛員時,無人汽車將給世界數(shù)十億人提供一種更安全、更簡潔甚至是更方便的出行模式。在理想的未來,我們的街道和高速路上會充滿成群的、分布緊密的無人駕駛汽車,想魚群一樣,這些無人駕駛汽車會展現(xiàn)出驚人的防沖撞能力,在充滿行人的街道上機智而快速地穿行,在漫長而空曠的高速路上以最經(jīng)濟的消耗方式靈活停靠。有些車會攜帶一輛名乘客,有些車完全沒有乘客,因為它們可能要去接送外賣或快遞。而坐在車里的人們,也講有完全自由時間和私密的空間進行任何事情,比如購物、看電影和孩子享受親子時光。 自動駕駛技術(shù) 自動駕駛技術(shù)從人們開始嘗試到現(xiàn)在其實已經(jīng)經(jīng)歷了近50年的歷史,從上世紀70年代就有國外機構(gòu)和大學開始研究自動駕駛技術(shù)。 美國國防高級研究計劃署(DARPA)在1984年研制出自主地面陸軍戰(zhàn)車項目,可以說是真正自動駕駛技術(shù)的開端。當時的技術(shù)還比較落后,只能通過固定規(guī)劃路線在動態(tài)障礙物的情況下達到目的地。到了2004年,DARPA接連舉辦了3屆無人駕駛挑戰(zhàn)賽,可以說真正拉開了現(xiàn)代自動駕駛的序幕,其中CMU(卡內(nèi)基梅隆大學)、MIT(麻省理工學院)、Stanford(斯坦福大學)等著名高校接連著力研發(fā)自動駕駛技術(shù),將自動駕駛的發(fā)展推向高潮。 而產(chǎn)業(yè)界,最早在2009年Google成立X事業(yè)部開始了自動駕駛技術(shù)的研發(fā),緊接著科技公司、傳統(tǒng)車企都紛紛加入自動駕駛這場技術(shù)競賽中,不甘落后。中國當然也是其中重要的一員,無數(shù)技術(shù)精英、專家回國參與自動駕駛研發(fā),百度、華為、騰訊、阿里等大公司花重金投入其中,每年招攬大批人才,高校的生源供不應求,薪資也水漲船高。 2013年,美國機動工程師協(xié)會(SAE)給出了車輛自動化的標準,分別是L0~L5。不同的Level所實現(xiàn)的自動駕駛能力時逐層增加的。對應的中文翻譯可以參見表格: 目前,自動駕駛技術(shù)發(fā)展中,科技類公司主要尋求從L4級別自動駕駛?cè)胧?,一步將智能化完成到一個非常高的程度;而大部分傳統(tǒng)車企目前主要是從L3級別入手,從高級輔助駕駛開始逐漸往全自動方向滲透。這兩種發(fā)展思路也是充分提現(xiàn)了目前各自的優(yōu)勢,但大家的終極目標都是希望實現(xiàn)L5的全自動駕駛狀態(tài)。 下面,我們以Google的無人車為例,簡單介紹L4級別自動駕駛技術(shù)是如何構(gòu)成的。Google時最早開始研發(fā)自動駕駛的公司,擁有最豐富的技術(shù)積累和最強的研發(fā)人員。但是無人駕駛系統(tǒng)的復雜性是遠超人們想象的,經(jīng)過近10年的研究,目前也僅僅是試驗性的推出了無人駕駛體驗服務。無人駕駛系統(tǒng)主要由三部分組成:算法端、車端和云端。其中算法端包括傳感器、感知和決策等智能關(guān)鍵步驟的算法;車端包括機器人操作系統(tǒng)、各種計算硬件和車輛底盤硬件等;云端包括數(shù)據(jù)挖掘、仿真模擬、高精地圖以及深度學習訓練等等。 通過這一套系統(tǒng)我們能夠解決無人車的四個關(guān)鍵問題:我在哪?我周圍有什么?接下來會發(fā)生什么?我應該怎么做? 我在哪?定位問題是無人車首先要解決的問題,只有明白自身的位置才能最優(yōu)的開往目的地。定位需要依靠一種稱為高精地圖的技術(shù),該技術(shù)會將無人車要走的所有靜態(tài)環(huán)境進行描述,包括車道線、行人斑馬線、標志牌等等。這些靜態(tài)信息可以提供交通信號的關(guān)鍵信息,也會作為定位方案的錨定物對自身的位置進行校準,比如通過攝像頭看到距離左邊標志牌的距離是2.5m,那么在地圖中知道了標志牌的坐標也就知道了自身車輛的坐標。同時,還會依靠GPS/IMU等全局設(shè)備來定位自身位置,不過這可比我們目前智能手機里的GPS精度要求高很多,通過差分融合技術(shù)可以達到厘米級精度。 我周圍有什么?有了定位后,無人車的感知系統(tǒng)將通過傳感器和人工智能算法將周圍的障礙物位置、大小、狀態(tài)、類別等標識出來。目前主流L4級別的傳感器包括GPS/IMU、LIDAR、Camera、Radar等,LIDAR、Camera和Radar都是用于感知周圍障礙物的主要傳感器,分別在不同環(huán)境下能夠有不同的優(yōu)勢。這些信息猶如人類駕駛員的眼睛一樣看到周圍動態(tài)環(huán)境物體,并將其識別出來,而無人車會利用自己多傳感器和計算效率達到遠超人類的水平,比如精準識別車輛后方任何物體、同時關(guān)注左右兩邊的車輛狀態(tài),在黑暗狀態(tài)時可以通過激光雷達精準識別。 接下來會發(fā)生什么?無人車知道周圍動態(tài)物體后,還需要能夠盡可能的預測這些物體的走向,包括行為預測和速度預測。例如這個車是要左轉(zhuǎn)還是直行,這輛車會不會闖紅燈等等,匯入車流時速度是多少。這些問題都將決定我們無人車后續(xù)應該怎么走,如何避免碰撞發(fā)生危險。當然由于人的主觀意志具有很多不確定性,在人類司機和自動駕駛司機混合的道路上,人工智能程序還需要學習人類的行為習慣和約定俗成的禮讓方式,這些都大大增加了無人車的難度。 我應該怎么做?最后一步就是根據(jù)上述信息綜合來選擇一條最適合無人車的道路,如同人類的大腦一樣對車輛最終的行為負責,選擇最合適的方式達到目的地。這需要考慮行車的體感、安全和快捷等因素,通過最優(yōu)化算法、搜索算法、蒙特卡洛樹采樣等多種算法來得到未來的駕駛行為,也有通過模仿優(yōu)秀老司機的駕駛行為等方式來提升駕駛性能等等。 上述四個問題表面上僅僅是車輛端的問題,但是其背后的技術(shù)棧是異常龐大復雜的,這些人工智能技術(shù)會用到云端的仿真系統(tǒng)、模型訓練系統(tǒng)等等。要做好其中任何步驟都是學術(shù)界長期以來不斷積累而得,也是需要工程能力非常強大的工程師才能實現(xiàn)的高效算法。無人駕駛作為人工智能的一個重大應用方向,不是某一項單一的技術(shù)可以實現(xiàn)的,它是一個目前人類技術(shù)巔峰的一個整合創(chuàng)新。需要有算法上的創(chuàng)新、系統(tǒng)上的融合以及云平臺的支持。那如此復雜的技術(shù)我們應該如何入門,如何進入這個領(lǐng)域? 如何入門自動駕駛? 自動駕駛技術(shù)的發(fā)展目前最大的瓶頸不是傳感器的昂貴、不是產(chǎn)業(yè)發(fā)展不完善更不是公司投入不足,而是研發(fā)人才的缺乏。目前我國汽車從業(yè)人員達到360萬,但其中技術(shù)人才不到50萬,占比不到15%。這其中雖然很難明確界定自動駕駛?cè)瞬庞卸嗌?,但是可以想見肯定不多。而且從自動駕駛專業(yè)人才年薪動輒幾百萬上千萬,就可以知道人才有多緊缺。 我們需要更多的工程師和科學家進入這一領(lǐng)域,將現(xiàn)有的技術(shù)進行整合落地。但是如何幫助開發(fā)者們進入這一新興領(lǐng)域成了業(yè)界非常關(guān)注的事情,我們就以極客邦和百度Apollo聯(lián)合發(fā)布的自動駕駛工程師技能圖為例,來說明如何幫助非專業(yè)自動駕駛領(lǐng)域的工程轉(zhuǎn)行和進入該領(lǐng)域。先來看看這一份技能圖譜: 一個新的技術(shù)領(lǐng)域往往建立在當前成熟技術(shù)的基礎(chǔ)之上,而自動駕駛需要的技能種類繁多,我們需要首先全面了解整體技術(shù),再選擇感興趣的方向進行深入挖掘。從這份技能圖譜可以看到包括兩大主要模塊,首先是基礎(chǔ)層,就是Apollo開發(fā)會用到的共性的語言和編程方式;其次是自動駕駛技術(shù)層,既包括感知、決策規(guī)劃、智能控制、End-to-End等自動駕駛核心能力,也包括硬件,比如GPS、雷達、傳感器、車輛相關(guān)的知識和技能。 作為一個非自動駕駛專業(yè)的同學,根據(jù)這份技能圖譜可以很好的完善自己的技能棧,剛?cè)腴T能夠做一個全面的了解是非常好的選擇,對以后職業(yè)發(fā)展會有很大的幫助,而不是專攻自己的領(lǐng)域,這樣容易在前沿探索時出現(xiàn)路線偏移的情況。另外,從目前的人才分布來看,自動駕駛方向還需要培養(yǎng)更多的全棧工程師來總攬全局,推動行業(yè)進步。 |
|
來自: taotao_2016 > 《物理》