
此次Waymo公布的數據集包含了3000段平均時長為20秒的駕駛記錄,整個數據集包含六十萬幀數據,約2500萬3D邊界框、2200萬2D邊界框,以及多樣化的自動駕駛場景。數據公開之后,Waymo無人車傳感器的特點也將一覽無余。
Waymo公開自動駕駛數據集
但Waymo公開數據集的做法在自動駕駛行業內并首例。2018年3月8日,百度Apollo自動駕駛開放平臺正式加入加州大學伯克利DeepDrive深度學習自動駕駛產業聯盟,正式開放ApolloScape大規模自動駕駛數據集,這一舉措將學術與企業緊密相連,也為無人車行業如虎添翼。
自動駕駛感知技術眾多且難度大,其主要目的是實現場景的語義理解。以檢測技術為例,其目的是在圖像或者點云中找到涵蓋物體的二維或者三維矩形框?,F有的包括Waymo發布的數據集主要針對的就是這類檢測技術。作為較為領先開放的數據集,ApolloScape是行業內環境最復雜、標注最精準的三維自動駕駛公開數據集。更重要的是,ApolloScape為開發更多的自動駕駛感知技術提供了不同的數據集,這些數據集可服務于,除了上述的物體檢測技術,還包括物體及實例級別的分割技術,三維姿態估計,物體軌跡跟蹤技術,相機自主定位技術,深度圖像估計技術等等。目前ApolloScape已經發布了五個公開數據集包括場景解析,細粒度車道線,定位,三維車輛擬合和稠密軌跡。
ApolloScape中的場景解析(scene parsing)數據集包括了14.7萬幀的具備逐像素語義標注的圖像,相對于包括Waymo在內的僅具備矩形框標注的數據集,像素級標注提供了更為細致的而且不受物體間的遮擋影響的場景信息,旨在推動更為精準的視頻場景語義理解技術。除了二維視頻圖像,其每幀相關的三維點云也被逐點標注了語義信息。另外,圖像的逐像素標注的時間工作量超過了矩形框標注的工作量十倍以上。
道路線是一項基礎的路面元素, ApolloScape車道線數據集提供了28類不同的道路線分類的逐像素級別和以及三維逐點級別的數據集,這是目前所有公開數據集都不具備的標注信息。
無人車需要精準的定位系統用以獲取一系列信息,例如自身的位置,前方的情況,以及行駛區。其中定位精度一般需要控制在10厘米以內以避免出現碰撞和車道偏離的情況。ApolloScape自定位 (self-localization)數據集提供了近30萬張帶有高精GPU/IMU信息的覆蓋近28公里的圖像。
此外,如何利用圖像快速感知周圍車輛的三維位姿對于自動駕駛也至關重要。為了推進此問題的研究, ApolloScapeCar3D數據集應運而生。此數據集采集于中國的不同的城市,包含5,277多幅真實駕駛場景、6萬多車輛的三維標注數據。除了車輛的三維位姿之外,百度還同時開放了真實三維車模型,66個三維/二維車輛關鍵點數據。接下來,我們或進一步開放部件級別的、稠密的三維車輛標注。
ApolloScape的物體軌跡跟蹤數據集提供了圖像和點云上的物體運動軌跡,其涵蓋了不同的光照條件以及大量的車/人/騎行混雜的交通流,旨在推動物體跟蹤以及運動行為預測技術。軌跡數據全長到2.5個小時,這個比現有的最大的軌跡數據集(NGSIM)大了三倍。
自2018年3月的發布以來,ApolloScape數據集已經被全球范圍內下載上萬次。由于其重要性,計算機視覺領域內頂級的雜志IEEE TPAMI收錄了關于這個數據集的科技文章,這也是目前我們所知的唯一一篇發表在TPAMI上的關于自動駕駛數據集的文章?;谶@些數據集,百度在世界級的頂會(例如CVPR和ECCV)和頂級平臺上(例如Kaggle)上主持了多項競賽。這些競賽吸引了來自全球范圍內上千個參賽隊伍,其中包括英偉達,斯坦福大學,曠世,優圖等著名的公司和大學。
除上述數據集外,之后,更多類型、更多屬性的數據將持續加入ApolloScape,百度將最大程度地還原真實世界的場景,打造最大的自動駕駛開放平臺以促進行業發展。
充分利用ApolloScape這個高精度數據集,百度同時開發了一種增強現實的自動駕駛仿真系統,為自動駕駛車輛提供更為可靠且廉價的仿真模擬方法,可大規模用于訓練和測試評估自動駕駛系統的感知、決策和路徑規劃算法。該系統相較于現有仿真系統,在真實感、擴展性等方面都實現了突破性的技術進展,并發表于《科學》雜志《機器人學》子刊?!犊茖W》雜志是全球最權威的學術期刊之一,代表了人類自然科學研究的最高水平?!犊茖W·機器人學》雜志是其五個子刊之一,平均每期刊出不多于4篇的研究類文章,刊載難度很大。同時,該系統被超過70家國內外主流媒體報道。
在自動駕駛的開發測試中,優質的真實數據是必不可少的“原料”,少有團隊有能力開發并維持一個適用的自動駕駛平臺,定期校準并收集新數據,然而百度擔起了行業發展的重任,最終搭建起了可供學界和業界參考學習的開放數據集,這一點在行業發展的過程中顯得尤為可貴,為之后國內外無人車研究的學者和企業提供了巨大幫助。
一個新興行業的健康發展從來不是一家獨大,而是以開放的心態分享各自的技術突破,接受來自各界的交流合作??萍紵o國界,百度早就掀起了數據開放、共享的浪潮,掀起了世界范圍內的協同合作。百度Apollo一直在為自動駕駛行業快速發展作出努力,百度Apollo開放平臺秉承開放理念,將繼續以寬廣的胸懷向業內分享自身的成果、提出發展戰略,不僅是數據公開,百度今后也在構建可持續發展的行業生態道路上大步向前。