當你需要使用大量的計算能力并行地訓練系統(tǒng),或者讓研究人員花很長時間手工清除壞的系統(tǒng)時,訓練自動駕駛汽車的過程很少是有效的。Waymo正在試驗新的方式:這一方式與指導進化的原理相同。
Waymo與DeepMind合作開發(fā)了一種基于人口的訓練方式,用于做行人檢測,該方法擁有最好的神經(jīng)網(wǎng)絡,就像生命體在自然選擇方面所做的那樣,可以節(jié)省時間和精力。
這種方式通常會讓神經(jīng)網(wǎng)絡進行彼此競爭,較弱的網(wǎng)絡會被較強的“子代”所取代,這些“子代”網(wǎng)絡其實是性能較好的網(wǎng)絡的副本,只不過在參數(shù)上進行了調(diào)整,就像父母的孩子,有父母的基因,但是又不是父母的克隆體一樣。這樣做的好處是,可以自動清理掉性能較差的網(wǎng)絡,同時不需要從零開始重新訓練。
不過這種方式的風險在于過于注重短期的改進,為了解決這一問題,Waymo創(chuàng)造了一個微型生態(tài)環(huán)境,在這個生態(tài)中,神經(jīng)網(wǎng)絡在小群體中相互挑戰(zhàn),以獲得
最好的結果,同時也保持了多樣性,這更適合現(xiàn)實的駕駛環(huán)境。
該方法在行人檢測中具有良好的應用前景,基于人口的訓練方式誤報率下降了24%,時間卻較以往縮短了一半,試驗進行的很順利,以至于Waymo開始在其他模型中使用這一方法,這也許能讓自動駕駛汽車更好的應對駕駛環(huán)境的復雜性,以避免碰撞。