利用深度強化學(xué)習(xí)模型訓(xùn)練自動駕駛車輛識別路上行人

陳品蓁
新創(chuàng)公司Humanising Autonomy的技術(shù)是一套經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)(machine learning)模型,應(yīng)用范圍在于自動駕駛汽車行駛時,可以識別不同行人之行為。

圖片來源:Humanising Autonomy

新創(chuàng)公司Humanising Autonomy的技術(shù)是一套經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)(machine learning)模型,應(yīng)用范圍在于自動駕駛汽車行駛時,可以識別不同行人之行為。該公司宣稱其人工智能系統(tǒng)是一個幾乎可以處理任何車輛攝像頭上的圖像,且因此獲得一個國際投資基金獲得了530萬美元的種子基金。目前,Humanising Autonomy正與歐洲、美國和日本的移動供貨商合作,致力于將產(chǎn)品商業(yè)化,其中幾家公司包括:Daimler Mercedes Benz 和 Airbus。

Humanising Autonomy模型的優(yōu)勢包括兩點:多樣的數(shù)據(jù)來源,以及可根據(jù)硬件需求單獨選擇和調(diào)整的模塊化模型設(shè)計。

該系統(tǒng)的數(shù)據(jù)來源涵蓋了閉路電視攝影機(jī)(Closed-circuit television, CCTV)、各種分辨率的移動式攝影機(jī)、以及自動駕駛車輛的傳感器等。而系統(tǒng)模塊化的優(yōu)點在于可以隨著環(huán)境做出不同的預(yù)測和調(diào)整,例如,雨天風(fēng)險大小、行人是否分心、地區(qū)差異等。利用深度學(xué)習(xí)(deep learning)的設(shè)計,該制程的可讀性將會提高,也將改善該模型的效能。

真正的人工智能公司是擁有統(tǒng)一的自動化數(shù)據(jù)數(shù)據(jù)庫,也就是一個戰(zhàn)略數(shù)據(jù)采集的地方。在設(shè)計自動駕駛車輛的過程中,創(chuàng)建數(shù)據(jù)集以及使用數(shù)據(jù)集,將會是設(shè)計過程與機(jī)器模型深度學(xué)習(xí)中,一個互補條件下的完美結(jié)果。

開發(fā)深度學(xué)習(xí)模型時,特別困難的地方是確定哪些才是所謂真正的變量(variations)。大多數(shù)的情況下,圖像和聲音都會轉(zhuǎn)換為數(shù)行和數(shù)列的數(shù)據(jù),而普遍對深度學(xué)習(xí)的誤解是,人工智能學(xué)習(xí)系統(tǒng)模型都需要使用大量數(shù)據(jù)做為訊息來源。但在預(yù)測自動駕駛路徑時,如果為了同時考慮天氣,而把因為下雨導(dǎo)致轉(zhuǎn)彎速度下降所加入的道路標(biāo)記,改成添加一個“下雨”的功能到軟件里,模型將不需要再進(jìn)行密集型學(xué)習(xí),就能進(jìn)一步提高其性能。

另一方面,由于數(shù)據(jù)都是由人類所產(chǎn)生,因此,在深度學(xué)習(xí)的情況下,加入心理學(xué)的概念將有助于理解為什么某些數(shù)據(jù)產(chǎn)生的結(jié)果,或者某些神經(jīng)網(wǎng)絡(luò)會存有誤差。如果以行人過馬路的行為為例,一般人皆可知道,倫敦的行為模式并不能轉(zhuǎn)移到孟買,反之亦然。如此一來,學(xué)習(xí)過程將不再是訓(xùn)練一個全新的模型,而是收集并關(guān)注特定的數(shù)據(jù),以便對新環(huán)境進(jìn)行更新。

產(chǎn)品改良的過程,有一件事特別令人注目,也就是當(dāng)用戶使用產(chǎn)品時,設(shè)計人員能持續(xù)開發(fā)深度學(xué)習(xí)解決方案,并與用戶交互學(xué)習(xí),使得每個新生成的數(shù)據(jù)點變成動態(tài)的學(xué)習(xí)。這個過程結(jié)合了深度學(xué)習(xí)與強化學(xué)習(xí),稱為深度強化學(xué)習(xí)(deep reinforcement learning)。

深度強化學(xué)習(xí)可應(yīng)用于多的地方,其中也包括自動駕駛車輛與行人之間的相互作用。舉例來說,當(dāng)行人了解每次只要將一只腳放在路上,車輛就都會停下來,那么當(dāng)行人想要穿越馬路時,就會更頻繁的做這個動作。這件事若使用傳統(tǒng)的深度學(xué)習(xí)算法,必須重新訓(xùn)練整個模型或至少是模型中幾個層的訓(xùn)練成本,但深度強化學(xué)習(xí)的模型可以自動將這樣的行為加到該項目中。

總而言之,在收集和準(zhǔn)備數(shù)據(jù)的過程中,透過設(shè)計方法的改進(jìn),將可以改善大部分的數(shù)據(jù)管理作業(yè)。而借著設(shè)計和工程視角間的切換,將可以避免在特定領(lǐng)域遇到障礙,而有助于實現(xiàn)模型學(xué)習(xí)的結(jié)果。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論