無人駕駛汽車會“漂移”!你對它背后的機器學(xué)習(xí)技術(shù)了解多少?

Winnie Lee
機器學(xué)習(xí)涉及到算法的研究、設(shè)計和開發(fā),這些算法使計算機無需顯式編程就能學(xué)習(xí)。而數(shù)據(jù)挖掘可以定義為從非結(jié)構(gòu)化數(shù)據(jù)中試圖提取知識或未知的有趣模式的過程,在此過程中,使用了學(xué)習(xí)算法。
 
  無人駕駛汽車可以使用機器學(xué)習(xí)算法進行高速轉(zhuǎn)彎,該算法通過研究類似的視頻來學(xué)習(xí)。
 
  這種類型的人工智能被稱為神經(jīng)網(wǎng)絡(luò),大體上是基于我們大腦的工作方式。
 
  為了訓(xùn)練自動駕駛系統(tǒng)不失控,研究人員在北極圈附近結(jié)冰的賽道上進行了20多萬份運動樣本的測試。
 
  它利用之前幾秒鐘的時間來觀察汽車的運動,以調(diào)整方向盤,從而在不同路面上提供準(zhǔn)確的運動預(yù)測。
 
  來自加州斯坦福大學(xué)的研究小組給一輛大眾GTI配備了這種算法,并在橢圓形賽道上進行了測試。
 
  他們讓其行駛速度盡可能快,并從以往的測試中學(xué)習(xí),汽車調(diào)整其轉(zhuǎn)向和加速度以成功轉(zhuǎn)彎。
 
  為了讓自動駕駛汽車安全運行,它們需要能夠在危急情況下快速剎車、加速或轉(zhuǎn)向的控制系統(tǒng)。
 
  這使得他們能夠在摩擦極限下安全駕駛——就在輪胎不受控制、汽車開始旋轉(zhuǎn)的前一秒。
 
  該論文的資深作者、機械工程學(xué)教授克里斯蒂安•格迪斯(J.Christian Gerdes)說:“在現(xiàn)有技術(shù)條件下,你常常不得不在數(shù)據(jù)驅(qū)動的方法和基于基礎(chǔ)物理的方法之間做出選擇。”
 
  格迪斯教授說,他的系統(tǒng)可以在緊急情況下提供幫助,當(dāng)在緊急情況下需要突然轉(zhuǎn)向的時候。
 
  研究結(jié)果令人鼓舞,但研究人員強調(diào),他們的神經(jīng)網(wǎng)絡(luò)系統(tǒng)在除訓(xùn)練場外的外部環(huán)境下表現(xiàn)不佳。
 
  Gerdes教授說,神經(jīng)網(wǎng)絡(luò)的一個挑戰(zhàn)是缺乏對其工作原理的了解。
 
  他說:“如果你給它一組它從未見過的條件,它可能會推斷出完全錯誤的方式,從而導(dǎo)致潛在的危險轉(zhuǎn)向。”
 
  該團隊正在繼續(xù)開發(fā)系統(tǒng)和車輛,這些車輛的互動次數(shù)是記者所看到的數(shù)千倍,他們稱希望能讓它們更安全。
 
  研究人員現(xiàn)在正在系統(tǒng)中構(gòu)建安全特性,以檢查其決策是否合理。
 
  這項研究發(fā)表在《科學(xué)機器人》(Science Robotics.)雜志上。
 
  無人駕駛與機器學(xué)習(xí)技術(shù)
 
  機器學(xué)習(xí)是計算機科學(xué)的一個分支,它處理系統(tǒng)編程,以便通過經(jīng)驗自動學(xué)習(xí)和改進。
 
  例如:對機器人進行編程,使它們能夠根據(jù)從傳感器收集的數(shù)據(jù)執(zhí)行任務(wù)。它自動從數(shù)據(jù)中學(xué)習(xí)程序。
 
  目前,機器學(xué)習(xí)算法被廣泛應(yīng)用于尋找制造自動駕駛汽車的各種挑戰(zhàn)的解決方案。
 
  隨著傳感器數(shù)據(jù)處理技術(shù)在汽車電子控制單元(ECU)中的應(yīng)用,提高對機器學(xué)習(xí)技術(shù)的利用來完成新任務(wù)是十分必要的。
 
  潛在的應(yīng)用包括通過來自不同外部和內(nèi)部傳感器(如激光雷達、雷達、攝像機或物聯(lián)網(wǎng))的數(shù)據(jù)集合來評估駕駛員的狀況或進行駕駛場景分類。
 
  運行汽車信息娛樂系統(tǒng)的應(yīng)用程序可以接收來自傳感器數(shù)據(jù)融合系統(tǒng)的信息,例如,如果汽車注意到司機有什么不對勁,它可以將汽車直接開往醫(yī)院。
 
  這個基于機器學(xué)習(xí)的應(yīng)用還包括駕駛員的語音和手勢識別以及語言翻譯。
 
  在自動駕駛汽車中,機器學(xué)習(xí)算法的主要任務(wù)之一是對周圍環(huán)境進行連續(xù)繪制,并預(yù)測這些環(huán)境可能發(fā)生的變化。
 
  這些任務(wù)分為4個子任務(wù):對物體的檢測、對象的識別或識別對象的分類、目標(biāo)定位和運動預(yù)測。
 
  機器學(xué)習(xí)與AI、數(shù)據(jù)挖掘的區(qū)別
 
  機器學(xué)習(xí)屬于人工智能技術(shù),根據(jù)基于經(jīng)驗數(shù)據(jù)的行為設(shè)計和開發(fā)算法被稱為機器學(xué)習(xí)。
 
  除了機器學(xué)習(xí),人工智能還包括知識表現(xiàn)、自然語言處理、規(guī)劃、機器人等方面。
 
  機器學(xué)習(xí)涉及到算法的研究、設(shè)計和開發(fā),這些算法使計算機無需顯式編程就能學(xué)習(xí)。而數(shù)據(jù)挖掘可以定義為從非結(jié)構(gòu)化數(shù)據(jù)中試圖提取知識或未知的有趣模式的過程,在此過程中,使用了學(xué)習(xí)算法。
 
  機器學(xué)習(xí)背后的算法與技術(shù)
 
  機器學(xué)習(xí)算法大致分為四類:決策矩陣算法、聚類算法、模式識別算法和回歸算法。
 
  其中一類機器學(xué)習(xí)算法可用于完成2個或多個子任務(wù)。
 
  例如,回歸算法可以用于目標(biāo)定位以及目標(biāo)檢測或運動預(yù)測。
 
  機器學(xué)習(xí)中涵蓋了不同的算法技術(shù),如監(jiān)督學(xué)習(xí)(Supervised Learning)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)、遷移學(xué)習(xí)等。
 
  監(jiān)督學(xué)習(xí)必須確定目標(biāo)變量的值,以便機器學(xué)習(xí)算法可以發(fā)現(xiàn)特征和目標(biāo)變量之間的關(guān)系。比如在給定數(shù)據(jù)時,我們應(yīng)知道正確的輸出結(jié)果應(yīng)該是什么樣子,并且知道在輸入和輸出之間有著一個特定的關(guān)系。
 
  非監(jiān)督學(xué)習(xí),即在未加標(biāo)簽的數(shù)據(jù)中,試圖找到隱藏的結(jié)構(gòu)。數(shù)據(jù)沒有類別信息,也沒有給定的目標(biāo)值。
 
  遷移學(xué)習(xí)能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,作為小數(shù)據(jù)模型的訓(xùn)練起點,節(jié)約訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要的大量計算和時間資源。
 
  強化學(xué)習(xí)則是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使獎勵信號(強化信號)函數(shù)值最大,由于外部給出的信息很少,強化學(xué)習(xí)系統(tǒng)必須依靠自身的經(jīng)歷進行自我學(xué)習(xí)。通過這種學(xué)習(xí)獲取知識,改進行動方案以適應(yīng)環(huán)境。
 
  谷歌的AlphaZero就是使用強化學(xué)習(xí)的方式,通過自己和自己下棋的方式生成模型,最后擊敗了通過深度學(xué)習(xí)訓(xùn)練的AlphaGo。
THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論