圖片來源視覺中國
深度學(xué)習(xí)技術(shù)很玄幻。它不可解釋,又蘊含人生哲學(xué)。
比如它需要喂大量的感知數(shù)據(jù),且數(shù)據(jù)的質(zhì)量直接影響算法精度。對比我們?yōu)槿?,多與優(yōu)秀、厚德之人交友,更能提升修養(yǎng)——也解釋了環(huán)境為何能影響人。
數(shù)據(jù)是機器認(rèn)知世界的“糧食”,算法就像大腦和思維方式,算力如身體。如果你有強大的腦力,但缺乏強壯的體魄,再好的算法亦如過眼云煙。中國的傳統(tǒng)思想很強調(diào)提升個人思想與修養(yǎng),但體魄是我們實現(xiàn)這些的基礎(chǔ)。
算法又與人類解決實際問題很相通,比如計算機的車牌檢測是一種算法,垃圾檢測是一種算法,識別犯罪團(tuán)伙也是一種算法,醫(yī)學(xué)影像又是一種算法……計算機處理大事小事均有不同類型的算法。相比較人類,處理工作當(dāng)中的人際關(guān)系是一種算法,財務(wù)管理是一種算法,寫代碼是一種算法……方式方法分門別類。反之推理,人類要更好解決問題,可參考計算機的認(rèn)知世界的模式:不斷尋找和優(yōu)化最好的方式方法,就像算法迭代和升級那樣。
為何要講深度學(xué)習(xí)與人類處理實際問題的關(guān)聯(lián)?因為本文涉及自動駕駛技術(shù)發(fā)展的面臨的關(guān)鍵問題:倫理道德。在討論這個問題之前,須先探討行業(yè)面臨的關(guān)鍵技術(shù)難題,自動駕駛規(guī)?;虡I(yè)落地,技術(shù)才是源頭和根本。
視覺技術(shù):自動駕駛破局的核心
如果站在未來回顧科技發(fā)展,2021年一定很特別,這一年,世界與中國都發(fā)生了深刻變革。全球氣候危機逼近,新冠疫情關(guān)鍵轉(zhuǎn)折,中國生育率首次低于日本,互聯(lián)網(wǎng)巨頭壟斷時代落幕,汽車產(chǎn)業(yè)也到了巨變的前夜。
2021年,也是移動互聯(lián)網(wǎng)時代的結(jié)束,一個全新的硬科技創(chuàng)新的周期敲響鐘聲了。在這個新的技術(shù)周期里,自動駕駛?cè)鐮N爛星空的一道耀眼的光。
今年,大量車廠發(fā)布了L3和L2自動駕駛解決方案,接下來將有大量帶著這些解決方案的車在路上跑。2021年也被稱為自動駕駛元年。
特斯拉CEO埃隆·馬斯克在2021年新能源世界大會上說,“特斯拉相信自動輔助駕駛可以完全通過視覺神經(jīng)網(wǎng)絡(luò)來實現(xiàn),因為人就是生物意義上的視覺神經(jīng)網(wǎng)絡(luò)駕駛的,所以計算機也一定可以。”
與人類一樣,機器感知世界最重要的方式就是視覺,占比近60%,遠(yuǎn)超聽覺、嗅覺、味覺。馬斯克也表示,視覺可以應(yīng)對95%-99%的輔助駕駛場景。
但馬斯克說的純視覺技術(shù)路徑也存在一個很大的BUG,由于深度學(xué)習(xí)的通用能力局限,機器很難把看到過的場景泛化到一個全新陌生的環(huán)境,車在路上遇到未看過的場景就會“不知所措”。
要應(yīng)對這個行業(yè)痛點,AI商業(yè)評論認(rèn)為,主要有三種方法:
其一,通用人工智能(AGI)技術(shù)取得飛躍。谷歌、微軟以及商湯科技等前沿AI企業(yè)均在大力研發(fā)通用AI。
今年10月30日,谷歌人工智能主管Jeff Dean發(fā)文,稱他們正在研究下一代AI框架Pathways,目標(biāo)直指AGI。
僅不到一個月,11月17日,上海人工智能實驗室聯(lián)合商湯科技SenseTime、香港中文大學(xué)、上海交通大學(xué)共同發(fā)布了新一代通用視覺技術(shù)體系“書生”(INTERN),該體系旨在系統(tǒng)化解決當(dāng)下人工智能視覺領(lǐng)域中存在的任務(wù)通用、場景泛化和數(shù)據(jù)效率等一系列瓶頸問題。
微軟也于2019年向OpenAI投資10億美元,以支持構(gòu)建具有廣泛經(jīng)濟(jì)效益的通用人工智能技術(shù)(AGI)。
因為通用人工智能擁有強大的泛化能力,能做到“觸類旁通”,以少量的數(shù)據(jù)就可完成數(shù)據(jù)訓(xùn)練。
其二,為深度學(xué)習(xí)算法喂大量數(shù)據(jù),讓其準(zhǔn)確率達(dá)到自動駕駛上路要求。特斯拉今年8月份開始陸續(xù)拋棄毫米波雷達(dá),徹底選擇了純視覺技術(shù)路線,離不開其長期大量的數(shù)據(jù)積累和數(shù)據(jù)訓(xùn)練。特斯拉首席財務(wù)官Zachary Kirkhorn說,到目前為止,特斯拉已經(jīng)收集了超過1億英里的駕駛數(shù)據(jù)。算法與算力相輔相成,特斯拉的AI超算也排名世界前三。
其三,多傳感器融合方案,即視覺+激光雷達(dá)+毫米波雷達(dá)。視覺相當(dāng)于人的眼睛,但還有聽覺,多種感知結(jié)合能讓機器成為一個更健全的“人”。
馬斯克說的“視覺可以解決95%-99%的輔助駕駛場景”限定得很清楚,僅“輔助駕駛”場景。因為視覺無法應(yīng)對陽光直射、超低能見度情況,無法應(yīng)對,而通過多傳感器融合方案能有效提高自動駕駛魯棒性和應(yīng)對復(fù)雜場景的能力。
當(dāng)然,多傳感器融合方案也面臨一個很現(xiàn)實的問題:成本高。這也是馬斯克選擇純視覺方案的主要原因,定位于“做人人都買得起的電動車”。
數(shù)據(jù)很“香”,既近又遠(yuǎn)
數(shù)據(jù)是AI時代的生產(chǎn)資料,據(jù)市場預(yù)估,智能汽車生成數(shù)據(jù)的價值,到2030年,可能高達(dá)4500-7000億美元。但如何挖掘這些數(shù)據(jù)價值?
首當(dāng)其沖的難題是,數(shù)據(jù)標(biāo)準(zhǔn)化和共享。因為不同公司的傳感器數(shù)據(jù),包括位置、高度、角度這些初始參數(shù)都不同。比如寶馬的數(shù)據(jù)拿給一汽,完全沒法用。
而且,考慮隱私、網(wǎng)絡(luò)安全和保持競爭優(yōu)勢方面,企業(yè)通常不愿意與其他利益相關(guān)者共享這些數(shù)據(jù),包括測試、運營和客戶行為等各類數(shù)據(jù)。
車本身的E架構(gòu)(Electrical/Electronic Architecture,汽車電子電氣架構(gòu))也是一個問題。它是整合汽車內(nèi)各類傳感器、處理器、線束連接、電子電氣分配系統(tǒng)和軟硬件生成的總布置方案。過去絕大部分汽車的E架構(gòu)按照功能信號來設(shè)計的,做成了集成的通用平臺。今天智能車的E架構(gòu)融合了數(shù)據(jù)架構(gòu)和計算架構(gòu),但包括特斯拉在內(nèi)的企業(yè),都還未認(rèn)真考慮過數(shù)據(jù)架構(gòu)和計算架構(gòu),這將導(dǎo)致數(shù)據(jù)獲取成為一個隱藏的大問題。
據(jù)了解,一臺車每天能產(chǎn)生大概4000GB的數(shù)據(jù),如果是十萬臺甚至百萬臺,這些數(shù)據(jù)的傳輸?shù)皆贫说某杀揪蜁E升。所以最好的辦法,就是能夠在邊緣側(cè)處理數(shù)據(jù),將垃圾數(shù)據(jù)處理掉,把有效的特征點提取出來。
據(jù)希捷科技發(fā)布、國際數(shù)據(jù)公司(IDC)調(diào)研完成的《數(shù)據(jù)新視界:從邊緣到云,激活更多業(yè)務(wù)數(shù)據(jù)》報告稱,企業(yè)目前定期將大約36%的數(shù)據(jù)從邊緣傳輸?shù)胶诵?,兩年后,這一比例將增至57%。從邊緣立即傳輸?shù)胶诵牡臄?shù)據(jù)量將翻倍,從8%增長到16%。
自動駕駛還需解決數(shù)據(jù)分布“長尾問題”的任務(wù),時而出現(xiàn)的corner case(極端情況)是對數(shù)據(jù)驅(qū)動的算法模型進(jìn)行升級的來源之一。
打造數(shù)據(jù)閉環(huán)是繞不過去的坎。以谷歌waymo報告提到的數(shù)據(jù)閉環(huán)平臺為例,它包括數(shù)據(jù)挖掘、主動學(xué)習(xí)、自動標(biāo)注、自動化模型調(diào)試優(yōu)化、測試校驗和部署發(fā)布。打通這些全鏈路,才能讓數(shù)據(jù)高效、高質(zhì)回流。
云計算是打通數(shù)據(jù)閉環(huán)的基礎(chǔ),它在資源管理調(diào)度、數(shù)據(jù)批處理/流處理、工作流管理、分布式計算、系統(tǒng)狀態(tài)監(jiān)控和數(shù)據(jù)庫存儲等方面提供了數(shù)據(jù)閉環(huán)的基礎(chǔ)設(shè)施支持,比如亞馬遜AWS、微軟Azure和谷歌云等。
騰訊自動駕駛總經(jīng)理蘇奎峰說:“自動駕駛的核心競爭力在于數(shù)據(jù)要素和計算資源的低成本獲取和高效利用。對數(shù)據(jù)要素進(jìn)行高效收集和利用,提高數(shù)據(jù)循環(huán)鏈路的速度,是整個自動駕駛技術(shù)迭代的關(guān)鍵點。”
倫理治理:短期阻力,長期助力
100多年前,當(dāng)機動車替代馬車的時候,就有過安全相關(guān)的爭論:機動車會不會驚嚇到馬?
對此英國出臺了一個“紅旗法”,一個車有三個人開,一個人燒鍋爐,一個人駕駛,還有一個人在這個車前面50多米的地方拿著紅旗揮動,告訴別人有個危險物過來了,這個法案一直沿用了30多年才被取消。可見,公眾對于一個新事物的恐懼與認(rèn)知有一個長期接受的過程。
想象一下完全自主的自動駕駛汽車的未來。你的自動駕駛汽車接近紅綠燈,但突然剎車失靈,計算機不得不在瞬間做出決定。它可以突然轉(zhuǎn)向附近的桿子并殺死乘客,或者繼續(xù)前進(jìn)并殺死前方的行人。
而控制汽車的計算機只能通過訪問汽車傳感器收集的有限信息,并且必須基于此做出決定。盡管這看起來很戲劇化,但距離我們可能面臨這樣的困境只有幾年的時間了。
這也是我們看到特斯拉大力推動輔助駕駛汽車,但尚未生產(chǎn)全自動駕駛汽車的核心原因之一。
另一個是數(shù)據(jù)安全問題。
近年來,我國大力加強數(shù)據(jù)監(jiān)管,發(fā)布了一系列具有里程碑意義的法規(guī),網(wǎng)絡(luò)安全法(CSL)、數(shù)據(jù)安全法(DSL)和個人信息保護(hù)法(PIPL)形成了監(jiān)管基礎(chǔ)。
為了提高技術(shù)安全性并保護(hù)用戶數(shù)據(jù)和國家安全,智能汽車企業(yè)正受到越來越多的審查和更嚴(yán)格的監(jiān)管。
2021年5月,國家互聯(lián)網(wǎng)信息辦公室(CAC)開始就《車輛數(shù)據(jù)安全管理若干規(guī)定》(以下簡稱“規(guī)定”)的一套試行規(guī)定征求意見,該規(guī)定概述了智能網(wǎng)聯(lián)汽車制造商和運營商保護(hù)汽車安全的新要求。
《規(guī)定》將“個人信息”定義為來自任何利益相關(guān)者的信息,包括車主、司機、乘客和行人,以及任何可以從中推斷出利益相關(guān)者的個人身份或描述其個人行為的信息。
誠然,企業(yè)已經(jīng)面臨遵守新法規(guī)的壓力。包括特斯拉、福特和寶馬在內(nèi)的幾家外國汽車制造商都在中國建立了數(shù)據(jù)中心,用于存儲從中國用戶那里收集的數(shù)據(jù),以符合數(shù)據(jù)法規(guī)。
但是,由于政府也急于發(fā)展自動駕駛產(chǎn)業(yè),仍然不太可能監(jiān)管到嚴(yán)重阻礙發(fā)展的程度。從長期來看,更強大的數(shù)據(jù)安全管理和治理也可能有助于提升行業(yè)形象,引導(dǎo)行業(yè)朝著更高安全性和可靠性的方向發(fā)展。