猶記2016年,我在漢諾威參加德國(guó)漢諾威消費(fèi)電子、信息及通信博覽會(huì)(CEBIT)時(shí),我發(fā)現(xiàn)會(huì)上充斥著的那些所謂“智能”的東西并不怎么“智能”—— 它們的功能幾乎都只是將兩個(gè)設(shè)備鏈接起來,并且在大多數(shù)情況下,僅僅提供單一的用途,用戶效益十分有限。
例如:可以遠(yuǎn)程監(jiān)控、“開、關(guān)”的管道閥門、能夠辨別運(yùn)送司機(jī)是否偷運(yùn)燃料的汽油體積測(cè)量裝置、通過wi-fi控制電源插頭。
然而,在CEBIT大會(huì)上,真正給我留下深刻印象的是IBM展示的一項(xiàng)研究項(xiàng)目SyNAPSE。這影響了我對(duì)未來人工智能發(fā)展的看法。SyNAPSE項(xiàng)目旨在開發(fā)一種人工智能芯片“TrueNorth”——它能提供相當(dāng)于螞蟻大腦的計(jì)算能力,同時(shí)只消耗73毫瓦的能量。不過,這在當(dāng)時(shí)每一個(gè)元件需要耗費(fèi)100萬美元。
這意味著將人工智能與邊緣計(jì)算結(jié)合起來是可能的。同樣,要不了幾年“摩爾定律”也將會(huì)失效。問題只在于多久能夠?qū)崿F(xiàn),以及多少其他類似的解決方案會(huì)出現(xiàn)在市場(chǎng)上?早在2016年,Neuron soundware已經(jīng)開始采取物聯(lián)網(wǎng)戰(zhàn)略——在網(wǎng)絡(luò)邊緣運(yùn)行人工智能算法——并且決定開發(fā)自己的具有錄音和人工智能處理功能的物聯(lián)網(wǎng)邊緣設(shè)備。
幾個(gè)月后,我根據(jù)能量消耗和智能計(jì)算之間的關(guān)系制作了一張圖表。
這顯示了智能與能耗的相關(guān)性。
●只有幾毫瓦,不可能以合理的價(jià)格達(dá)到智能;
●智能手機(jī)的能量消耗為幾瓦,并且可以為基本的人工智能提供足夠的計(jì)算能力——每隔一秒左右從圖像中識(shí)別目標(biāo);
●限制領(lǐng)域人工智能(narrow AI),比如駕駛汽車的能力,需要消耗幾十或幾百瓦的電力。
用于分析的攝像機(jī)每秒輸入10次左右,大約需要每秒4 萬億次浮點(diǎn)運(yùn)算。
所以,想要用相同的計(jì)算性能來駕駛汽車或按順序分析機(jī)器聲音從而檢測(cè)潛在的機(jī)械故障。完成這兩個(gè)工作都需要相當(dāng)于螞蟻大腦的計(jì)算能力。IBM推出的ultra-low-energy-consuming芯片,讓我看到了實(shí)現(xiàn)這種能力的可能。
邊緣計(jì)算的興起
從那時(shí)起,邊緣計(jì)算能力一直在提高。
2017年,為了擴(kuò)展低性能的計(jì)算設(shè)備,Movidius神經(jīng)計(jì)算棒以低于100美元的價(jià)格,僅需0.5W的電量便能進(jìn)行每秒一千億次浮點(diǎn)計(jì)算。
2018年,華為推出了麒麟980處理器,在0.1W的電量下可以完成每秒五千億次的浮點(diǎn)計(jì)算。其他供應(yīng)商緊隨其后。谷歌發(fā)布了Edge TPU Units,瑞芯微(Rockchip)公布了RK3399。這兩個(gè)約每秒能夠處理3萬億次浮點(diǎn)計(jì)算,成本在100美元左右。
2019年,帶有人工智能技術(shù)硬件加速器(特別是神經(jīng)網(wǎng)絡(luò))的特定微型計(jì)算機(jī)得到普遍使用。所有關(guān)鍵的硬件廠商都陸續(xù)發(fā)布了AI軟件棧的邊緣優(yōu)化版本,這進(jìn)一步提高了性能。目前,一般使用的AI板有,谷歌的Edge TPU——使用專門的ASIC芯片制作而成用以處理AI的預(yù)測(cè)推理功能。價(jià)格低于100美元的英偉達(dá)Jetson Nano 配備了128個(gè)英偉達(dá)CUDA核心。瑞芯微發(fā)布的 RK3399 Pro——第一個(gè)帶有神經(jīng)網(wǎng)絡(luò)處理器的開發(fā)板(其性能甚至略優(yōu)于英偉達(dá)Jetson Nano)。
物聯(lián)網(wǎng)技術(shù)的大幅提高讓我們得以發(fā)展nBox——這款邊緣計(jì)算設(shè)備不僅能夠借助多達(dá)12個(gè)通道記錄高質(zhì)量音頻,并且還可以通過邊緣計(jì)算實(shí)現(xiàn)人工智能。所謂邊緣計(jì)算,是指大多數(shù)處理過程將通過本地設(shè)備實(shí)現(xiàn)而無需交由云端完成。
隨著英特爾(Intel)以約4億美元收購(gòu)Movidius,以及超過133.8億歐元收購(gòu)自動(dòng)汽車芯片制造商Mobileye,邊緣計(jì)算的重要性變得顯而易見。
特斯拉汽車公司(Tesla Motors)在網(wǎng)上展示了他們?yōu)槠渥詣?dòng)駕駛汽車特意打造的AI高性能計(jì)算機(jī)——每秒能夠完成36萬億次浮點(diǎn)計(jì)算,這足以每秒處理汽車攝像頭中2000多張高分辨率圖像,特斯拉表示這它的性能完全能夠?qū)崿F(xiàn)自動(dòng)駕駛。
邊緣計(jì)算四個(gè)主要優(yōu)勢(shì)
1、安全:所有處理過的數(shù)據(jù)都可以存儲(chǔ)在本地,并且有嚴(yán)格的控制。
2、速度:人工智能推理系統(tǒng)能夠以毫秒為單位處理輸入,這意味著最小的延遲。
3、效益:嵌入式微型計(jì)算機(jī)功耗低,價(jià)格實(shí)惠。
4、離線:由于人工智能算法部署位置的特殊性,不需要占用太多的網(wǎng)絡(luò)寬帶。
邊緣計(jì)算相對(duì)于5G,優(yōu)勢(shì)何在?
也許你會(huì)問為什么這么多的硬件廠家如此大費(fèi)周章?為什么不坐等5G網(wǎng)絡(luò)或者利用豐富的云計(jì)算能力和基礎(chǔ)設(shè)施?以下是一些答案。
●想象一下,你正坐在一輛自動(dòng)駕駛汽車?yán)?,汽車突然斷開了5G網(wǎng)絡(luò)。這時(shí),汽車不僅會(huì)“失明”,而且會(huì)喪失決策能力。當(dāng)高帶寬和低延遲通信所需的計(jì)算能力實(shí)際上與一個(gè)額外的神經(jīng)處理單元的成本相同時(shí),為什么要冒這個(gè)風(fēng)險(xiǎn)呢?此外,它的總體耗能還會(huì)比利用特定硬件實(shí)現(xiàn)人工智能預(yù)測(cè)來的要高。
●移動(dòng)互聯(lián)網(wǎng)提供商希望將投資套現(xiàn)用于開發(fā)和部署5G網(wǎng)絡(luò)。盡管在技術(shù)上可能實(shí)現(xiàn)無限制大容量數(shù)據(jù)計(jì)劃,但它們并不會(huì)很快投入商業(yè)使用。例如,nBox有12個(gè)聲學(xué)傳感器,每個(gè)月可以產(chǎn)生多達(dá)1 TB的音頻數(shù)據(jù)。按照LTE目前每GB的價(jià)格,將這么多數(shù)據(jù)傳輸?shù)皆朴?jì)算將花費(fèi)一大筆錢。
●網(wǎng)絡(luò)覆蓋將主要建立在城市,這意味著其他很多地方接受不到5G信號(hào)。與此相反,邊緣計(jì)算設(shè)備可以隨即部署到任何需要的地方,只需要一次性的成本投入,并且這通常不會(huì)顯著增加物聯(lián)網(wǎng)解決方案的成本。
邊緣計(jì)算與人工智能相結(jié)合使得在本地處理大量數(shù)據(jù)成為可能。硬件加速器的額外成本其實(shí)微不足道。另外,神經(jīng)網(wǎng)絡(luò)的計(jì)算性能正以每年10倍左右的速度提高,并且,由于數(shù)據(jù)可以并行處理,這一趨勢(shì)似乎沒有放緩。
未來“觸手可及”
邊緣計(jì)算在自動(dòng)駕駛汽車、人臉識(shí)別、預(yù)見性維護(hù)等方面的應(yīng)用只是一個(gè)開始。我們很快就會(huì)有足夠的計(jì)算能力來制造出真正獨(dú)立運(yùn)行的機(jī)器。它們將能夠安全地在城市,工廠里運(yùn)行,甚至像人類一樣勝任它們的工作。令人難以置信的是,捷克作家Karel ?apek早在一個(gè)世紀(jì)前就預(yù)見了這一點(diǎn)。到2020年,其科幻作品中出現(xiàn)的“機(jī)器人”一詞已經(jīng)是100年前的事情了。
他對(duì)“類人機(jī)器人”的設(shè)想很快傳遍了全世界。在這部科幻小說中,機(jī)器人擁有自我意識(shí),并且能夠獲得類似于“愛”的感情??v觀計(jì)算機(jī)性能提高的速度以及其他物聯(lián)網(wǎng)的迅猛發(fā)展,我認(rèn)為Karel ?apek設(shè)想的實(shí)現(xiàn)將比我們預(yù)期的還要快。
本文翻譯自medium。