物聯(lián)網(wǎng)領域正涌入大批不領工資的“數(shù)據(jù)科學家”

TinyML是指在毫瓦(mW)功率范圍以下的設備上,實現(xiàn)機器學習的方法、工具和技術。這里的關鍵詞是“毫瓦功率范圍以下的設備”。TinyML功耗極低,不僅適用于邊緣硬件,還可用于物聯(lián)網(wǎng)終端設備,支持各種不同的電池驅動的設備,和需要始終在線的應用。最近TinyML與AutoML正在快速融合,構建嵌入式自動化機器學習算法,發(fā)揮更大的效力。

AIoT智聯(lián)網(wǎng)是AI(人工智能)和IoT(物聯(lián)網(wǎng))技術在實際應用中的落地融合。近年來,智聯(lián)網(wǎng)AIoT一詞熱度劇增,她正在以極快的速度從襁褓中的嬰兒長大成人。

昨天,All inAIoT還是單個企業(yè)的市場宣言;今天,AIoT in All已經(jīng)成為各行各業(yè)嘗試轉型以及尋找下一增長點的主力。

根據(jù)中國信息通信研究院統(tǒng)計預測數(shù)據(jù)顯示,2020年全球人工智能市場將達到6800億元人民幣。據(jù)研究機構Markets and Markets在2019年發(fā)布的報告稱,2019年全球AIoT市場規(guī)模為51億美元。到2024年,這一數(shù)字將增長至162億美元,復合年增長率為26.0%。

AIoT的成熟,一方面需要企業(yè)的重視與投入,另一方面需要技術的支撐與迭代。上周,我們談到阿里投百億加速AIoT布局的“大手筆”;這周,我們來看看AIoT的領域吹起的技術“新風向”。

在文章《一文讀懂即將引爆的TinyML:在邊緣側實現(xiàn)超低功耗機器學習》中,我曾經(jīng)介紹過一個新趨勢:TinyML,并提到將會持續(xù)追蹤TinyML的進展。

TinyML是指在毫瓦(mW)功率范圍以下的設備上,實現(xiàn)機器學習的方法、工具和技術。這里的關鍵詞是“毫瓦功率范圍以下的設備”。TinyML功耗極低,不僅適用于邊緣硬件,還可用于物聯(lián)網(wǎng)終端設備,支持各種不同的電池驅動的設備,和需要始終在線的應用。

這些設備包括智能攝像頭、遠程監(jiān)控設備、可穿戴設備、音頻采集硬件以及各種傳感器等…TinyML是一個新興領域,是快速增長的機器學習技術和應用,是一片巨大的、未被充分開發(fā)的藍海。

最近TinyML與AutoML正在快速融合,構建嵌入式自動化機器學習算法,發(fā)揮更大的效力。

AutoML全稱是Automated Machine Learning,自動化機器學習,這是2014年以來,機器學習和深度學習領域最炙手可熱的領域之一。

我們都知道,機器學習的應用需要大量的人工干預,這些人工干預表現(xiàn)在:特征提取、模型選擇、參數(shù)調節(jié)等各個方面。AutoML試圖將這些與特征、模型、優(yōu)化、評價有關的重要步驟進行自動化地學習,使得機器學習模型無需人工干預即可被應用。

就在今年3月,谷歌證明了AutoML可以走得更遠。根據(jù)谷歌已將代碼開源的AutoML-Zero,如今有可能僅使用基本的數(shù)學運算作為構建塊,就可以自動“進化”為完整的機器學習算法。

因此本文將介紹TinyML與AutoML相結合的最新進展,值得你關注的包括:

TinyML與AutoML“攜手”的最大價值體現(xiàn)在哪里?

嵌入式自動化機器學習算法的具體應用場景有哪些?

這個領域的初創(chuàng)公司和各類資源的情況如何?

01

TinyML+ AutoML的價值何在?

21世紀最性感的工作是什么?

你可能已經(jīng)腦補了五花八門的答案,但《哈佛商業(yè)評論》(Harvard Business Review)認為是“數(shù)據(jù)科學家”。HBR在文章中寫道,“如果‘性感’意味著擁有非常搶手的稀有品質,那么數(shù)據(jù)科學家就是。”

數(shù)據(jù)科學家很難招到、工資很高、更難留住,這也許是每個試圖嘗試AI應用的物聯(lián)網(wǎng)企業(yè)都會頭疼的問題。

數(shù)據(jù)顯示,在2018年,初級數(shù)據(jù)科學家的平均工資為11.5萬美元/年,能夠管理10至15人團隊的數(shù)據(jù)科學家則可以拿到35萬美元的年薪。

2019年,全球對數(shù)據(jù)科學家的需求量是供應量的1.5倍。超過40%的公司認為招聘不到數(shù)據(jù)科學家是嚴重阻礙他們競爭力的原因之一。超過60%的公司試圖通過內(nèi)部培訓,讓現(xiàn)有員工變身成為數(shù)據(jù)科學家。

在物聯(lián)網(wǎng)領域,數(shù)據(jù)科學家除了稀有,還面臨另一個問題:在物聯(lián)網(wǎng)終端,很多AI絕技無法施展。分布最廣的物聯(lián)網(wǎng)設備往往體積很小、電量有限。它們被作為終端硬件,通過嵌入式傳感器采集各種數(shù)據(jù);計算能力有限,對功耗極為敏感。物聯(lián)網(wǎng)領域占比超過95%以上,都是需要超低功耗、占用極少存儲空間、完成實時數(shù)據(jù)處理的場景。能夠在這類設備上實現(xiàn)機器學習的人才,更是精英中的高階精英。

TinyML與AutoML“攜手”,就是試圖讓物聯(lián)網(wǎng)領域的機器學習,突破人才稀缺和硬件受限的掣肘,讓機器學習算法在物聯(lián)網(wǎng)終端自我進化,讓非技術人員可以輕松的使用人工智能進行數(shù)據(jù)分析,讓原本“物以稀為貴”的機器學習以親民的方式“飛入百姓家”。

TinyML在《一文讀懂即將引爆的TinyML:在邊緣側實現(xiàn)超低功耗機器學習》中已有詳細介紹,此處重點來說AutoML。

02

什么是AutoML?

為了更好的理解AutoML,清華校友翟偉所在公司Qeexo通過一個有趣的對比進行了解釋。

在某種程度上,人工智能與印刷術非常相似,它們的誕生都是人類歷史上的巨大轉折,而且演進過程也有一定的可比性。

印刷術發(fā)明之前,文化的傳播主要靠手抄的書籍。手抄費時、費事,又容易抄錯、抄漏,既阻礙了文化的發(fā)展,又給文化的傳播帶來不應有的損失。

就像在人工智能誕生之前,工程師們要自己寫計算程序完成數(shù)據(jù)分析,不僅效率低而且有可能存在很多誤判。

印章和石刻給印刷術提供了直接的經(jīng)驗性啟示,用紙在石碑上墨拓的方法,直接為雕版印刷指明了方向。

雕版印刷的版料,一般選用紋質細密堅實的木材,然后把木材鋸成一塊塊木板,把要印的字寫在薄紙上,反貼在木板上,再根據(jù)每個字的筆劃,用刀一筆一筆雕刻成陽文,使每個字的筆劃突出在板上。木板雕好以后,就可以印書了。

就像在人工智能的初始階段,工程師們?yōu)槊總€用例,從零開始寫機器學習的代碼,一個用例對應一塊“雕版”,在不同用例之間代碼很難重復利用,靈活性差、對工程師的技藝要求高。

活字制版避免了雕版的不足,只要事先準備好足夠的單個活字,就可隨時拼版,大大地加快了制版時間?;钭职嬗⊥旰?,可以拆版,活字可重復使用,且活字比雕版占有的空間小,容易存儲和保管。這樣活字的優(yōu)越性就表現(xiàn)出來了。

就像隨著人工智能的發(fā)展,工程師們開始使用解耦的思維,使用現(xiàn)有的機器學習模塊與框架活用拼湊AI。這個階段開發(fā)一個上手的應用或許很簡單,但是要開發(fā)真正的產(chǎn)品卻很難,需要一個團隊的專業(yè)人士,花費幾個星期的時間完成。

而現(xiàn)在,我們每個人都知道如何使用電腦打字,并使用打印機將文稿印出。

AutoML就是試圖將人工智能也帶入到同樣階段的做法,讓一位非專業(yè)人士,花費幾分鐘的時間,即可完成多個人工智能模型。在這個階段,合適的AutoML工具是關鍵。

谷歌最近發(fā)布了一篇論文名為《AutoML-Zero:從零開始的自動機器學習》,AutoML-Zero:Evolving Machine Learning Algorithms From Scratch。

AutoML-Zero這個名字難免讓人產(chǎn)生聯(lián)想。當年AlphaGo戰(zhàn)勝了人類最強棋手,但前提是它先學會了人類棋譜,離不開人類指導。接著谷歌又推出了AlphaGo Zero,只讓AI知道圍棋規(guī)則,從零開始學下棋,結果再次登上棋藝頂峰。

AutoML-Zero似乎想要證明,既然AI能從零學習圍棋,也可以從零開始摸索機器學習算法。

谷歌這篇論文的全文可以通過文末的提示下載閱讀。

現(xiàn)在谷歌已將AutoML-Zero的開源程序提交到GitHub,普通電腦只需5分鐘就能體驗一下它的實際效果。GitHub網(wǎng)址:

https://github.com/google-research/google-research/tree/master/automl_zero

03

應用場景有哪些?

目前一些智能可穿戴設備,包括智能耳機和智能手表已經(jīng)在使用相關技術。通過加速度傳感器和陀螺儀輔以相應的嵌入式自動化機器學習算法,可以更好的分析用戶行為,并且支持自定義手勢創(chuàng)建、情境感知、活動分類、步態(tài)分析,提供更加貼合用戶自身的服務。

智能家居也是應用場景之一。智能水壺和智能灶臺可以通過聲學傳感器和算法,檢測水是否燒開、燒開的水是否溢出、壺和鍋的溫度有沒有過高。還可以監(jiān)測智能微波爐中的玉米花是否爆開,以便及時關閉設備。

當然,你也許會想,這些場景都是“小兒科”,只有在最復雜的工業(yè)場景中實現(xiàn)應用,才能驗證“TinyML+AutoML”嵌入式自動化機器學習算法真正有效。如你所料,有些企業(yè)正在將嵌入式機器學習自動算法用于預測性維護。

對于預測性維護(PDM)的發(fā)展階段進行簡單劃分,可分為4個階段:

PDM 1.0—反應性維護:當問題出現(xiàn)時再來解決它,例如救火。

PDM 2.0—預防性維護:包括外觀檢測,以及能夠提供更具體、更客觀的有關機器或系統(tǒng)狀況相關信息的定期資產(chǎn)檢測。

PDM 3.0—基于規(guī)則的預測性維護:也就是“狀態(tài)監(jiān)測”。傳感器持續(xù)收集來自設備的數(shù)據(jù),并根據(jù)預先設定的規(guī)則,包含在預先設定的臨界值出現(xiàn)時發(fā)出警報。

PDM 4.0—基于機器學習的預測性維護:依靠大量的歷史數(shù)據(jù)或者測試數(shù)據(jù),結合為不同情境定制的機器學習算法,預測錯誤出現(xiàn)的時間和位置,然后發(fā)出警報。

PDM 4.0是通過先進的分析技術對資產(chǎn)的技術條件、使用、環(huán)境、維修歷史、其他類似設備以及任何可能與之相關的大數(shù)據(jù)進行分析,預測未來將會發(fā)生的故障,并最終制定出最有效的預防措施。

在這個過程中,聽聲能力很重要,就像維護維修專家能夠通過汽車引擎的聲音,來診斷車輛的問題一樣,工業(yè)設備如果擁有了一雙遠程的“順風耳”,結合振動分析,就可以讓PDM方案更精確。聲音同樣還能被用于診斷液體泄露、管道腐蝕和液位測量。

PDM4.0還面臨一個規(guī)?;瘧玫木骄?,由于每個設備的安裝條件、載重性能和外部環(huán)境都不相同,單一的AI模型可能無法在類似的電機上批量復制。

TinyML+AutoML使用時間序列傳感器,包括模擬和數(shù)字麥克風,可以自適應的創(chuàng)建AI模型。通過聲音傳感與分析,有助于識別預測性維護應用的問題。

04

初創(chuàng)公司&各類資源

關于TinyML+AutoML,有很多現(xiàn)成的工具和軟件可以使用,物聯(lián)網(wǎng)企業(yè)不需要招聘昂貴的數(shù)據(jù)科學家,也不需要擴充團隊,就可以初步嘗試。

這里介紹比較有代表性的初創(chuàng)公司和資源,包括QEEXO、MindsDB和Cartesiam。

QEEXO

這家公司成立于2012年,總部位于加利福尼亞州山景城,機器學習的研發(fā)團隊位于賓夕法尼亞州匹茨堡,在北京和上海擁有工程師團隊。

目前已經(jīng)有260多種硬件平臺,超過3億臺設備,搭載了QEEXO的機器學習引擎。

知名的包括在華為手機中嵌入的指關節(jié)操作技術。

指關節(jié)操作功能通過使用指關節(jié)在屏幕上敲擊或勾畫,快速調用系統(tǒng)功能,支持利用指關節(jié)雙擊全屏截屏、敲擊并畫圈局部截屏、敲擊并畫字母S滾動截屏、雙指關節(jié)雙擊錄屏、直線分屏等5種手勢操作。今年5月,榮耀發(fā)布了新機榮耀X10,指關節(jié)操作功能首次下放給了“千元機”。

QEEXO與瑞薩電子等領先硬件廠商進行合作,完成了多種硬件的適配。QEEXO可支持Arm Cortex – M0到M4核的單片機,如瑞薩RA6M3組單片機產(chǎn)品。

據(jù)悉,QEEXO的自動機器學習算法將在亞馬遜AWS上架,以SaaS年度訂閱的方式提供服務,并將在下周周一,6月8日進行全球商用版Qeexo AutoML的正式發(fā)布。

MindsDB

MindsDB公司成立于2017年,總部位于加利福尼亞州伯克利,源自美國加州大學伯克利分校的研究項目,其同名服務已在GitHub上發(fā)布開源版本。GitHub網(wǎng)址:

https://github.com/mindsdb/mindsdb#mindsdb

最近MindsDB完成了一筆300萬美元的融資,用于擴充團隊和驗證商業(yè)模式。

Cartesiam

Cartesiam公司創(chuàng)立于2016年,總部位于法國土倫,商務運營中心位于巴黎和紐約,主要實現(xiàn)讓普通的ARM微控制器都能運行的無監(jiān)督學習AI。

今年2月,Cartesiam發(fā)布了一個名為NanoEdge AI Studio的軟件系統(tǒng),該系統(tǒng)能夠安全地生成AI算法,并且生成的算法只需兩分鐘就可在ARM微處理器上運行,容量大小僅為4~16KB RAM。

法國的工業(yè)電子制造商Eolane與Cartesiam合作推出了一款名為Bob Assistant的溫度/振動傳感器,主要用于預測工業(yè)維修。目前,該解決方案已經(jīng)被許多歐洲客戶所采用,成為首個大規(guī)模部署的工業(yè)4.0預測性維護解決方案。

5月19日,Cartesiam發(fā)布了針對STM32開發(fā)板優(yōu)化的新版NanoEdge AI Studio軟件工具。STM32是意法半導體開發(fā)的微控制器。新版提供一個新的硬件平臺選項,讓開發(fā)者可以直接選擇意法半導體的Nucleo-F401RE或Nucleo-L432KC開發(fā)板。在選擇之后,用戶可以解鎖設計流程的最后一步,下載可在所選硬件平臺上立即運行的自定義機器學習庫。

----寫在最后----

看似微小的TinyML和自我進化的AutoML蘊含大機會,物聯(lián)網(wǎng)企業(yè)需要轉變的首先是思維,積極擁抱和勇于嘗試,或許就會開辟一番新天地。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論