隨著工具和基礎(chǔ)設(shè)施的成熟,應(yīng)用人工智能不斷加速發(fā)展。將這些基礎(chǔ)設(shè)施與強(qiáng)大的人才庫(kù)和熱情、隨時(shí)可獲得的資本以及客戶(hù)采用人工智能 / 機(jī)器學(xué)習(xí)的高度意愿結(jié)合起來(lái),你就有了一些特別的東西。我們正在邁向一個(gè)新的十年,在這個(gè)十年里,人工智能 / 機(jī)器學(xué)習(xí)將以更快的速度為消費(fèi)者和企業(yè)創(chuàng)造真正的價(jià)值。
定義術(shù)語(yǔ)
應(yīng)用人工智能 :任何與將人工智能研究從實(shí)驗(yàn)室?guī)У接美?,以及兩者之間的一切有關(guān)的事情。從基礎(chǔ)設(shè)施和工具,到硬件,到工業(yè)中的部署面,再到模型本身,從人工智能研究的前沿到用例,都需要共同努力才能取得尖端進(jìn)展。在我們這個(gè)領(lǐng)域中,成熟度的一個(gè)很好的檢驗(yàn)標(biāo)準(zhǔn),就是看一個(gè)新的進(jìn)步從紙上到生產(chǎn)所需的時(shí)間。就在幾年前,你還可以瀏覽該領(lǐng)域的一些主要進(jìn)展,并努力尋找真正的用例;這種情況正迅速開(kāi)始改變。
一些選擇例子:
神經(jīng)網(wǎng)絡(luò)研究實(shí)現(xiàn)自動(dòng)駕駛汽車(chē)(Tesla、Cruise、Waymo 等)。
像 BERT 和 GPT-2/3 這樣的自然語(yǔ)言處理改進(jìn)了搜索和助理(Google Search、Siri、Google Assistant、SoundHound、Clinc)。
強(qiáng)化學(xué)習(xí)幫助許多公司實(shí)現(xiàn)人工智能在工業(yè)機(jī)器人領(lǐng)域許下的崇高承諾(Covariant、FogHorn、Rethink)。
用于欺詐檢測(cè)和消費(fèi)者結(jié)果的機(jī)器學(xué)習(xí)幫助銀行、信用卡和貸款機(jī)構(gòu)限制欺詐和管理風(fēng)險(xiǎn)(銀行、信用卡、Verifi、Ravelin、Stripe 的反欺詐部門(mén))。
生成對(duì)抗網(wǎng)絡(luò)可以生成新鮮的內(nèi)容、逼真的面孔并提高照片質(zhì)量(generated.photos、rosebud.ai、RunwayML)。
從研究到生產(chǎn),需要的遠(yuǎn)不止是一個(gè)模型。要使這些東西發(fā)揮作用,需要在研究和工程兩方面的努力齊頭并進(jìn)。它需要硬件,需要可擴(kuò)展的主機(jī),需要 DevOps,需要強(qiáng)大的數(shù)據(jù)科學(xué),等等。值得慶幸的是,越來(lái)越多的初創(chuàng)公司正在為每個(gè)構(gòu)建塊構(gòu)建解決方案,隨著越來(lái)越多的工具開(kāi)源,大公司(如 Uber 和 Netflix)也加入其中。
我們將會(huì)記住那些發(fā)明了新模型的全明星人物們,但是那些將其全部轉(zhuǎn)化為生產(chǎn)代碼的工程師們,那些為你創(chuàng)建下一個(gè)數(shù)據(jù)集的標(biāo)注員們,以及那些聲嘶力竭地反對(duì)違反安全和人權(quán)的抗議民眾,都應(yīng)該記住他們?cè)谶@一領(lǐng)域所做的貢獻(xiàn)。
為什么是現(xiàn)在?
我們看到人工智能用例的巨大機(jī)會(huì)正在各個(gè)行業(yè)涌現(xiàn)。隨著工具和基礎(chǔ)設(shè)施的成熟,任何可以編寫(xiě)幾行代碼的人,都可以獲得新機(jī)會(huì)。無(wú)論是對(duì)現(xiàn)有市場(chǎng)的破壞,還是對(duì)新市場(chǎng)的創(chuàng)造,都是由采用驅(qū)動(dòng)的。
我們已經(jīng)看到機(jī)器學(xué)習(xí)在搜索引擎、信用卡欺詐檢測(cè)、智能手機(jī)攝像頭以及現(xiàn)代市場(chǎng)的激增。隨著傳統(tǒng)公司投資于使用機(jī)器學(xué)習(xí)來(lái)擴(kuò)充他們的產(chǎn)品和流程所需的工具和團(tuán)隊(duì),我們開(kāi)始看到越來(lái)越多的 企業(yè)采用 這一方法。
在本文中,我們不僅將介紹人工智能是如何使我們喜愛(ài)的產(chǎn)品和特性在數(shù)字世界中得以實(shí)現(xiàn)的,還將探索應(yīng)用人工智能是如何改變工作流程、創(chuàng)造新機(jī)會(huì),以及如何在制造業(yè)、建筑業(yè)、供應(yīng)鏈和商業(yè)領(lǐng)域等解放勞動(dòng)力的。我們將深入探討這一領(lǐng)域的當(dāng)前趨勢(shì),同時(shí)也會(huì)對(duì)事物的發(fā)展方向持某些立場(chǎng)。
通常,我們可以識(shí)別出由某種新技術(shù)或新事件促成的創(chuàng)新浪潮。在過(guò)去的十年里,我們看到了人工智能的拐點(diǎn),將我們從一堆炒作變成了真正的用例,從而推動(dòng)了整個(gè)行業(yè)的價(jià)值。
那么,為什么現(xiàn)在是人工智能 / 機(jī)器學(xué)習(xí)新一波價(jià)值浪潮的拐點(diǎn)?
●工具和基礎(chǔ)設(shè)施的成熟
●規(guī)?;?xùn)練和服務(wù)的可及性
●作為 API 的大型模型
●繼續(xù)獲得風(fēng)險(xiǎn)資本、研究資助和政府利益
●工具和基礎(chǔ)設(shè)施的成熟
隨著最佳實(shí)踐、工具和基礎(chǔ)設(shè)施開(kāi)始成熟,可及性也在顯著增加。在基礎(chǔ)設(shè)施和工具方面,高級(jí)團(tuán)隊(duì)或大型開(kāi)放元嗎工作仍然是常態(tài)。在實(shí)際應(yīng)用中,我們看到了由初級(jí)工程師、初出茅廬的統(tǒng)計(jì)學(xué)家和企業(yè)家創(chuàng)建的成功初創(chuàng)公司,他們?cè)敢庠谀嗌持泻Y選,以使他們的應(yīng)用發(fā)揮作用。同時(shí),也請(qǐng)向那些有意參與這一波機(jī)會(huì)浪潮的 MBA 們問(wèn)好。
此外,人才的涌入、更好的課程和培訓(xùn)計(jì)劃,以及整個(gè)運(yùn)動(dòng)背后的大肆宣傳,使得聘請(qǐng)一名優(yōu)秀的數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)工程師不再是一項(xiàng)外層空間的任務(wù)。正因?yàn)橛辛烁玫墓ぞ撸瑪?shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師才可以做得更專(zhuān)業(yè)、更深入,而且非常高效。而且,大多數(shù) MVP 可以用現(xiàn)成的模型或者使用 Scikit-Learn、Keras 之類(lèi)的美觀且易于訪問(wèn)的庫(kù)來(lái)構(gòu)建。我們可以開(kāi) clf.fit() 的所有玩笑,但事實(shí)上,只需幾行代碼就可以構(gòu)建出真正有價(jià)值的實(shí)際模型,這是一件好事。當(dāng)一個(gè)領(lǐng)域的自身成員開(kāi)始炮轟所有的“冒牌工程師”和“假數(shù)據(jù)科學(xué)家”時(shí),他們真正想說(shuō)的是“ 我很惱火,以前我需要幾周才能完成的工作,現(xiàn)在小菜鳥(niǎo)只用幾個(gè)小時(shí)就能做出來(lái),豈有此理!”
而硬件的獲取,不再是一個(gè)障礙。對(duì)于有進(jìn)取心的個(gè)人來(lái)說(shuō),有大量的免費(fèi)計(jì)算時(shí)間可用。早期的 MVP 以前可能需要一些引導(dǎo)或天使的幫助,大多數(shù)非研究性的想法都可以起步,主要的障礙因素是數(shù)據(jù)的獲取。這是一件 非常好的事情 。值得慶賀的是,訓(xùn)練模式的主要障礙不再是小眾技能或訪問(wèn)昂貴的基礎(chǔ)設(shè)施了。
我們目睹了圍繞少數(shù)核心產(chǎn)品的基礎(chǔ)設(shè)施正在全面整合。AWS、GCP 和 Azure 在這一波浪潮中顯然是贏家,NVIDIA 和 Intel 的硬件占據(jù)了數(shù)據(jù)中心的主導(dǎo)地位。我們也看到一些公司涌入這個(gè)領(lǐng)域,采取更多利基方式,比如更清潔的訓(xùn)練 + 部署(參見(jiàn) Paperspace 和 FloydHub)。
顯然,我們都非常熟悉 TensorFlow、PyTorch、Scikit-Learn 和其他主要建模工具。在整個(gè)行業(yè)中,我們看到了對(duì)于大多數(shù)建模工作流,Jupyter 和各種克隆版本繼續(xù)占據(jù)主導(dǎo)地位。在數(shù)據(jù)科學(xué)家繁重的工作流和機(jī)器學(xué)習(xí)工程師的工作流之間也存在明顯的分歧,機(jī)器學(xué)習(xí)工程師們將時(shí)間花在 IDE 的選擇上,而建模工程師則將更多的時(shí)間花在 Jupyter,以及像 Colab、Deepnote、Count 等具有特定優(yōu)勢(shì)的項(xiàng)目上。
這些工具仍然是生態(tài)系統(tǒng)的核心。但是在過(guò)去的五年里,最大的推動(dòng)因素也許是部署和服務(wù)。Docker 和 Kubernetes 仍然是生態(tài)系統(tǒng)的核心,而許多工具也加入了他們自己獨(dú)特的價(jià)值支柱。Kubeflow 正在迅速獲得人氣,而 TensorFlow 服務(wù)、MLFlow、BentoML、Cortex 和其他公司也在爭(zhēng)奪類(lèi)似的市場(chǎng)份額,他們?cè)噲D通過(guò)使所有建模工程師能夠以最小的努力使其模型投入生產(chǎn)。“只需幾行代碼即可部署模型”是許多項(xiàng)目的口號(hào)。易于部署對(duì)于獲得客戶(hù)非常重要;可擴(kuò)展性和維護(hù)性是長(zhǎng)期留住客戶(hù)的關(guān)鍵因素。
這種創(chuàng)新是意料之中的,因?yàn)橐话愕臄?shù)據(jù)科學(xué)家和不太注重工程的機(jī)器學(xué)習(xí)工程師可能不太愿意在 DevOps、容器編排、擴(kuò)展等方面耗費(fèi)太多的時(shí)間。而且,許多團(tuán)隊(duì)在組建他們最初的核心團(tuán)隊(duì)時(shí),都沒(méi)有雇傭大量的工程人才。因此,里程可能會(huì)有所不同。
我傾向于將機(jī)器學(xué)習(xí)的研究工作大致分為以下幾個(gè)階段來(lái)看待。過(guò)去,我們被迫自己構(gòu)建許多這樣的階段,或者完全忽略某些步驟(比如混亂的版本控制、不存在的 CI、手動(dòng)擴(kuò)展、只有在模型被明顯破壞時(shí)才進(jìn)行維護(hù)等)。值得慶幸的是,許多團(tuán)隊(duì)正在努力簡(jiǎn)化我們的生活,幾乎每一步都是如此:
●數(shù)據(jù)管理、模式、數(shù)據(jù)集版本控制
●模型定義、訓(xùn)練和評(píng)估
●序列化、服務(wù)化
●部署、CI/CD 和模型版本控制
●監(jiān)控和維護(hù)
在某些情況下,上述工作是相互獨(dú)立的。但在其他情況下,同一個(gè)工具也可以處理流程中的多個(gè)步驟。例如,我們可能會(huì)看到一個(gè)用于服務(wù)的工具也可以輕松地處理序列化。在其他情況下,用于訓(xùn)練的庫(kù)可能與序列化(pickle、joblib、dill、onnx 等)緊密集成。生態(tài)系統(tǒng)中有趣的部分是,工具是如何成熟到這樣一個(gè)程度的,以至于你可以擁有像 BentoML 這樣的全套服務(wù)工具,但如果需要的話,你也可以有很多其他選項(xiàng),進(jìn)行額外的定制。更多偏重于工程的團(tuán)隊(duì)可能不會(huì)花時(shí)間去使用 Bento、Cortex 或其他服務(wù),這些服務(wù)是為技術(shù)含量較低的用戶(hù)準(zhǔn)備的。而我個(gè)人喜歡 BentoML 和 Cortex 這樣的工具,因?yàn)樗鼈優(yōu)槲覀兊男F(tuán)隊(duì)節(jié)省了大量的時(shí)間。MLOps 還有很長(zhǎng)的路要走。
看起來(lái)我們最缺的就是監(jiān)控和維護(hù)這一塊。
Christopher Samiullah 很好地總結(jié)了 這一點(diǎn)。
很明顯,這份列表非常偏向于我過(guò)去曾使用過(guò)的工具,或者我正在積極使用的工具。一些不是機(jī)器學(xué)習(xí)專(zhuān)用的工具被排除在外。例如,雖然 Airflow 是許多工作流的關(guān)鍵部分,但在這種情況下被排除在外。此外,你還將看到對(duì) Python 生態(tài)系統(tǒng)的明顯偏見(jiàn),這可能會(huì)讓一些人對(duì)此感到懊惱。我們還排除了數(shù)據(jù)庫(kù)、版本控制等。顯然,數(shù)據(jù)收集和清理是我們工作流的核心,但這個(gè)過(guò)程的大部分對(duì)軟件工程來(lái)說(shuō)并不新鮮,況且在別處的介紹比我在本文所講的要深入得多。我們主要討論建模工程師和機(jī)器學(xué)習(xí)工程師之外的工具,而不是數(shù)據(jù)工程師、分析師或商業(yè)智能重?cái)?shù)據(jù)科學(xué)工作流。
作為 API 的大規(guī)模通用模型
讓我們來(lái)談?wù)?GPT-3 的操作。比起 GPT-3 的成果,我可能并沒(méi)有那么多興致,但對(duì)這個(gè)方法作為其他行業(yè)的典范,我卻更感興趣。
我們似乎正在為最大和最佳(通用)模型的軍備競(jìng)賽做準(zhǔn)備。這種規(guī)模的計(jì)算,對(duì)于較小的公司和初創(chuàng)公司來(lái)說(shuō)是不現(xiàn)實(shí)的。更小的努力將有利于聰明的優(yōu)化和研究,推翻越來(lái)越多的計(jì)算問(wèn)題。兩者的結(jié)合在這里似乎是明顯的贏家,我預(yù)計(jì),領(lǐng)先的建模工作將圍繞著一小批擁有巨額資金的公司進(jìn)行全面整合,這些公司負(fù)擔(dān)得起所需的算力和研究資金。然后,我們將看到一些占主導(dǎo)地位的公司為這些模型提供服務(wù),這些模型是空開(kāi)的,無(wú)需高度專(zhuān)業(yè)化的數(shù)據(jù)即可工作。這些用例可以在全球范圍內(nèi)被各種產(chǎn)品使用。讓我們想象一下。
智能對(duì)關(guān)鍵參與者的潛在整合。
GPT-3 就是這種趨勢(shì)可能走向的一個(gè)很好的例子。在短短的幾周內(nèi),已經(jīng)有幾十個(gè)出色的用例使用了 Open AI API。
在整個(gè)生態(tài)系統(tǒng)中,我們也看到了類(lèi)似的努力。這種開(kāi)發(fā)模式并不僅限于自然語(yǔ)言處理領(lǐng)域。從長(zhǎng)遠(yuǎn)來(lái)看,少數(shù)專(zhuān)注于軟件 / 硬件的自動(dòng)駕駛初創(chuàng)公司可能會(huì)讓那些不想自己研發(fā)的公司趕上那些想自己研發(fā)的公司。一個(gè)公司能夠在不進(jìn)行研發(fā)的情況下利用這些巨大的努力,這是一個(gè)重大的勝利。預(yù)計(jì)將會(huì)看到以服務(wù)形式提供的各種模型。大規(guī)模的模型將會(huì)推動(dòng)大部分創(chuàng)新,越來(lái)越小的蛋糕將被越來(lái)越多的小眾玩家瓜分。隨著模型在泛化方面越來(lái)越出色,預(yù)計(jì)對(duì)定制建模工作的依賴(lài)程度將會(huì)越來(lái)越低。而且,這些特定于業(yè)務(wù)的用例與其說(shuō)是在優(yōu)化模型,不如說(shuō)是在收集特定于應(yīng)用程序的數(shù)據(jù)集。數(shù)據(jù)主宰著我們身邊的一切。
在(傳統(tǒng))公司的部署
許多“有圍墻的花園”將會(huì)因?yàn)榘胨接?API 提供安全保障的缺乏而反對(duì)。對(duì)于那些能夠優(yōu)化大型模型、壓縮模型并使不斷增長(zhǎng)的數(shù)據(jù)湖易于管理的公司來(lái)說(shuō),這是一個(gè)巨大的機(jī)遇。很難相信,傳統(tǒng)公司都會(huì)要求部署超過(guò) 1750 億個(gè)參數(shù)的新一代模型。但是,請(qǐng)不要將他們遺忘。
當(dāng)我們將 PII 引入到這個(gè)混合體中,事情就開(kāi)始變得特別有趣。當(dāng)你提出讓公司將他們的數(shù)據(jù)從其內(nèi)部網(wǎng)絡(luò)發(fā)送到某個(gè)新的、時(shí)髦的 API,卻遭到那幫人指著你的臉嘲笑,千萬(wàn)不要對(duì)此感到驚訝。只要計(jì)算和存儲(chǔ)仍然是一項(xiàng)開(kāi)支,那些能夠壓縮模型并從較小的模型中得到類(lèi)似結(jié)果的公司,將會(huì)保持自己存在的價(jià)值。訓(xùn)練和服務(wù)的成本將持續(xù)大幅削減,但部署成本可能仍然相當(dāng)高。人工智能公司的利潤(rùn)率仍然低于傳統(tǒng)的 SaaS 公司,這在很大程度上是由于這個(gè)原因。
“有趣的是,我們?cè)谌斯ぶ悄芄镜呢?cái)務(wù)數(shù)據(jù)看到了一個(gè)出乎意料的一致模式,毛利潤(rùn)率往往在 50%~60% 的范圍內(nèi),遠(yuǎn)低于類(lèi)似 SaaS 企業(yè)的 60%~80% 以上的基準(zhǔn)。”
—— a16z
不要低估小數(shù)據(jù)
擁有數(shù)十億個(gè)參數(shù)的大型模型將繼續(xù)受到熱棒。而海量的數(shù)據(jù)集將繼續(xù)推動(dòng)這些被炒作的模型。在現(xiàn)實(shí)的工業(yè)中,較小的模型在很多用例是必不可少的。在構(gòu)建邊緣場(chǎng)景時(shí),你將面臨兩個(gè)核心決策:
較小或壓縮的模型(即 TensorFlow Lite)
遠(yuǎn)程連接以進(jìn)行計(jì)算
我們可以使用 TensorFlow Lite 等解決方案部署到邊緣設(shè)備。Hailo、Kneron 和 Perceive 等公司正在為邊緣和消費(fèi)設(shè)備提供更好的硬件。硬件創(chuàng)新的步伐可能會(huì)超過(guò)小型模型的需求。
當(dāng)遠(yuǎn)程連接是一項(xiàng)選擇時(shí),我們總是可以考慮執(zhí)行芯片外計(jì)算,盡管存在很多障礙和常見(jiàn)的限制,如連接問(wèn)題和計(jì)算時(shí)間。在像制造業(yè)這樣的環(huán)境中,這可能是可取的,因?yàn)橛捎谶^(guò)程的穩(wěn)定性,連接性可能具有更高的保證。我們已經(jīng)目睹,在安裝遠(yuǎn)程控制系統(tǒng)的地方,5G 工廠如雨后春筍般涌現(xiàn)。無(wú)線傳感器以無(wú)線方式與控制系統(tǒng)通信。不言而喻,遠(yuǎn)程推理將是這一轉(zhuǎn)變的一部分。還有很多用例,我們可以在這些用例中提交數(shù)據(jù)、完成其他任務(wù),并在下游任務(wù)使用我們的計(jì)算結(jié)果。讓我們想一下制造業(yè),你可以在上游拍攝產(chǎn)品照片,執(zhí)行轉(zhuǎn)換,然后在下游對(duì)產(chǎn)品進(jìn)行質(zhì)檢。這顯然不是自動(dòng)駕駛這樣的實(shí)時(shí)場(chǎng)景中的選項(xiàng)。
小數(shù)據(jù)也極具吸引力。為了成功進(jìn)行概念驗(yàn)證,我們可能會(huì)容忍大量的 Type 1 錯(cuò)誤,這取決于行業(yè)和用例。傳感器通常也可能具有侵入性,因此,我們收集數(shù)據(jù)的時(shí)間越短越好。以 Instrumental 公司為例,該公司希望通過(guò)最少的例子來(lái)解決制造質(zhì)量問(wèn)題。
所以,不要低估小數(shù)據(jù)!
獲得資金
風(fēng)險(xiǎn)資本,尤其是風(fēng)險(xiǎn)投資,仍然是未來(lái)創(chuàng)新的主要把關(guān)者。值得慶幸的是, 在資助人工智能企業(yè)的方面,渠道是敞開(kāi)的。附帶提一句,企業(yè)數(shù)據(jù)業(yè)務(wù)也得到了健康的發(fā)展,無(wú)論從輪數(shù)規(guī)模還是看純輪數(shù)的量都是如此。
對(duì)于普通的構(gòu)建者來(lái)說(shuō),啟動(dòng)機(jī)器學(xué)習(xí)業(yè)務(wù)變得越來(lái)越容易。一個(gè)粗略的登錄頁(yè)面,訪問(wèn) GPT-3(或任何其他預(yù)訓(xùn)練模型),一些云計(jì)算積分,以及一兩條聰明的推文,將讓你得到構(gòu)建和測(cè)試概念驗(yàn)證所需的一切。
話雖如此,任何一個(gè)還算不錯(cuò)的 PoC 都能很快得到風(fēng)險(xiǎn)投資的資金,因此,大多數(shù)人很快喪失自我創(chuàng)業(yè)并實(shí)現(xiàn)盈利的雄心。這樣說(shuō)是有充分理由的。融資的輪次結(jié)束得更快,越來(lái)越多的天使基金和微基金使種子前輪和種子輪的資金流動(dòng)更快。
企業(yè)風(fēng)投(Google Ventures、Salesforce Ventures、Samsung Ventures、Intel Cpital 等)在應(yīng)用人工智能和一般數(shù)據(jù)科學(xué)領(lǐng)域也非?;钴S。這也說(shuō)得通,因?yàn)樵谄髽I(yè)內(nèi)部開(kāi)發(fā)這些東西很困難。但風(fēng)投公司可以幫助母公司找到與他們投資的人工智能初創(chuàng)公司的協(xié)同效應(yīng)。一些高管仍然認(rèn)為人工智能是一個(gè)高風(fēng)險(xiǎn)的賭注,不值得為此專(zhuān)門(mén)建立一個(gè)組織。如果他們改變主意的話,這些對(duì)人工智能初創(chuàng)公司的投資不僅為他們提供了一種潛在方式,使他們可以利用自己錯(cuò)過(guò)的新技術(shù),而且也可以作為一個(gè)健康的人才來(lái)源,要知道,在這一行業(yè)中,人才的獲取并不總是那么容易。請(qǐng)看看 Intel Capital 等企業(yè)風(fēng)險(xiǎn)投資公司最近的投資, 你會(huì)發(fā)現(xiàn),人工智能和一般的企業(yè)數(shù)據(jù)公司的交易流起伏不定。
跨技術(shù)的機(jī)遇
計(jì)算機(jī)視覺(jué)的進(jìn)步促成了自動(dòng)駕駛革命、制造業(yè)的突破,以及更多。自然語(yǔ)言處理的進(jìn)步改善了搜索、翻譯、知識(shí)理解等。我們最近才開(kāi)始意識(shí)到強(qiáng)化學(xué)習(xí)的可能性、生成對(duì)抗網(wǎng)絡(luò)的潛力,等等。
讓我們來(lái)探討一下特定技術(shù)方法中的一些機(jī)會(huì)。之后,我們將以特定行業(yè)的方式來(lái)探討機(jī)會(huì)。觀察初創(chuàng)公司可能會(huì)做出的選擇,即創(chuàng)建一個(gè)廣泛的技術(shù)解決方案與將他們的技術(shù)解決方案應(yīng)用于特定行業(yè),這是一件很有意思的事情。
這些絕不是詳盡無(wú)遺的清單,甚至都不敢說(shuō)已經(jīng)觸及了表面。然而,它們應(yīng)該能夠起到啟發(fā)的作用,讓你有一個(gè)更高層次的全景觀。為簡(jiǎn)潔起見(jiàn),我們有意跳過(guò)了遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、自動(dòng)編碼器和某些其他模型。
計(jì)算機(jī)視覺(jué)
關(guān)鍵技術(shù)和流行語(yǔ) :卷積神經(jīng)網(wǎng)絡(luò)(CNN)、Dropout、目標(biāo)檢測(cè)(分類(lèi) + 定位)。
前沿用途 :分類(lèi)、場(chǎng)景理解、跟蹤、運(yùn)動(dòng)、估計(jì)、重建。
優(yōu)勢(shì)產(chǎn)業(yè) :汽車(chē)、醫(yī)藥、軍事、攝影。
樣本公司 :Cruise、Cognex。
自然語(yǔ)言處理
關(guān)鍵技術(shù)和流行語(yǔ) :GPT、BERT、DistilBERT、XLNet、RoBERTa、Transformer-XL。
前沿用途 :語(yǔ)音識(shí)別、文本生成、語(yǔ)言理解、翻譯、問(wèn)答系統(tǒng)。
優(yōu)勢(shì)產(chǎn)業(yè) :很難想象還會(huì)有自然語(yǔ)言處理不能發(fā)揮某種作用的企業(yè)。(雖然我不是自然語(yǔ)言處理主義者?。?/p>
樣本公司 :Open AI、HuggingFace。
強(qiáng)化學(xué)習(xí)
關(guān)鍵技術(shù)和流行語(yǔ) :馬爾科夫(Markov)決策過(guò)程、時(shí)序差分學(xué)習(xí)、蒙特卡洛(Monte Carlo)、深度強(qiáng)化學(xué)習(xí)、Q- 學(xué)習(xí)。
前沿用途 :游戲、市場(chǎng)、控制、日程安排劃。
優(yōu)勢(shì)產(chǎn)業(yè)(相對(duì)未使用) :機(jī)器人技術(shù)、市場(chǎng)與經(jīng)濟(jì)、工業(yè)自動(dòng)化(機(jī)器人技術(shù)的主要用例)。
樣本公司 :DeepMind、Open AI、Covariant。
生成式網(wǎng)絡(luò)
關(guān)鍵技術(shù)和流行語(yǔ) :變自編碼器(Variational Autoencoders,VAE)、生成對(duì)抗網(wǎng)絡(luò)、CycleGAN、DCGAN、cGAN、StyleGAN、生成器、鑒別器、博弈論。
優(yōu)勢(shì)產(chǎn)業(yè) :創(chuàng)意與媒體、建模、攝影、視頻。
樣本公司 :RunwayML、Rosebud.ai、Generative.photos。
跨行業(yè)的機(jī)遇
每個(gè)行業(yè)都會(huì)從應(yīng)用機(jī)器學(xué)習(xí)中獲益。金融業(yè)在很大程度上解決了欺詐問(wèn)題,制造業(yè)解決了一些傳統(tǒng)控制無(wú)法解決的自動(dòng)化領(lǐng)域迫在眉睫的問(wèn)題,電子商務(wù)繼續(xù)從推薦系統(tǒng)發(fā)展而來(lái)。所有領(lǐng)域的顛覆時(shí)機(jī)已成熟。下面是樣本行業(yè)中一些有趣的用例和公司。
制造業(yè)
關(guān)鍵技術(shù) :計(jì)算機(jī)視覺(jué)、強(qiáng)化學(xué)習(xí)、過(guò)程優(yōu)化。
用例 :質(zhì)量保證、工業(yè)自動(dòng)化、流程改進(jìn)、預(yù)測(cè)性維護(hù)。
樣本公司 :Covariant、Instrumental、FogHorn Systems(此外,Siemens、Rockwell、Cognex 等老牌公司也在積極投資并進(jìn)行自己的研發(fā),以起到防御作用。
商業(yè)
關(guān)鍵技術(shù) :推薦系統(tǒng)、欺詐檢測(cè)、訂單匹配、個(gè)性化。
用例 :質(zhì)量保證、工業(yè)自動(dòng)化、流程改進(jìn)。
樣本公司 :Amazon 的推薦王國(guó)是最明顯的例子,像 Uber 這樣的大型實(shí)時(shí)市場(chǎng)通過(guò)動(dòng)態(tài)定價(jià)和路由優(yōu)化實(shí)時(shí)匹配,像 Stripe 和 Square 這樣的支付平臺(tái)依賴(lài)于欺詐檢測(cè)。
醫(yī)學(xué)
關(guān)鍵技術(shù) :計(jì)算機(jī)視覺(jué)、排序、遞歸神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)。
用例 :X 射線和其他成像的分類(lèi)、藥物發(fā)現(xiàn)、基因組學(xué)、大腦圖譜(還有更多?。?/p>
樣本公司 :Insitro、Sophia Genetics、Flatiron Health、Allen Institute(非營(yíng)利組織)。
自動(dòng)駕駛
關(guān)鍵技術(shù) :計(jì)算機(jī)視覺(jué)、目標(biāo)檢測(cè)、語(yǔ)義分割 / 場(chǎng)景理解。
用例 :自動(dòng)駕駛。
樣本公司 :Tesla、Waymo、Cruise,還有很多公司。
建筑業(yè)
關(guān)鍵技術(shù) :計(jì)算機(jī)視覺(jué)。
用例 :機(jī)械的安全、制圖、可視化、自主性。
樣本公司 :Intsite、Kwant、Buildot。
創(chuàng)意與媒體
關(guān)鍵技術(shù) :自然語(yǔ)言處理、生成對(duì)抗網(wǎng)絡(luò)、計(jì)算機(jī)視覺(jué)。
用例 :文本生成、視頻生成、歌曲和故事寫(xiě)作、助理、語(yǔ)音生成、建模、Deepfake。
樣本公司 :RunwayML、Rosebud、Persado。
軍事和國(guó)家監(jiān)控
關(guān)鍵技術(shù) :我們不應(yīng)鼓勵(lì)人工智能軍備競(jìng)賽。
用例 :我們不應(yīng)鼓勵(lì)人工智能軍備競(jìng)賽。
樣本公司 :我們不應(yīng)鼓勵(lì)人工智能軍備競(jìng)賽。
能源
關(guān)鍵技術(shù) :計(jì)算機(jī)視覺(jué)、強(qiáng)化學(xué)習(xí)、流程優(yōu)化。
用例 :預(yù)測(cè)性維護(hù)、網(wǎng)格優(yōu)化。
樣本公司 :Stem、Origami、Infinite Uptime。
金融
關(guān)鍵技術(shù) :自然語(yǔ)言處理、異常檢測(cè)、傳統(tǒng)機(jī)器學(xué)習(xí)。
用例 :自動(dòng)化銀行體驗(yàn)、欺詐檢測(cè)、個(gè)性化、風(fēng)險(xiǎn)管理、財(cái)富管理、交易。
樣本公司 :Ravelin、Tala、Verifi、Suplari、各大銀行及其服務(wù)提供商 Quantopian。
作者介紹 :
Luke Posey,Spawner.ai 的創(chuàng)始人。寶潔公司前人工智能總監(jiān)?,F(xiàn)為 Dataset Daily 的專(zhuān)欄作者,撰寫(xiě)關(guān)于人工智能 / 機(jī)器學(xué)習(xí)、數(shù)據(jù)和其他主題的文章。
原文鏈接 :
https://towardsdatascience.com/the-state-of-applied-ai-41393faad013