我在倫敦參加了幾天O 'Reilly的Strata數(shù)據(jù)大會(huì),對(duì)大數(shù)據(jù)、機(jī)器學(xué)習(xí)(ML)和人工智能的發(fā)展方向有了更深刻的認(rèn)識(shí)。這些領(lǐng)域在過(guò)去5年中發(fā)展非常迅速,新技術(shù)、新流程和新應(yīng)用改變了企業(yè)管理其數(shù)據(jù)的方式。
Strata大會(huì)是很好的晴雨表,讓我們了解了大數(shù)據(jù)處理目前的最新發(fā)展水平,以及開(kāi)發(fā)人員和用戶(hù)關(guān)注哪些問(wèn)題。從這次活動(dòng)中,我發(fā)現(xiàn)了8個(gè)關(guān)鍵因素。
1、5G將刺激機(jī)器學(xué)習(xí)的增長(zhǎng),產(chǎn)生新的應(yīng)用和服務(wù)
我和O'Reilly的首席數(shù)據(jù)科學(xué)家兼Strata組織者Ben Lorica討論過(guò)這個(gè)問(wèn)題,他認(rèn)為5G極大的帶寬和靈活性,以及邊緣計(jì)算是關(guān)鍵的推動(dòng)因素。他指出,中國(guó)在這項(xiàng)技術(shù)方面是全球領(lǐng)先的力量,而很多企業(yè)仍在為他們正在進(jìn)行的所有5G投資制定商業(yè)模式。
2、改變數(shù)據(jù)科學(xué)家的技能
谷歌云的首席決策科學(xué)家Cassie Kozyrkov在她的演講中指出,隨著機(jī)器學(xué)習(xí)工具的用戶(hù)體驗(yàn)越來(lái)越好,所需的技能將變得不太技術(shù)化,而更關(guān)注的是數(shù)據(jù)科學(xué)家打破孤島、更能融入到業(yè)務(wù)中的能力上。
3、線上和線下環(huán)境的融合
中國(guó)的阿里巴巴電子商務(wù)集團(tuán)(Alibaba Ecommerce Group)和亞馬遜正在嘗試自己的實(shí)體店,而現(xiàn)實(shí)中的實(shí)體店還在不斷適應(yīng)新的網(wǎng)絡(luò)世界。在我看來(lái),電子商務(wù)集團(tuán)的線下行動(dòng)過(guò)于積極,而實(shí)體零售商的線上投資過(guò)于保守。要完全實(shí)現(xiàn)這些還有很長(zhǎng)的路要走,但是像亞馬遜和阿里巴巴這樣的企業(yè)在大規(guī)模管理數(shù)據(jù)方面的專(zhuān)長(zhǎng),卻是他們的關(guān)鍵優(yōu)勢(shì)所在。
4、內(nèi)部數(shù)據(jù)平臺(tái)成為增長(zhǎng)和創(chuàng)新的關(guān)鍵
Lyft和BMW數(shù)據(jù)科學(xué)家的報(bào)告展示了將數(shù)據(jù)平臺(tái)置于新產(chǎn)品開(kāi)發(fā)和業(yè)務(wù)流程管理的中心是怎樣推動(dòng)創(chuàng)新的。雖然這對(duì)于像Lyft這樣的數(shù)字化原生企業(yè)來(lái)說(shuō)是自然而然的事情,但隨著數(shù)據(jù)生成傳感器嵌入到產(chǎn)品中,傳統(tǒng)的工業(yè)企業(yè)也不得不參與其中。
5、開(kāi)放數(shù)據(jù)應(yīng)像開(kāi)源軟件一樣受到重視
我們都知道,很多大數(shù)據(jù)和機(jī)器學(xué)習(xí)產(chǎn)品和服務(wù)之所以能夠興起是因?yàn)楸澈笥虚_(kāi)源軟件。很多年前就有了成熟的開(kāi)源商業(yè)和技術(shù)案例。然而,人們很少關(guān)注開(kāi)放數(shù)據(jù)相對(duì)于創(chuàng)新的重要性。算法的輸出僅取決于所輸入的數(shù)據(jù)質(zhì)量。
全球最大的開(kāi)放式企業(yè)數(shù)據(jù)庫(kù)OpenCorporations的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Chris Taggart非常重視企業(yè)在依賴(lài)專(zhuān)有數(shù)據(jù)集時(shí)遇到的問(wèn)題,在這些數(shù)據(jù)集中,數(shù)據(jù)源可能是粗略的,并且元數(shù)據(jù)不會(huì)在產(chǎn)品之間共享。開(kāi)放數(shù)據(jù)更透明,不會(huì)使得企業(yè)只能選擇某一昂貴的商業(yè)合同,而企業(yè)卻很難放棄這些合同。
6、采集和管理實(shí)時(shí)數(shù)據(jù)的重要性
雖然人工智能和機(jī)器學(xué)習(xí)項(xiàng)目并不總是需要實(shí)時(shí)或者接近實(shí)時(shí)的數(shù)據(jù),但能夠構(gòu)建可以處理數(shù)據(jù)的系統(tǒng)將是一種寶貴的競(jìng)爭(zhēng)優(yōu)勢(shì)。隨著數(shù)據(jù)驅(qū)動(dòng)的決策越來(lái)越深入到企業(yè)內(nèi)部,競(jìng)爭(zhēng)優(yōu)勢(shì)有時(shí)會(huì)轉(zhuǎn)移到那些能夠更快響應(yīng)事件的企業(yè)。亞馬遜網(wǎng)絡(luò)服務(wù)在這方面的規(guī)模和廣度表明,能夠?qū)崿F(xiàn)這一點(diǎn)的工具變得越來(lái)越容易使用,也更便宜。
7、法律和道德問(wèn)題開(kāi)始改變企業(yè)的創(chuàng)新方式
牛津大學(xué)的Sandra Wachter博士在一次演講中強(qiáng)調(diào)了一個(gè)問(wèn)題,而我認(rèn)為,在未來(lái)一兩年內(nèi),人們會(huì)越來(lái)越關(guān)注這個(gè)問(wèn)題。她指出,隨著GDPR等倡議的生效,很多企業(yè)現(xiàn)在意識(shí)到了有責(zé)任去保護(hù)個(gè)人數(shù)據(jù)。然而,一個(gè)討論較少、也是監(jiān)管機(jī)構(gòu)仍在努力解決的問(wèn)題是,嵌入式算法基于所處理的數(shù)據(jù)而做出推斷和決策。
至少在歐洲,我們有權(quán)了解我們掌握的數(shù)據(jù),并在不同程度上糾正或者刪除這些數(shù)據(jù)。然而,對(duì)于信用檢查和健康保險(xiǎn)等領(lǐng)域的這些數(shù)據(jù),企業(yè)可能會(huì)根據(jù)數(shù)據(jù)自動(dòng)地對(duì)我們做出假設(shè),而我們卻不能去改變這些假設(shè)。
8、“凡有的,還要賜給他”
會(huì)議接近尾聲時(shí),我開(kāi)始思考,規(guī)模較小的公司并沒(méi)有互聯(lián)網(wǎng)巨頭或者全球FMCG公司的海量數(shù)據(jù)集,這些小公司怎樣在大數(shù)據(jù)和算法決策時(shí)代參與競(jìng)爭(zhēng)呢?利用網(wǎng)上服務(wù)的網(wǎng)絡(luò)效應(yīng)鞏固大公司的地位,形成良性創(chuàng)新循環(huán),但這存在風(fēng)險(xiǎn),或許我們已經(jīng)看到了這種風(fēng)險(xiǎn)。
然而,正如Unravel數(shù)據(jù)系統(tǒng)公司聯(lián)合創(chuàng)始人兼首席技術(shù)官Shivnath Babu向我指出的那樣,互聯(lián)網(wǎng)和應(yīng)用程序經(jīng)濟(jì)仍然能夠允許小公司利用其應(yīng)用程序和網(wǎng)上活動(dòng)中的數(shù)據(jù),并對(duì)市場(chǎng)產(chǎn)生影響。正是因?yàn)槿绱?,還有來(lái)自公共數(shù)據(jù)源的開(kāi)放數(shù)據(jù)的興起,將為新一代初創(chuàng)公司打下基礎(chǔ),讓他們能夠像20年前的谷歌、臉書(shū)和亞馬遜那樣,去改變世界。
作者:Martin De Saulles 博士是一位作家和學(xué)者,專(zhuān)門(mén)研究并撰寫(xiě)數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新技術(shù)和物聯(lián)網(wǎng)。
編譯:Charles
原文網(wǎng)址:https://www.cio.com/article/3393162/8-factors-shaping-the-future-of-big-data-machine-learning-and-ai.html