區(qū)塊鏈上的智能合約就像未連接互聯(lián)網(wǎng)的計算機一樣,本身就具有其內(nèi)在價值,智能合約的內(nèi)在價值就是創(chuàng)建和交易通證。然而,計算機連接了互聯(lián)網(wǎng)后,釋放出了巨大的創(chuàng)新力和價值,同樣地,智能合約一旦連接到快速增長的鏈下數(shù)據(jù)和API經(jīng)濟,也將變得無比強大。如果智能合約可以連接至鏈下數(shù)據(jù)提供商、web API、企業(yè)系統(tǒng)、云服務(wù)商、物聯(lián)網(wǎng)設(shè)備、支付系統(tǒng)以及其他區(qū)塊鏈等各種龐大的數(shù)據(jù)庫,那么它將成為橫跨各個行業(yè)的主流數(shù)字協(xié)議。本文中,我們將在以下幾個方面深度解析數(shù)據(jù)和API:
數(shù)據(jù)是什么?它如何驅(qū)動數(shù)據(jù)經(jīng)濟?
數(shù)據(jù)是如何被生產(chǎn)出來的?
如何通過API交換數(shù)據(jù)?
什么是大數(shù)據(jù)分析?
本文將全面分析鏈下數(shù)據(jù)經(jīng)濟格局,下一篇文章中我們會接著探討如何使用一種叫“預(yù)言機”的基礎(chǔ)架構(gòu)安全可靠地將智能合約連接至這些鏈下數(shù)據(jù)。
數(shù)據(jù)與數(shù)據(jù)經(jīng)濟
▍數(shù)據(jù)
數(shù)據(jù)是通過觀察得出的結(jié)果或信息,比如測量室外溫度、計算汽車的地理位置或記錄用戶與應(yīng)用的交互情況。原始數(shù)據(jù)本身既不具有特殊價值也不可靠,而是需要用其他數(shù)據(jù)對其進行解讀或確認,以確保數(shù)據(jù)的真實性和有效性。
▍元數(shù)據(jù)
元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”。元數(shù)據(jù)中主要包含數(shù)據(jù)的基本信息,目的是大幅降低追蹤和處理信息的難度。舉個例子,某個消息的發(fā)送時間、某一溫度數(shù)值的地理位置或某次電話溝通的時長,這些全都是元數(shù)據(jù)。其目的是為數(shù)據(jù)建立索引并賦予意義。
▍數(shù)據(jù)清洗
除此之外,重要的應(yīng)用需要保障數(shù)據(jù)可靠性,因此需要對其進行處理和清洗。這個清洗過程包括去除異常值、發(fā)現(xiàn)錯誤并剔除不相關(guān)的信息。比如,將目前溫度與歷史溫度進行比較,以甄別并剔除異常值。
▍數(shù)據(jù)經(jīng)濟
在數(shù)據(jù)經(jīng)濟中,各種類型的數(shù)據(jù)都會被搜集、提煉和交換,并產(chǎn)生有價值的洞察。這些洞察會產(chǎn)生最大的社會效益,比如在共享醫(yī)療數(shù)據(jù)庫中儲存臨床研究數(shù)據(jù),以便大家更好地了解最新醫(yī)療趨勢;或私營企業(yè)追蹤內(nèi)部運營流程,以甄別并改善效率低下問題。
隨著數(shù)據(jù)經(jīng)濟的不斷發(fā)展,自動化程度也在不斷上升。數(shù)據(jù)可以直接觸發(fā)經(jīng)濟行為,而無須人為干預(yù)。舉個例子,應(yīng)用的算法規(guī)定只要滿足三個條件,就會自動支付貨款,這三個條件分別是:1)貨物送達(GPS數(shù)據(jù));2)貨物品相完好(物聯(lián)網(wǎng)數(shù)據(jù));3)貨物已清關(guān)(web API)。
▍數(shù)據(jù)生產(chǎn)
數(shù)據(jù)是某一流程或事件的副產(chǎn)品,數(shù)據(jù)的產(chǎn)生需要輸入(即行為)、數(shù)據(jù)的記錄需要提?。礈y量)、而為數(shù)據(jù)賦予意義則需要聚合(即分析)。由于數(shù)據(jù)的輸入、提取和聚合技術(shù)存在一定限制門檻,因此數(shù)據(jù)并不能做到“人人平等”,數(shù)據(jù)質(zhì)量也是參差不齊的。
以下是獲取新數(shù)據(jù)和原始數(shù)據(jù)的常見方式:
表格(手動輸入的數(shù)據(jù)):用戶填寫公開和私人表格(比如回答問卷調(diào)查、簽署文檔或在社交平臺發(fā)言),手動輸入的數(shù)據(jù)。
應(yīng)用/網(wǎng)站(經(jīng)過用戶同意的數(shù)據(jù)):在用戶同意應(yīng)用或網(wǎng)站的條款和協(xié)議后獲取的數(shù)據(jù)。用戶通常在同意這些條款和協(xié)議后,就會授權(quán)網(wǎng)站或應(yīng)用追蹤某些數(shù)據(jù),比如APP中的操作、瀏覽習(xí)慣或甚至是性別和年齡等個人信息。
物聯(lián)網(wǎng)(實時監(jiān)測的數(shù)據(jù)):安裝了傳感器和執(zhí)行器的設(shè)備捕捉到的數(shù)據(jù)。并通過智能手機、智能家居、可穿戴式設(shè)備、射頻識別裝置等各種互聯(lián)網(wǎng)設(shè)備傳輸數(shù)據(jù)。
自有流程/個人經(jīng)驗(由內(nèi)部或個人擁有的數(shù)據(jù)):企業(yè)由于擁有專利或市場領(lǐng)導(dǎo)地位而掌控了某一業(yè)務(wù)流程,從而獲取到的數(shù)據(jù);抑或是在個人獨特的經(jīng)驗中產(chǎn)生的數(shù)據(jù)。
研究和分析(聚合并詮釋數(shù)據(jù)):搜集來自現(xiàn)有數(shù)據(jù)集的數(shù)據(jù),并對數(shù)據(jù)進行分析,包括與歷史數(shù)據(jù)進行交叉對比、對其他數(shù)據(jù)集進行交叉參考以及采用新的過濾和計算方法等。另外還有數(shù)據(jù)分銷商,他們從數(shù)據(jù)聚合商或企業(yè)大量收購數(shù)據(jù),然后轉(zhuǎn)賣給終端用戶。數(shù)據(jù)分銷商雖然以更高的價格將數(shù)據(jù)轉(zhuǎn)賣出去,但是他們在轉(zhuǎn)賣之前會按照用戶的需求將數(shù)據(jù)處理成適合的結(jié)構(gòu)或格式。
數(shù)據(jù)交換
如果數(shù)據(jù)要成為下一代應(yīng)用的核心支柱,那么就不能完全依賴內(nèi)部產(chǎn)生數(shù)據(jù),而是必須建立一個數(shù)據(jù)交易機制,因為買數(shù)據(jù)的成本比生產(chǎn)數(shù)據(jù)的成本低多了。舉個例子,開發(fā)自動駕駛汽車的算法需要運用大量數(shù)據(jù)進行目標(biāo)檢測、目標(biāo)分類、目標(biāo)定位以及運動預(yù)測。開發(fā)者可以在內(nèi)部產(chǎn)生這些數(shù)據(jù),但代價是需要累計幾百萬英里的駕駛里程;而他們也可以通過API購買這些數(shù)據(jù)。
應(yīng)用程序編程接口(API)其實是一組命令,控制外部應(yīng)用如何接入系統(tǒng)內(nèi)部的數(shù)據(jù)集和服務(wù)。API是目前數(shù)據(jù)和服務(wù)交易的標(biāo)準方案。主流的打車軟件Uber連接了MapBox的GPS API進行車輛定位、Twilio的短信息API發(fā)送即時消息以及Braintree的支付API進行付款。這些功能都是購買的已有技術(shù)方案,而非Uber自己從零開發(fā)。
(API經(jīng)濟自出現(xiàn)以來一直呈穩(wěn)定上升趨勢,自此期間產(chǎn)生了許多新的API和管理API的新方案。資料來源:Software Development Company Informatica)
API的收費模式通常是訂閱模式,終端用戶可以按使用次數(shù)付費,也可以按月付費,還可以按照某種階梯制度付費。因此,數(shù)據(jù)提供商會得到經(jīng)濟激勵生產(chǎn)數(shù)據(jù),而終端用戶無須自行生產(chǎn)這些數(shù)據(jù)。API提供方和付費用戶之間還會簽署具有法律效力的合約,以避免數(shù)據(jù)盜用或未經(jīng)許可轉(zhuǎn)賣等各種惡意行為,并約束數(shù)據(jù)提供商為自己的數(shù)據(jù)質(zhì)量負責(zé)。
有許多API可免費供所有人使用,其中包括提供天氣數(shù)據(jù)的Open Weather Map、提供航班信息的Skyscanner Flight Search以及提供全球人類行為和信仰數(shù)據(jù)的GDELT。除此之外,全世界各國政府也積極推出透明數(shù)據(jù)的倡議,并不斷加大力度將API開源。然而,開源API的可靠性還是不如付費API,因為缺少經(jīng)濟激勵和法律協(xié)議的約束,沒法控制數(shù)據(jù)質(zhì)量和延時風(fēng)險。大多數(shù)優(yōu)質(zhì)數(shù)據(jù)仍然來自付費API,這些API通常擁有頂尖的數(shù)據(jù)源、全?;A(chǔ)架構(gòu)以及全職的監(jiān)控團隊,并為了超越競爭對手而不斷努力創(chuàng)新。
大數(shù)據(jù)基礎(chǔ)架構(gòu)和分析
編程系統(tǒng)能夠自主學(xué)習(xí)和自我完善,這個概念一直都受到熱烈追捧。學(xué)習(xí)的過程包括采取行動、收到結(jié)果、與歷史數(shù)據(jù)比對分析并產(chǎn)生新洞察,改進方法,最終實現(xiàn)目標(biāo)。因此,目前的大趨勢是開發(fā)出一個可以自主學(xué)習(xí)的基礎(chǔ)架構(gòu),吸取大量數(shù)據(jù)、對數(shù)據(jù)進行過濾分類,并基于分析結(jié)果產(chǎn)生洞察。
美國的Facebook、Google和亞馬遜以及中國的阿里巴巴、騰訊和百度之所以能成為今天的科技巨頭,就是因為它們深耕互聯(lián)網(wǎng)應(yīng)用,并產(chǎn)生了海量的用戶數(shù)據(jù)。這些數(shù)據(jù)為世界頂尖的數(shù)據(jù)分析工具,特別是人工智能和機器學(xué)習(xí)軟件,奠定了堅實的基礎(chǔ)。這些大數(shù)據(jù)分析技術(shù)能夠針對消費者行為、社會趨勢和市場趨勢產(chǎn)生大量豐富的洞察。與此同時,業(yè)務(wù)管理軟件也幫助企業(yè)更好地了解它們的運營情況。SAP、Salesforce和甲骨文等企業(yè)開發(fā)了企業(yè)資源規(guī)劃系統(tǒng)(ERP)、客戶關(guān)系管理系統(tǒng)(CRM)以及云端管理軟件,使企業(yè)能夠匯總內(nèi)部業(yè)務(wù)流程中的所有數(shù)據(jù)和系統(tǒng),并產(chǎn)生關(guān)鍵洞察。
云端計算和儲存技術(shù)正受到越來越多的關(guān)注。有了云計算,用戶可以共享云端基礎(chǔ)架構(gòu)儲存和處理數(shù)據(jù),從而無須占用自己的系統(tǒng)資源。云技術(shù)改善了應(yīng)用的后端流程,增強了不同系統(tǒng)之間的共享,并降低了人工智能和機器學(xué)習(xí)軟件的使用成本。舉個例子,Google Cloud用戶可以使用BigQuery,這是一個SaaS軟件,可以批量分析千萬億字節(jié)的數(shù)據(jù),并內(nèi)置機器學(xué)習(xí)功能。
第四次工業(yè)革命即將到來
將人工智能/機器學(xué)習(xí)、業(yè)務(wù)管理軟件以及云端基礎(chǔ)架構(gòu)相結(jié)合,能從數(shù)據(jù)中獲得更加深刻的洞察。另外,邊緣計算、5G通訊網(wǎng)絡(luò)以及生物科技等技術(shù)的興起也促進了實時數(shù)據(jù)和生物連接數(shù)據(jù)環(huán)境的發(fā)展。在這些新興系統(tǒng)的推動下,經(jīng)濟體系不斷朝著去人為干預(yù)和實時數(shù)據(jù)驅(qū)動決策的方向發(fā)展,而數(shù)據(jù)生成和分享的壁壘幾乎消失,頻率不斷上升,這也進一步推動了大趨勢的發(fā)展。許多人將這個大趨勢稱為“第四次工業(yè)革命”。