一、云計(jì)算
云計(jì)算可以被理解成一個(gè)系統(tǒng)硬件,一個(gè)具有巨大的計(jì)算能力、網(wǎng)絡(luò)通信能力和存儲(chǔ)能力的數(shù)據(jù)處理中心。數(shù)據(jù)處理中心本質(zhì)上是大量服務(wù)器的集合,數(shù)據(jù)處理中心的功能、規(guī)模是以服務(wù)器的數(shù)量來衡量的。
比如,2015年北京市有2 000多萬部手機(jī)、2 000多萬部座機(jī)、七八百萬臺(tái)各種各樣上網(wǎng)的筆記本電腦和臺(tái)式電腦,以及七八百萬臺(tái)家庭的電視機(jī)機(jī)頂盒。中國移動(dòng)、中國電信等電信公司處理所有北京市的上述信息的后臺(tái)服務(wù)系統(tǒng)和數(shù)據(jù)處理中心擁有的服務(wù)器共計(jì)25萬臺(tái)。上海差不多也是20多萬臺(tái)。
谷歌處理全世界的互聯(lián)網(wǎng)大數(shù)據(jù)且需要進(jìn)行智能化處理,它需要多少服務(wù)器呢?據(jù)悉,谷歌有150萬臺(tái)服務(wù)器分布在全世界七八個(gè)地方,現(xiàn)在正在建設(shè)的服務(wù)器還有100萬臺(tái)。
云計(jì)算有三個(gè)特點(diǎn)。
第一,在數(shù)據(jù)信息的存儲(chǔ)能力方面,服務(wù)器中能存儲(chǔ)大量數(shù)據(jù)。
第二,在計(jì)算能力方面,每個(gè)服務(wù)器實(shí)質(zhì)上是一臺(tái)計(jì)算機(jī)。
與20世紀(jì)60年代、70年代世界最大的計(jì)算機(jī)相比,當(dāng)代計(jì)算機(jī)的運(yùn)算能力更強(qiáng)、占用空間更小。
第三,在通信能力方面,服務(wù)器連接著千家萬戶的手機(jī)、筆記本電腦等移動(dòng)終端,是互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的通信樞紐,是網(wǎng)絡(luò)通信能力的具體體現(xiàn)。
由此可見,數(shù)據(jù)處理中心、云計(jì)算的硬件功能,具有超大規(guī)模化的通信能力、計(jì)算能力、存儲(chǔ)能力,賦予其虛擬化、靈活性、伸縮性的特點(diǎn)。
服務(wù)商以IDC為硬件,以私有云、公共云作為客戶服務(wù)的接口,向客戶提供數(shù)據(jù)服務(wù)。就像居民通過水龍頭管道向自來水廠買水一樣,各類客戶以按需購買的方式,利用IDC資源購買所需的計(jì)算量、存儲(chǔ)量、通信量,并按量結(jié)算費(fèi)用。資源閑置時(shí)也可供其他客戶使用,這樣就能夠有效、全面、有彈性地利用云計(jì)算架構(gòu)中的資源,既能同時(shí)為千家萬戶服務(wù),又能使大量服務(wù)器不發(fā)生閑置。
二、大數(shù)據(jù)
大數(shù)據(jù)之大,有靜態(tài)之大、動(dòng)態(tài)之大和運(yùn)算之后疊加之大。
數(shù)據(jù)量之大有三個(gè)要點(diǎn)。
第一是數(shù)據(jù)量大,例如大英博物館的藏書能全部以數(shù)字化的形式存儲(chǔ)。
第二是實(shí)時(shí)動(dòng)態(tài)變量大。每一秒鐘、每一分鐘、每一小時(shí)、每一天,數(shù)據(jù)都在產(chǎn)生變化。全球70億人約有六七十億部手機(jī),這些手機(jī)每天都在打電話,每天都在計(jì)算,每天都在付款,每天都在搜索。所有的動(dòng)態(tài)數(shù)據(jù)每天不斷疊加、不斷豐富、不斷增長。
“量變會(huì)引起質(zhì)變”,就像累積60張靜態(tài)照片可以形成一秒鐘的實(shí)時(shí)電影,大量靜態(tài)數(shù)據(jù)的存放也會(huì)不斷更新、累積,形成新的信息。
第三是數(shù)據(jù)疊加處理后的變量之大。
人們根據(jù)自身的主觀需求,對(duì)動(dòng)態(tài)的、靜態(tài)的數(shù)據(jù)進(jìn)行處理分析、綜合挖掘,在挖掘計(jì)算的過程中,又會(huì)產(chǎn)生復(fù)核計(jì)算以后的新數(shù)據(jù)。這種計(jì)算數(shù)據(jù)也是數(shù)據(jù)庫不斷累計(jì)的數(shù)據(jù)。
總之,所謂大數(shù)據(jù)之大,一是靜態(tài)數(shù)據(jù),二是動(dòng)態(tài)數(shù)據(jù),三是經(jīng)過人類大腦和計(jì)算機(jī)處理、計(jì)算后產(chǎn)生的數(shù)據(jù),這三者共同構(gòu)成大數(shù)據(jù)的數(shù)據(jù)來源。
大數(shù)據(jù)若要轉(zhuǎn)化為有用的信息、知識(shí),則需要消除各種隨機(jī)性和不確定性。數(shù)據(jù)在計(jì)算機(jī)中只是一串英語字母、字符或者阿拉伯?dāng)?shù)字,可能是混亂的、無序的。
數(shù)據(jù)應(yīng)用一般有三個(gè)步驟:數(shù)據(jù)——信息,信息——知識(shí),知識(shí)——智慧。
第一步,數(shù)據(jù)變信息。
任何結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)本身是無用的、雜亂無章的,但數(shù)據(jù)經(jīng)過分析去除隨機(jī)性干擾以后,就變成了有指向的信息。數(shù)據(jù)變信息的處理過程用的工具有濾波器、關(guān)鍵詞,濾波以后提煉出相關(guān)的信息。
第二步,信息中包含的規(guī)律,需要?dú)w納總結(jié)成知識(shí)。
知識(shí)改變命運(yùn),但知識(shí)不簡單地等于信息。如果不能從信息中提取知識(shí),每天在手機(jī)、電腦上看再多的信息也沒用。
第三步,有知識(shí)后要運(yùn)用,善于應(yīng)用知識(shí)解決問題才是智慧。
綜合信息得出規(guī)律是將信息轉(zhuǎn)化為知識(shí)的過程。有的人掌握了知識(shí),對(duì)已發(fā)生的事講得頭頭是道,但是一到實(shí)干就傻眼,這是沒智慧的表現(xiàn)。
所謂智能,實(shí)際上就是在信息中抓取決策的意圖、決策的背景等相關(guān)信息,最后在“臨門一腳”時(shí)能夠做出決策。信息和知識(shí)是輔助決策系統(tǒng),它們幫助人做出決策,人根據(jù)機(jī)器做出的決策實(shí)施,這就是智能化的過程。
所謂大數(shù)據(jù)蘊(yùn)含著人工智能,就在于把雜亂無章的數(shù)據(jù)提取為信息,把信息歸納出知識(shí),通過知識(shí)的綜合做出判斷,這就是大數(shù)據(jù)智能化所包含的三個(gè)環(huán)節(jié)。
三、人工智能
第一,人工智能如何讓數(shù)據(jù)產(chǎn)生智慧?
大數(shù)據(jù)之所以能夠智能化,能夠決策,能夠輔助決策,是因?yàn)樵谌斯ぶ悄芑蛴?jì)算機(jī)操作過程中有四個(gè)步驟:一是采集、抓取、推送,二是傳輸,三是存儲(chǔ),四是分析、處理、檢索和挖掘。
第一步,在大數(shù)據(jù)中不斷地過濾出有一定目的意義的信息,也就是采集、抓取、推送。
第二步、第三步是傳輸和存儲(chǔ),內(nèi)涵不言自明。大數(shù)據(jù)之大,不是在抽屜里靜態(tài)的閑置大數(shù)據(jù),而是在云里存儲(chǔ)、動(dòng)態(tài)傳輸?shù)拇髷?shù)據(jù)。
第四步是分析、處理、檢索和挖掘,關(guān)鍵技術(shù)在于算法。算法是輔助人類在非常繁雜、非常巨大的海量數(shù)據(jù)空間中,快速找到目標(biāo)、路徑和方法的工具。
第二,人工智能依靠大數(shù)據(jù)在分析、處理、檢索和挖掘中產(chǎn)生智能的關(guān)鍵在于大數(shù)據(jù)、算法以及高速度的計(jì)算處理能力。
沒有數(shù)據(jù)和大數(shù)據(jù)的長期積累、重復(fù)驗(yàn)證,有智能管理也沒有用;有了算法和大數(shù)據(jù),沒有高速度的計(jì)算能力也沒有用。算法是人工智能的靈魂,它變得“有靈氣”需要用大數(shù)據(jù)不斷地“喂養(yǎng)”,不斷地重復(fù)和訓(xùn)練。在這個(gè)意義上,大數(shù)據(jù)如果沒有算法,就沒有靈魂,就沒有大數(shù)據(jù)處理的真正意義。但是如果算法沒有大數(shù)據(jù)來“喂養(yǎng)”,即使數(shù)學(xué)家想出好的算法,智能也未必有效。
以柯潔與阿爾法圍棋的人機(jī)大戰(zhàn)為例,阿爾法圍棋中的算法是來源于人類各種各樣的棋譜、高明棋手的下棋步驟。人工智能工程師將這些數(shù)據(jù)全部放入谷歌的算法中運(yùn)行,運(yùn)行了幾萬次、幾十萬次。因?yàn)橛芯W(wǎng)絡(luò)深度學(xué)習(xí)的模塊,每運(yùn)行一次就聰明一點(diǎn)。這個(gè)過程是一個(gè)不斷反復(fù)、不斷學(xué)習(xí)的過程。
總而言之,人工智能、大數(shù)據(jù)和這些要素有關(guān),轉(zhuǎn)化為真正人工智能的時(shí)候,一靠大數(shù)據(jù),二靠算法,三還要靠高速度。
人類對(duì)工具使用的發(fā)展,本質(zhì)上是一個(gè)計(jì)算能力不斷提高的過程。在農(nóng)業(yè)社會(huì),中國人曾用自己的聰明智慧發(fā)明了算盤。算盤一秒鐘兩三個(gè)珠子撥動(dòng),每秒計(jì)算兩三下。到了工業(yè)社會(huì)初期,電被廣泛運(yùn)用。20世紀(jì)20年代,以繼電器作為基本器件的計(jì)算機(jī)問世。繼電器計(jì)算機(jī)震動(dòng)頻率非常高,每秒抖動(dòng)幾十次,比算盤快10~20倍。到了20世紀(jì)40年代,第二次世界大戰(zhàn)期間,電子管問世。電子管計(jì)算機(jī)每秒可計(jì)算幾萬次,是繼電器計(jì)算機(jī)的1 000倍,運(yùn)算速度非???。到了20世紀(jì)60年代,半導(dǎo)體問世,以三極管、二極管為元器件的電腦,一秒鐘能運(yùn)算幾十萬次到幾百萬次。到了20世紀(jì)80年代,半導(dǎo)體芯片問世,集成電路計(jì)算機(jī)的運(yùn)算速度到達(dá)每秒幾千萬次甚至幾億次。
中國的超算在10年前達(dá)到了億次,2015年前后到了10億億次,最新推出一個(gè)超算系統(tǒng)已經(jīng)超過100億億次。
但是,超級(jí)計(jì)算機(jī)不是一個(gè)芯片、一個(gè)電腦的運(yùn)算速度,而是幾千個(gè)電腦、幾千個(gè)服務(wù)器組合而成一個(gè)矩陣和一個(gè)算法。超級(jí)計(jì)算機(jī)能夠做到一秒鐘10億億次、100億億次,但單個(gè)芯片難以達(dá)到每秒運(yùn)算10億億次。
我們?yōu)槭裁捶浅V匾曇粋€(gè)芯片每秒能計(jì)算10億億次呢?在2012年出版的《奇點(diǎn)臨近》一書中提到,大概二三十年后,人造機(jī)器的計(jì)算速度將超過人腦。作者提出,人腦的運(yùn)算速度是每秒計(jì)算10億億次。當(dāng)計(jì)算機(jī)到了每秒計(jì)算10億億次以上時(shí),其運(yùn)算速度將超過人腦,拐點(diǎn)就會(huì)到來。
從科學(xué)的角度講,人工智能的計(jì)算能力不斷增強(qiáng),是人對(duì)工具使用的智慧不斷發(fā)展的結(jié)果。強(qiáng)大的計(jì)算能力、大數(shù)據(jù)、算法連在一起,超越了幾千小時(shí)、幾萬小時(shí)、幾十萬小時(shí),人無法等待的時(shí)間,使得大智慧逐步發(fā)展。
第三,云計(jì)算、大數(shù)據(jù)、人工智能的軟件植入在云計(jì)算廠商提供的數(shù)據(jù)處理中心硬件中,對(duì)客戶形成三種在線服務(wù)。
云計(jì)算的云是一個(gè)硬件,是一個(gè)具有通信能力、計(jì)算能力、存儲(chǔ)能力的基礎(chǔ)設(shè)施。云中除了存放大數(shù)據(jù)之外,同時(shí)提供各種各樣的算法作為一種服務(wù)軟件處理。大數(shù)據(jù)公司往往在搜集、組織管理了大量數(shù)據(jù)的基礎(chǔ)上,使用人工智能算法后為客戶提供有效的數(shù)據(jù)服務(wù),形成一個(gè)大數(shù)據(jù)的服務(wù)平臺(tái)。
所謂的人工智能公司,往往是依靠大數(shù)據(jù)平臺(tái)支撐提供算法服務(wù),算法軟件也是一種服務(wù)。它們共同形成了“數(shù)字化”的三大功能:第一個(gè)是IaaS,是基礎(chǔ)設(shè)施作為使用的服務(wù);第二個(gè)是PaaS,是大數(shù)據(jù)的平臺(tái)作為使用的服務(wù);第三個(gè)是SaaS,算法軟件也是一種服務(wù)。這三個(gè)詞組代表了“數(shù)字化”三兄弟,三種功能不同的軟件。
當(dāng)然,“數(shù)字化”也離不開互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)。一句話解釋就是,互聯(lián)網(wǎng)的時(shí)代是PC(個(gè)人電腦)時(shí)代,移動(dòng)互聯(lián)網(wǎng)的時(shí)代是手機(jī)加筆記本電腦的時(shí)代,物聯(lián)網(wǎng)時(shí)代就是萬物萬聯(lián)的時(shí)代。