人工智能不過就是一種高級的現(xiàn)代統(tǒng)計學?

精雕細課
我們?nèi)粘J褂秒娮赢a(chǎn)品,定期都會清理一下內(nèi)存,因為有許多數(shù)據(jù)屬于垃圾信息,對我們毫無用處。然而隨著大數(shù)據(jù)和人工智能技術的發(fā)展,許多公司卻越來越熱衷于收集以往被我們視為垃圾的信息。
我們?nèi)粘J褂秒娮赢a(chǎn)品,定期都會清理一下內(nèi)存,因為有許多數(shù)據(jù)屬于垃圾信息,對我們毫無用處。然而隨著大數(shù)據(jù)和人工智能技術的發(fā)展,許多公司卻越來越熱衷于收集以往被我們視為垃圾的信息。
 
為什么在今天這些數(shù)據(jù)突然變得重要起來了呢?且看知名媒體人吳伯凡老師如何為你答疑解惑,帶你洞悉大數(shù)據(jù)和人工智能的本質。
 
實際上,很多數(shù)據(jù)都相當于是交易垃圾。什么叫垃圾?我完成這個事的時候,額外產(chǎn)生、跟我的目的沒有什么關聯(lián)的一些所謂的資源。但是,垃圾你也可以把它當燃料來燒,也是一種資源。所以過去那句話說得很對,沒有垃圾,只有放錯位置的資源。
 
現(xiàn)在人類每一年產(chǎn)生的數(shù)據(jù),可能是在此之前所有年代產(chǎn)生數(shù)據(jù)的總和,但產(chǎn)生這些數(shù)據(jù)是不需要什么成本的。比如對你來說,你每天產(chǎn)生了很多數(shù)據(jù),這個東西,你是在順帶著產(chǎn)生的。比如說你一天走了多少步,你從哪到哪,所有這些數(shù)據(jù),你都不是有意去生產(chǎn)出來的,是自然而然附帶著產(chǎn)生出來的。問題在于,誰來收集這些數(shù)據(jù)?
 
另一方面,光收集是沒有意義的。數(shù)據(jù)最重要的作用是,將它作為一種原料。這就依賴于極其專業(yè)的數(shù)據(jù)分析、挖掘技術,然后從中提煉出有用的東西來。
 
 
▲大慶油田采油現(xiàn)場
 
就像石油一樣。北宋的時候就有人發(fā)現(xiàn)有石油這個東西,就是從石頭縫里頭冒出來的一些油。這個油毫無用處,因為如果你點燈的話你是點不好的,火都點不出來,然后非常難聞的氣味,熏得到處都是黑的。所以這個東西當時只是記載了,地底下有一種油,它沒有用。
 
為什么沒有用?其實它有大用。關鍵是:第一,你有沒有大量開采這個石油的能力;第二,你有沒有提煉石油的這個技術;第三,即使提煉出來了,這個用途在哪?
 
其實在汽車出現(xiàn)之前,美國人就已經(jīng)開始利用石油。當時只是把它當成是一種化工原料,從中提煉出了需要的東西之后,會順帶著出現(xiàn)一種油,也就是汽油。人們發(fā)現(xiàn)這種油非??膳?,易燃,你保存得不好的話,就會導致很大的危險,屬于危險品。
 
所以產(chǎn)生的這些油怎么辦?你用它來點燈是很危險的,那怎么辦?他們就把這些油偷偷地倒進河里,這是違法的,也很危險。因為如果它在水面上一遇到火,說不定把船只都給燒了。也就是說,當時處理這些油都是要成本的,還冒著風險。后來有了汽車,才知道這種油的用途在哪里。
 
 
▲針對少數(shù)個人的數(shù)據(jù),沒有太大用處
 
大數(shù)據(jù)也是一樣,少量的數(shù)據(jù)是沒有用的。比如說針對你個人,你每天產(chǎn)生的這些數(shù)據(jù),其實沒有多大的用處。除非你是一個很重要的人物,某個人想針對你,對某個間諜機構你的這些數(shù)據(jù)才有意義。但對大多數(shù)人來說,這些數(shù)據(jù)沒有意義。
 
但是,如果這些數(shù)據(jù)匯入到一個整體的數(shù)據(jù)庫當中,一家生產(chǎn)服裝的公司,生產(chǎn)鞋的公司,或者生產(chǎn)任何什么東西的那些公司,有能力對這些數(shù)據(jù)進行挖掘,就可以對消費者的需求進行預測和判斷。就是說,資源依賴于你的開發(fā)能力,以及你能夠把它放在什么樣的位置。還是那句話,所謂垃圾就是放錯位置的資源。這幾個條件不滿足的話,數(shù)據(jù)就是沒有意義的。
 
我再總結一下,第一,一定是海量的非結構性數(shù)據(jù)才有意義,單個人或少量的數(shù)據(jù)是沒有意義的;第二,大數(shù)據(jù)的運用需要強大的數(shù)據(jù)挖掘能力,這依賴于現(xiàn)代強大的計算能力。在這個基礎上,它能夠進行挖掘,能夠提煉出真正的有價值的信息、知識甚至是智能;第三,它有沒有用場?為什么現(xiàn)在大數(shù)據(jù)的運用只是在零售業(yè)比較有用,其他的地方用得還很少?也許是這些數(shù)據(jù),它生成的這些智能,在其他的地方我們還沒有找到應用場景。在零售業(yè)呢,它很快地能夠從這些數(shù)據(jù)中獲知消費者的偏好,以及流量,等等,這樣一些信息和知識,它馬上就能夠用。
 
 
▲“云計算”是大數(shù)據(jù)的基礎
 
我們說ABC時代,A就是AI;B就是big data,注意是BIG data,是大數(shù)據(jù);C是cloud computing,云計算。這個云計算是基礎,是所有的數(shù)據(jù)采集,數(shù)據(jù)產(chǎn)生,匯聚,挖掘的基礎設施。為什么今天數(shù)據(jù)突然變得特別重要?是因為有這個云,擁有近乎無限的存儲能力和計算能力。
 
但是,我們一般人是感受不到云的,我們頂多在手機上有一個什么cloud。其實這個東西非常關鍵,它是基礎。在這個云之上,就是大數(shù)據(jù),在大數(shù)據(jù)之上才產(chǎn)生智能,這三者本質上我覺得它就是三位一體的。有一個專家說得特別好,說人工智能不過就是一種高級的現(xiàn)代統(tǒng)計學。就是你之所以有智能,是根據(jù)大量的數(shù)據(jù)匯聚以后分析、提煉出來的,所以它是一種統(tǒng)計學。
THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論