一個(gè)1600萬美元的點(diǎn)子:給人工智能建一個(gè)“圖書館”

鈦媒體
佚名
    SafeGraph團(tuán)隊(duì)。圖片來源/siliconangle.com 舊金山初創(chuàng)數(shù)據(jù)公司SafeGraph近日獲得1千6百萬美元的A輪融資,由IDG資本美國領(lǐng)投,近百位創(chuàng)投業(yè)大佬跟投。 這份名單...

  SafeGraph團(tuán)隊(duì)。圖片來源/siliconangle.com

舊金山初創(chuàng)數(shù)據(jù)公司SafeGraph近日獲得1千6百萬美元的A輪融資,由IDG資本美國領(lǐng)投,近百位創(chuàng)投業(yè)大佬跟投。

這份名單星光熠熠,其中出現(xiàn)了彼得·蒂爾,Adam D’Angelo(Facebook第一任CTO,Quora創(chuàng)始人),有極深政治背景的Eric CantorKT zu Guttenberg, Jack Dangermond(數(shù)字地圖之父 ), Barry Sternlicht(喜達(dá)屋集團(tuán)創(chuàng)始人), Pete Briger(峰堡投資集團(tuán)Fortress Investment創(chuàng)立者之一),Naval Ravikant(AngelList的CEO及聯(lián)合創(chuàng)始人,投資了包括Uber、Twitter、Yammer等眾多知名科技公司 ),Nicolas Berggruen等各界投資者。

SafeGraph成立于2016年,旨在打造一個(gè)龐大的,供機(jī)器學(xué)習(xí)(machine learning)使用的數(shù)據(jù)庫,以加速機(jī)器學(xué)習(xí)及人工智能的發(fā)展。

就像人類通過閱讀過往的文獻(xiàn)典籍,整理知識,總結(jié)規(guī)律,以此為參考,作出下一個(gè)決策,這個(gè)數(shù)據(jù)庫,就像專為人工智能而建的圖書館,機(jī)器可以通過查詢、閱讀、分析、綜合已有的數(shù)據(jù),預(yù)測未來。

資本市場可以把人工智能這個(gè)概念吹成一朵花,但不能忽視的是,目前的技術(shù)還是很粗糙。

借用數(shù)據(jù)科學(xué)家Monica Roati的話,

“我們嘲笑手機(jī)的自動拼寫功能常和我們的原意相差十萬八千里,我們嘲笑GPS系統(tǒng)把我們要的餐館定位到了1000公里之外。但這很令人喪氣:如果現(xiàn)在我們連最簡單的問題都解決不了,未來我們又怎能讓人工智能技術(shù)提高人類生活質(zhì)量呢?”

要從根本上提高機(jī)器學(xué)習(xí)的能力,海量數(shù)據(jù)是關(guān)鍵。

谷歌是目前世界上最頂尖人工智能企業(yè),但其搜索引擎的負(fù)責(zé)人Peter Norvig也承認(rèn),他們的算法并不是世界頂尖的,他們有的,只是比別人更多的數(shù)據(jù)。

舉個(gè)例子,谷歌搜索引擎看了1千萬個(gè)YouTube視頻才學(xué)會辨認(rèn)什么是“貓”。而微軟的研究員Michele Banko和Eric Brill發(fā)現(xiàn),即便是最糟糕的算法,如果收到了以指數(shù)級增長的海量數(shù)據(jù),也會搖身一變,成為頂尖智能算法。

  

谷歌看了1千萬個(gè)視頻才會辨認(rèn)“貓”。圖片來源/medium.com

可是,現(xiàn)在難有公司能與谷歌、Facebook這樣的巨頭競爭數(shù)據(jù)量。初創(chuàng)企業(yè)融資再多,也要和成百上千家公司談合作拿數(shù)據(jù),這一過程可能就要花費(fèi)巨大精力,和長達(dá)幾年的時(shí)間。

即便手握足夠數(shù)據(jù),他們也要面對數(shù)據(jù)管理的挑戰(zhàn)。

首先,數(shù)據(jù)的存儲、數(shù)據(jù)模型、數(shù)據(jù)分析格式、數(shù)據(jù)庫的基礎(chǔ)架構(gòu)都要重頭建起,必須能用,而且不能出錯(cuò)。之后,還要進(jìn)行數(shù)據(jù)清洗。不是所有數(shù)據(jù)都是直接可用的,它們大多雜亂無章、難以理解、無法獲取、甚至有所缺失。

人工智能領(lǐng)域最聰明的一群人都想造出能真正促進(jìn)人類社會發(fā)展的產(chǎn)品和應(yīng)用,比如無人駕駛,比如預(yù)測世界經(jīng)濟(jì)走勢的系統(tǒng),比如超級醫(yī)療診斷系統(tǒng)。但格式良好、適合分析的數(shù)據(jù)不會從天而降。目前,他們把80%的時(shí)間花在了整理歷史數(shù)據(jù)上。

  

微軟的研究員發(fā)現(xiàn),算法的準(zhǔn)確性隨著數(shù)據(jù)量的增大而提升。圖片來源/ucrel.lancs.ac.uk

等這一切都被成功解決,馬上,他們又要和數(shù)據(jù)監(jiān)管部門打交道,并在數(shù)據(jù)隱私保護(hù)問題上受到政府與公眾的道德拷問。

這是一種對資源與時(shí)間的巨大浪費(fèi),再這么下去,不知何年何月我們才能看到人工智能真正的創(chuàng)新。

  SafeGraph在這個(gè)時(shí)候出現(xiàn)。他們想打通所有數(shù)據(jù)(democratizing access to data),降低數(shù)據(jù)門檻。

該公司的首席執(zhí)行官Auren Hoffman說,“整理過往數(shù)據(jù),和預(yù)測未來趨勢,是兩種完全不同的技能。要預(yù)測未來,不需要精通前者。”

  SafeGraph的將自己定位成數(shù)據(jù)搜集與管理公司,其它公司可以租用他們數(shù)據(jù),把時(shí)間空出來,集中精力進(jìn)行真正有價(jià)值的研究。

它的首款產(chǎn)品是一個(gè)地理空間數(shù)據(jù)平臺,為城市規(guī)劃者、零售商、學(xué)術(shù)研究人員、營銷人員及投資者服務(wù),便于其了解人類社會活動軌跡。

Hoffman將A輪融資描述為“非常規(guī)公司的非常規(guī)融資”。他表示,“大多數(shù)公司不會在首輪就融資1600萬美元,而且不會引入超過100名獨(dú)立投資者以及一個(gè)最頂級的VC,但是我們不是一家傳統(tǒng)的公司。” 在A輪融資中就引入100個(gè)獨(dú)立投資者很不尋常,從管理的角度看這很可能是一場噩夢。但是Hoffman認(rèn)為,這些投資者中很多是來自于廣告業(yè),或者他的上一家公司LiveRamp,這些業(yè)內(nèi)資深人士的建議對SafeGraph的未來發(fā)展彌足珍貴。

THEEND