Google 所提供的網(wǎng)絡(luò)服務(wù)可能是地球上最大的計(jì)算機(jī)網(wǎng)絡(luò),這套網(wǎng)絡(luò)擁有 15 個(gè)倉庫大小的數(shù)據(jù)中心,并分布在四塊大陸上。
你可能會(huì)認(rèn)為這個(gè)網(wǎng)絡(luò)已經(jīng)足夠強(qiáng)大,日常使用 Google 自家的各種服務(wù)完全沒有問題,但 Google 并不這么認(rèn)為,Google 的工程師們也不這么認(rèn)為,他們擔(dān)心這套已經(jīng)非常龐大的網(wǎng)絡(luò)有一日會(huì)不堪重負(fù)。
為了省錢,自己做芯片
大約在六年前,Google 為其 Android 系統(tǒng)加入了新的語音識(shí)別技術(shù),也就是我們熟悉的 Google Now 和 Google Assistant.
而除了工作就是思考的 Google 工程師突然想到,如果世界上每個(gè) Android 手機(jī)用戶每人每天使用 Google 的語音搜索服務(wù) 3 分鐘,那么所需要的數(shù)據(jù)中心大小至少是現(xiàn)在的兩倍之多,如果用戶更加頻繁的使用 Google 語音服務(wù),那么當(dāng)前的數(shù)據(jù)中心將不堪重負(fù)。
此外,Google 當(dāng)時(shí)已經(jīng)開始研究使用深度神經(jīng)網(wǎng)絡(luò)和復(fù)雜的數(shù)學(xué)系統(tǒng)來開發(fā)其語音識(shí)別服務(wù),這使得其語音服務(wù)可以通過分析大量的數(shù)據(jù)來學(xué)習(xí)一些特定的任務(wù)處理能力。而這種機(jī)器學(xué)習(xí)形式,不但重新發(fā)明了語音識(shí)別,還促進(jìn)了圖像識(shí)別,機(jī)器翻譯,互聯(lián)網(wǎng)搜索等技術(shù)的發(fā)展,但它對(duì)數(shù)據(jù)處理的能力要求非??量?。
由于使用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)技術(shù),Google 看到機(jī)器的識(shí)別錯(cuò)誤率下降了25%,但是這種進(jìn)步需要更強(qiáng)大的數(shù)據(jù)處理能力,也就是說,需要更多的數(shù)據(jù)中心。
數(shù)據(jù)中心不夠用,那就多建幾座嘍?可是建這么多數(shù)據(jù)中心是要花上不少錢的,像 Google 這種財(cái)大氣粗的公司也不是拿錢不當(dāng)錢,精打細(xì)算過日子的理智心態(tài)也是有的。
因此 Google 的并沒有豪擲千金將其數(shù)據(jù)中心的占地面積翻番,而是專門為運(yùn)行深度神經(jīng)網(wǎng)絡(luò)研制了自家的計(jì)算機(jī)芯片—— Tensor Processing Unit, TPU(不是那個(gè)用來做手機(jī)殼的材料……)。在 TOPS / Watt 測(cè)試中,TPU 的性能高于標(biāo)準(zhǔn)處理器 30 到 80 倍,這個(gè)測(cè)試結(jié)果非常的可觀。
一顆芯片頂一座數(shù)據(jù)中心?
Google 在去年五月首次透露了自家這款定制處理器,但并沒有過多的透露其細(xì)節(jié)。現(xiàn)在,負(fù)責(zé) TPU 芯片研發(fā)的 Norm Jouppi 和他的團(tuán)隊(duì)發(fā)表了一篇文章,詳細(xì)說明了該項(xiàng)目,并解釋了 TPU 的運(yùn)行方式以及對(duì)一些特殊問題的解決方案。
Google 的 TPU 芯片僅用于執(zhí)行神經(jīng)網(wǎng)絡(luò)服務(wù),只是在用戶使用 Android 手機(jī)啟用語音指令或搜索指令的時(shí)候才會(huì)運(yùn)行。由于神經(jīng)網(wǎng)絡(luò)擁有自主學(xué)習(xí)的能力,因此不用特意訓(xùn)它。但是,Jouppi 說,TPU 除了能讓神經(jīng)網(wǎng)絡(luò)能夠自主學(xué)習(xí)和高速運(yùn)算外,最重要的是,Google 不需要為擔(dān)心數(shù)據(jù)運(yùn)算能力不足而多建額外 15 個(gè)數(shù)據(jù)中心,這樣便節(jié)省了大量的成本。
外媒 Wired 認(rèn)為,TPU 將為計(jì)算機(jī)芯片領(lǐng)域帶來重大轉(zhuǎn)變。由于 Google,F(xiàn)acebook,微軟等互聯(lián)網(wǎng)巨頭使用深度神經(jīng)網(wǎng)絡(luò)構(gòu)建其服務(wù)的動(dòng)作越來越多的服務(wù),他們都需要專門的芯片來訓(xùn)練和運(yùn)行這些 AI 模型。
但不同的是,Google 在構(gòu)建自己的芯片,而很多公司還在使用 GPU 來解決深度神經(jīng)網(wǎng)絡(luò)和人工智能的問題。
Google 自家芯片的出現(xiàn),也為計(jì)算機(jī)芯片市場(chǎng)帶來了沖擊。由于有了自己的芯片,Google 不用再購買別家的芯片來適應(yīng)自己的神經(jīng)網(wǎng)絡(luò)和人工智能架構(gòu),而 Google 甚至有可能成為 TPU 芯片的供應(yīng)商,因?yàn)橄?Facebook,微軟和亞馬遜這類公司都是芯片的高級(jí)買主。同時(shí),大型的芯片制造商,如英特爾等,也正在研發(fā)類似的處理器以適應(yīng)新的市場(chǎng)需求。
適用于多種神經(jīng)網(wǎng)絡(luò)模型
此外,Google 的這塊 TPU 芯片可以用在當(dāng)下任何一個(gè)深度神經(jīng)網(wǎng)絡(luò)中,包括從圖像識(shí)別中使用的神經(jīng)網(wǎng)絡(luò)到用于識(shí)別語音命令的神經(jīng)網(wǎng)絡(luò)等。用 Jouppi 的話說:
我們并不會(huì)因問別人造了個(gè)新的神經(jīng)網(wǎng)絡(luò)架構(gòu)而把我們這塊芯片當(dāng)作垃圾扔掉。
不過 Jouppi 也認(rèn)為,TPU 還有進(jìn)一步提高性能的空間。如果使用 NVIDIA K80 GPU 中存的 GDDR5 顯存,TPU 便可以提供比 Google 當(dāng)前測(cè)試中獲得的更好的性能。根據(jù) Google 當(dāng)前的的測(cè)試發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)一些服務(wù)的性能受到內(nèi)存帶寬的限制,而 GDDR5 則能解決這些問題。
Google 其實(shí)已經(jīng)在兩年前就用上 TPU 芯片了,而 TPU 芯片除了用于圖像識(shí)別和機(jī)器翻譯,最值得夸耀的事跡就是那個(gè)在去年打敗韓國(guó)棋手李世石的人工智能 AlphaGo 了。
TPU 芯片的未來?現(xiàn)在看來,很明朗,而機(jī)器學(xué)習(xí)和人工智能發(fā)展的步伐,或許也會(huì)因此加快。