為了讓你盡快用上AI,過去一年谷歌做了這些事兒

葉子豬
佚名
谷歌這一年,在AI方面都有哪些成果與進展?年末將至,近日谷歌在東京舉辦了一場分享會,圍繞Made with AI對過去一年的成果做了總結(jié)。谷歌資深研究員、Google Brain負責人Jeff Dean開場提綱挈領(lǐng)地講到,谷歌在人...

谷歌這一年,在AI方面都有哪些成果與進展?年末將至,近日谷歌在東京舉辦了一場分享會,圍繞Made with AI對過去一年的成果做了總結(jié)。谷歌資深研究員、Google Brain負責人Jeff Dean開場提綱挈領(lǐng)地講到,谷歌在人工智能領(lǐng)域的愿景,是通過三種途徑讓每個人都從中受益:

使谷歌的產(chǎn)品更加實用;

幫助企業(yè)和開發(fā)者創(chuàng)新;

為研究人員提供工具,從而解決人類面對的各項重大挑戰(zhàn)。

AI賦能軟件

Jeff提到,機器學習是谷歌在人工智能領(lǐng)域的工作重心。作為計算機科學的一種形式,他認為機器學習編寫能使計算機自主學習如何變得智能,要比直接編寫智能程序要更為簡單。

說到谷歌開展機器學習的研究,Jeff再次使用了谷歌在2012年關(guān)于機器識貓的論文,和2015年谷歌開源TensorFlow這兩個重要事例?,F(xiàn)在,TensorFlow是GitHub上最受歡迎的工具。

Jeff認為,機器學習仍處于發(fā)展初期。如今,機器學習對分類、預測、理解和生成這四個關(guān)鍵方面很有幫助。這些功能幾乎被應用于谷歌所有的產(chǎn)品中,使產(chǎn)品更加實用,例如:谷歌相冊,谷歌翻譯,谷歌地圖和Google Lens等等。下面分別做一簡要總結(jié)介紹。

谷歌相冊(Google Photos),被重點提出的功能是照片搜索(Photo Search)。谷歌相冊可以通過圖像識別妥善分類所有照片,使查找更方便。

而谷歌翻譯(Google Translate),可以和谷歌相冊結(jié)合起來使用。用相機照下的圖片,它可以幫你翻譯出來。

Jeff介紹,事實上翻譯這項工作已經(jīng)持續(xù)了十年。在過去,翻譯系統(tǒng)并非基于神經(jīng)網(wǎng)絡,而是使用更簡單的統(tǒng)計翻譯模型,由50萬行代碼組成。2016年推出的新神經(jīng)網(wǎng)絡機器翻譯系統(tǒng),經(jīng)過了簡單卻有效的數(shù)據(jù)訓練。新系統(tǒng)僅由500行TensorFlow代碼組成,而非50萬行。

“我們?nèi)ツ昵锾扉_始使用新的神經(jīng)網(wǎng)絡翻譯系統(tǒng)后,翻譯準確性得到了很大的改進,可比肩過去十年中取得的提升。”Jeff說。

現(xiàn)在,谷歌將神經(jīng)網(wǎng)絡機器翻譯應用到了97組語言當中。效果提升最明顯的是日英互譯。

谷歌地圖(Google Map),即便在沒有數(shù)據(jù)許可的情況下,通過衛(wèi)星的介入,加上機器學習和計算機視覺等技術(shù)也可以產(chǎn)生可用的地圖。

Google Lens,可以把你看到的東西搜索出來,得到相關(guān)的信息。

而文本理解能力的提升,讓Gmail更好用。比如智能系統(tǒng)通過讀取內(nèi)容和預測回應,可以給用戶提供回復答案或建議。Gmail數(shù)據(jù)顯示,目前有12%的回復來自手機,這將使人們的日常工作更加便捷。

這里值得一提的是谷歌助理(Google Assistant),它的核心技術(shù)是語音識別,包含了很多機器學習的相關(guān)技術(shù)。“沒有人工智能和機器學習,這個產(chǎn)品是不可能存在的。”Jeff強調(diào)道。

使用 Google Assistant,用戶可以與谷歌進行自由對話,從而完成不同種類的任務,比如尋找某一問題的答案、導航服務、獲取新聞或得到日程安排方面的幫助。

Google Assistant 可以在不同設(shè)備間通用。目前,Google Assistant 可使用的國家和地區(qū)包括:

澳大利亞,巴西,加拿大(英文和法文),德國,法國,意大利,印度(英文,印度文),印度尼西亞,日本,韓國,墨西哥,新加坡,西班牙,英國和美國(英文,西班牙文)。(是的,并沒有中國。)

在YouTube上,谷歌通過機器學習給超過10億的視頻自動加上字幕,使得有聽覺障礙的人可以看到視頻中的對白。

軟硬結(jié)合:AI賦能硬件

Jeff介紹了谷歌將新型的硬件與軟件相結(jié)合的一個實例:Pixel Buds。作為一款耳機,它能將使用者周圍人說的話實時翻譯成使用者的母語,運用了語音識別和翻譯技術(shù)。

Google產(chǎn)品經(jīng)理Isaac Reynolds介紹了新款Pixel手機中的人像模式( Portrait Mode)。

機器學習和計算攝像的結(jié)合為新Pixel手機的人像模式賦能。通過這個功能,使用者可以拍攝具有一定景深效果的人像。拍攝這種照片,相機一般需要比較大的光圈,而Pixel僅需正反各一個鏡頭。

這就是谷歌在硬件方面正在采用的新處理方式:讓硬件、軟件、以及 AI 相互結(jié)合。

接著,Isaac介紹了Google Home中的語音配對功能(Voice Match):機器學習的加入有助于識別不同的語音,使最多六個用戶連接到同一臺Google Home。

在機器學習和語言方面,搜索項目總監(jiān)Linne Ha介紹了語音搜索和文本轉(zhuǎn)語音項目。

語音搜索 (Voice Search),指在機器學習的幫助下,自然語言處理系統(tǒng)能夠更好地理解人們想說的話。Linne介紹道,谷歌的語音搜索現(xiàn)在支持119種語言,其中包括11種印度語言和3種印度尼西亞語言。

Project Unison,是一個利用機器學習實現(xiàn)文本轉(zhuǎn)語音 (Text-to-Speech)的實驗項目。通過轉(zhuǎn)換引擎,手機可以用語料并不豐富的語種,如孟加拉語、高棉語和爪哇語與用戶對話。而機器學習模型有助于減少構(gòu)建文本到語音模型所需的數(shù)據(jù)量。

新浪科技總結(jié)下來,谷歌的策略就是“軟硬結(jié)合、硬件打通”,讓語言、語音和圖像技術(shù)在各個設(shè)備上和場景中無縫接合。

AI賦能開發(fā)者

谷歌為企業(yè)及開發(fā)者提供三種創(chuàng)新工具:TensorFlow,云機器學習 API (Cloud Machine Learning APIs) 以及張量處理器 (Tensor Processing Unit, TPU) 電腦芯片。

其中TensorFlow現(xiàn)在有1萬的全球開發(fā)者在使用。使用TensorFlow的也包括一些中國企業(yè),比如小米。

最后一部分是谷歌產(chǎn)品經(jīng)理Lily Peng介紹如何用AI讓世界更美好。人工智能還能應用于醫(yī)療、環(huán)保、節(jié)能、動物保護等等各方面。

讓AI惠及每一個人

分享會的最后,Jeff再次上臺,介紹了當下谷歌在AI方面的一些思路。Jeff提到,作為一家AI First的公司,谷歌希望讓每個人都能夠從人工智能中獲益。 目前已經(jīng)取得了一些進展,但是仍然有一些困難需要克服,例如:

首先,需要想方設(shè)法讓機器學習模型的創(chuàng)作過程更加觸手可及。

對此谷歌的解決方案是提供培訓。谷歌明年將在互聯(lián)網(wǎng)上提供免費的機器學習課程,現(xiàn)在已經(jīng)有1.8萬名谷歌員工參加過此項培訓。

其次,谷歌正在研究如何使用AutoML自動創(chuàng)建機器學習模型。

為了確保谷歌構(gòu)建的機器學習模型具有包容性,并且能夠真正為每個人所用,谷歌還啟動了People + AI Research (PAIR) 計劃,旨在將谷歌的研究人員聚集在一起,研究并重新設(shè)計人與人工智能系統(tǒng)交互的方式。Facets正是此計劃所孕育出的一種工具,能夠用于機器學習的訓練數(shù)據(jù)可視化。

谷歌還與Geena Davis研究所合作建立了GD-IQ,一種利用機器學習檢測電影中性別偏見的工具??傊?,谷歌在AI方面的長遠目標,就是要讓機器學習和AI變得觸手可及。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論