本文來自微信公眾號(hào)“電子發(fā)燒友網(wǎng)”,作者/黃山明。
現(xiàn)如今,不少終端產(chǎn)品中都安裝了AI程序,不過這些AI程序基本上都需要通過互聯(lián)網(wǎng)訪問云端AI服務(wù),來實(shí)現(xiàn)各種智能化功能,例如語音識(shí)別、圖像識(shí)別、自然語言處理等。這種模式下,用戶的終端設(shè)備并不需要強(qiáng)大的本地AI處理能力,而是將數(shù)據(jù)上傳至云端服務(wù)器,在那里由大型AI模型進(jìn)行復(fù)雜的計(jì)算處理,并將結(jié)果返回給用戶。
但隨著人們需求提升,尤其是對(duì)設(shè)備的響應(yīng)速度與穩(wěn)定性,還有個(gè)性化服務(wù)需求的增加,本地AI可以根據(jù)用戶的特定習(xí)慣和偏好進(jìn)行優(yōu)化,使得體驗(yàn)更為個(gè)性化和無縫。
更重要的一點(diǎn)是,本地處理用戶數(shù)據(jù)可以減少數(shù)據(jù)泄露的風(fēng)險(xiǎn),因?yàn)閿?shù)據(jù)不需要被發(fā)送到云端服務(wù)器,這在一定程度上增強(qiáng)了用戶對(duì)隱私的保護(hù)。并且在沒有互聯(lián)網(wǎng)連接的情況下,本地AI仍然可以正常運(yùn)作,而依賴云端的智能家居設(shè)備可能會(huì)失去部分或全部功能。
高通的現(xiàn)任CEO安蒙曾公開表示,“真正有趣的地方在于讓生成式AI在智能手機(jī)本地運(yùn)行,而不是云端”,安蒙認(rèn)為“生成式AI的變革意義在于終端上的信息能夠幫助AI成為無處不在的個(gè)人助手”。
當(dāng)然,部署本地AI除了上述的原因外,網(wǎng)絡(luò)通暢性也至關(guān)重要。雖然如今5G已基本完成覆蓋,但完全跟不上AI的發(fā)展速度。數(shù)據(jù)顯示,一家波音787每秒產(chǎn)生5GB的數(shù)據(jù),而全球每時(shí)每刻都有數(shù)千駕飛機(jī)正在空中飛行,高通發(fā)布的《混合AI是AI的未來》中顯示,相比傳統(tǒng)方式,生成式AI的搜索成本增加了10倍,全球每天產(chǎn)生超過100億次的搜索查詢量。
隨著邊緣計(jì)算技術(shù)的進(jìn)步,越來越多的智能設(shè)備具備了一定程度的本地AI計(jì)算能力,能夠在離數(shù)據(jù)源頭更近的地方進(jìn)行預(yù)處理或初步?jīng)Q策,減輕云端壓力的同時(shí)也提高了效率。
不僅是高通,包括英偉達(dá)、AMD、英特爾等企業(yè)都認(rèn)為,本地AI計(jì)算、AI應(yīng)用本地化將會(huì)是未來主要發(fā)展方向之一。
本地AI面臨的難題
想要在本地部署AI,讓設(shè)備可以離線運(yùn)行,就需要確保終端設(shè)備具備足夠的計(jì)算能力,如CPU、GPU或TPU,以保證在有限的空間和功耗預(yù)算內(nèi)完成實(shí)時(shí)推理。另一方面,AI模型往往體積龐大,尤其是在深度學(xué)習(xí)領(lǐng)域。要在本地部署,必須優(yōu)化模型大小,使其適合小型化的智能家居設(shè)備有限的內(nèi)存和存儲(chǔ)資源。
為了適應(yīng)硬件限制,需對(duì)AI模型進(jìn)行剪枝、量化或知識(shí)蒸餾等操作,以降低計(jì)算復(fù)雜度和資源占用。同時(shí)開發(fā)節(jié)能型AI算法和硬件架構(gòu),確保在提供智能服務(wù)的同時(shí)不影響設(shè)備整體的能源效率。
在數(shù)據(jù)處理與隱私保護(hù)上,需要確保本地存儲(chǔ)和處理的數(shù)據(jù)受到充分的安全保護(hù),防止未經(jīng)授權(quán)的訪問和泄露。還要確保AI算法能在特定的嵌入式操作系統(tǒng)上穩(wěn)定運(yùn)行,并適配各類傳感器及設(shè)備接口驅(qū)動(dòng)。
不過即使在本地處理,也需要與云端及其他智能家居設(shè)備之間保持良好互聯(lián),以便在必要時(shí)進(jìn)行數(shù)據(jù)交換和協(xié)同工作。
體驗(yàn)上,本地AI需要提供與云端相似的用戶體驗(yàn),包括快速響應(yīng)用戶命令并做出準(zhǔn)確判斷。設(shè)計(jì)合理的故障檢測和恢復(fù)機(jī)制,并能方便地進(jìn)行遠(yuǎn)程或本地固件更新,包括AI模型的迭代升級(jí)。
因此,在目前來看,普通個(gè)人用戶想要在本土部署大模型AI的門檻較高,一個(gè)是普通用戶在技術(shù)能力上無法完成本體部署,另一方面,AI技術(shù)比如AI生圖等功能對(duì)性能要求較高,普通的芯片難以應(yīng)付,而專用芯片價(jià)格又比較昂貴。
同時(shí),不管是什么類型的AI應(yīng)用,算力都是繞不開的話題,如何做到快速響應(yīng)、低延遲等特點(diǎn),就需要有強(qiáng)力的本地AI算力支持。針對(duì)那些大型的家電設(shè)備而言可能還好,但對(duì)于一些小型的智能家居產(chǎn)品,如智能助手、智能中控屏等,在追求更強(qiáng)AI算力的同時(shí),還需要平衡好功耗,降低對(duì)內(nèi)存帶寬、顯存的高依賴。
當(dāng)然,阻礙本土AI應(yīng)用發(fā)展的最大難題,或許不在技術(shù)層面,而在于商業(yè)運(yùn)作上,如何實(shí)現(xiàn)有效的盈利模式,讓企業(yè)有動(dòng)力去推進(jìn)本地AI。
小結(jié)
盡管云端AI服務(wù)廣泛應(yīng)用,但在特定需求和環(huán)境下,本地AI仍然具有不可替代的價(jià)值?,F(xiàn)代智能設(shè)備通常采用混合策略,即根據(jù)應(yīng)用場景靈活利用云端和本地AI資源。而本地AI的部署,也將是主流AI芯片企業(yè)未來的重要發(fā)展方向。