本文來自微信公眾號(hào)“腦極體”,作者/風(fēng)辭遠(yuǎn)。
這個(gè)春節(jié)假期,一首《上春山》火了。吃瓜群眾熱熱鬧鬧學(xué)了一個(gè)假期的“春山學(xué)”,了解了搶占C位的各種技巧。
假期過去,開工大吉,手機(jī)行業(yè)開始搶占今年的C位。那么問題來了,今年智能手機(jī)最大的機(jī)會(huì)點(diǎn)在哪里?答案呼之欲出,當(dāng)然是AI大模型。去年下半年,手機(jī)廠商陸續(xù)推出端側(cè)大模型。春節(jié)剛過,OPPO發(fā)布了全新的AI戰(zhàn)略,宣布進(jìn)入AI時(shí)代。魅族宣布不再生產(chǎn)“傳統(tǒng)智能機(jī)”,全面擁抱AI時(shí)代。顯然,大模型就是手機(jī)行業(yè)的那座“春山”。
但根據(jù)“春山學(xué)”相關(guān)知識(shí),跟著大家一起上山是不夠的,必須更上一層才能穩(wěn)站C位。在大模型+手機(jī)的眾多結(jié)合點(diǎn)中,有一項(xiàng)能力是C位中的C位,妥妥的“真·春山無雙”——大模型+手機(jī)影像。
據(jù)說在這個(gè)春節(jié),一線城市的寫真店紛紛轉(zhuǎn)變了商業(yè)模式。原本大家都是去拍寫真,店家負(fù)責(zé)拍攝和修圖?,F(xiàn)在都是去拍AIGC照片,店家搖身一變?yōu)锳I提示工程師,用各種AIGC平臺(tái)來實(shí)現(xiàn)用戶種種匪夷所思的需求。
回來對(duì)比照片,也不是比你這張光打得不錯(cuò),你這張P得更自然,而是你這張照片用的什么提示詞,你這張一看就模型泛化性比較強(qiáng)……
總之,AI之風(fēng)正經(jīng)由照相館、寫真店、小程序、APP,強(qiáng)烈地吹拂著我們的影像生活。
但是問題來了,這些強(qiáng)烈的AIGC影像需求,真的必須去線下店才能完成嗎?為什么不能在手機(jī)端一鍵搞定?最近手機(jī)新品動(dòng)輒搭載幾十億參數(shù)的端側(cè)大模型,它們閑著干嘛呢?
事實(shí)上,手機(jī)里的大模型肯定是閑不住的。目前擁抱AI大模型的手機(jī),基本情況是大模型是大模型,影像是影像,但這種分裂局面必然會(huì)很快得到改變。
“大模型與移動(dòng)影像”的融合賽道,是2024年智能手機(jī)行業(yè)最為清晰的風(fēng)口,也是手機(jī)廠商急切想要上,也必須上了就不能下來的,具有戰(zhàn)略意義的那座“春山”。
大模型+手機(jī)影像,這座春山怎么上?我們來弄清其中的“春山學(xué)”問題吧。
六年之后
AI影像再上山
首先我們需要明確一點(diǎn),那就是AI+影像絕不是什么新鮮事物,甚至很多人都已經(jīng)習(xí)慣了AI與影像的結(jié)合。
這個(gè)概念開始受到業(yè)界重視,是早在2018年的時(shí)候。那一年4月,華為發(fā)布了P20手機(jī)。這款手機(jī)利用麒麟芯片的NPU端側(cè)算力,首次在拍照中搭載了AI功能,能夠識(shí)別包括寵物、人像、風(fēng)景、美食等19種場(chǎng)景,覆蓋500多個(gè)識(shí)別目標(biāo)。在AI識(shí)別這些目標(biāo)物后,會(huì)自動(dòng)調(diào)整攝影模式和參數(shù)設(shè)置。
隨后,這種AI攝影模式一度爆火,成為當(dāng)時(shí)最具熱度的手機(jī)技術(shù)升級(jí),并且逐漸為全行業(yè)所接受。隨著幾年發(fā)展,AI影像變得越來越復(fù)雜,可識(shí)別物越來越多,并且加入了動(dòng)態(tài)抓取、去除反光等AI能力,還與此后流行的計(jì)算攝影概念結(jié)合,成為手機(jī)影像系統(tǒng)中的基礎(chǔ)能力之一。
但到這個(gè)層面,AI攝影的能力依舊有顯著的局限性。它對(duì)圖片的作用集中于“美化”,而不是“修改”和“生成”。我們也探訪過一些AI攝影相關(guān)賽道的開發(fā)者,他們很希望能夠利用手機(jī)的AI能力做出更具創(chuàng)意的應(yīng)用,但端側(cè)算力和模型能力是主要的限制。
而伴隨著AI大模型的爆火,模型能力的關(guān)隘被突破了。在大模型的加持下,用戶可以對(duì)影像系統(tǒng)提出復(fù)雜的指令,影像系統(tǒng)也能夠更完整理解用戶交互邏輯與意圖指向。在能力上,大模型可以幫助完成高精度的圖像元素替換,甚至加入AI生成的影像。
或許可以這樣說,最初用戶聽聞AI影像概念的時(shí)候,腦海中設(shè)想的影像能力,其實(shí)是在今天才有可能實(shí)現(xiàn)的大模型影像。
伴隨著大模型能力落地手機(jī),AI影像終于可以完成關(guān)鍵一躍,實(shí)現(xiàn)那些早就許下的諾言。
大模型,就是AI影像的必須上的那座山。
春山上,風(fēng)景如何?
春節(jié)還沒過去,世界就感受到了來自Sora的視覺震撼。AI行業(yè)有句話,叫語言模型為打榜,視覺模型能賺錢。機(jī)器視覺能力是讓用戶感受到AI魅力最快速也最有效的方案。
長(zhǎng)期以來,手機(jī)影像可謂一卷再卷,卷無可卷,但用戶始終能做的只是拍攝圖片。AI大模型能力的加入,可以讓用戶獲得無門檻修改圖片,以及將AIGC影像與手機(jī)拍攝影像結(jié)合的能力。AI大模型+手機(jī)AI計(jì)算能力+手機(jī)影像系統(tǒng)的組合,極大拓展了手機(jī)影像的邊界,既繼承了手機(jī)廠商多年來的技術(shù)與供應(yīng)鏈布局,同時(shí)還獲得了新的增長(zhǎng)空間。
目前階段,這條賽道已經(jīng)迅速鋪開。比如三星就通過圖片助手功能,讓用戶實(shí)現(xiàn)了移動(dòng)圖片中目標(biāo),自動(dòng)填充空缺,生成新圖片的能力,從而讓手機(jī)影像具備更大的構(gòu)圖自由。
而OPPO Find X7系列則實(shí)現(xiàn)了通過AI大模型來提供AIGC消除功能。就像我們最近在廣告里看到的那樣,用戶可以把春節(jié)聚會(huì)時(shí)不想看到的人從合影中消除,同時(shí)依靠AIGC補(bǔ)齊背景。目前,F(xiàn)ind X7已經(jīng)可以支持最多6個(gè)主體單獨(dú)提取。除此之外,OPPO還更新了AI超清合影功能,可以智能識(shí)別并增強(qiáng)合影中人臉的清晰度。
可以預(yù)見的是,接下來我們會(huì)看到大量基于AI大模型實(shí)現(xiàn)的影像功能,比如AI摳圖,AI替換,AI擴(kuò)圖等。整體而言,大模型+手機(jī)影像會(huì)呈現(xiàn)三大發(fā)展趨勢(shì):
1.AIGC內(nèi)容與拍攝內(nèi)容結(jié)合。AIGC的文生圖平臺(tái),在過去一年快速贏得了用戶青睞,將這種能力與手機(jī)本身影像能力融合,是AI手機(jī)賽道上最關(guān)鍵的爭(zhēng)奪戰(zhàn)。
2.AI能力從應(yīng)用側(cè)上移,與手機(jī)本身的影像系統(tǒng)結(jié)合。目前,AI大模型帶來的視覺能力,更多還是單獨(dú)的軟件應(yīng)用。接下來,手機(jī)廠商會(huì)將這些能力上移到系統(tǒng)側(cè),成為產(chǎn)品本身的差異化賣點(diǎn)。
3.手機(jī)影像能力可以O(shè)TA。AI大模型的加入,一定程度上讓手機(jī)自身的影像能力成為可升級(jí),可迭代的軟件。讓手機(jī)自身的系統(tǒng)級(jí)能力也可以持續(xù)更新,持續(xù)運(yùn)營(yíng),是AI大模型帶給手機(jī)的一種新變化。
總體來看,大模型與手機(jī)影像的結(jié)合,有著非常充沛的創(chuàng)意發(fā)揮空間,有源源不斷的可能性。想要抓住這個(gè)機(jī)會(huì),客觀上將帶來手機(jī)廠商之間新一輪的技術(shù)競(jìng)賽。
那座山
就是下一個(gè)戰(zhàn)略高地
目前階段,還沒有廠商將“大模型+影像”這個(gè)概念旗幟鮮明地提出來,但這個(gè)概念以各種不同的名稱落地,應(yīng)該已經(jīng)為期不遠(yuǎn)。
需要注意的是,在端側(cè)部署大模型,以及發(fā)展出一些創(chuàng)意性的AI影像玩法都很容易,但要將AI大模型+影像真正發(fā)展為長(zhǎng)期賽道,構(gòu)成品牌的用戶心智支點(diǎn),那還需要廠商投入巨大的精力,來展開一場(chǎng)全新的智能手機(jī)行業(yè)競(jìng)賽。
其原因在于,大模型+手機(jī)影像是一場(chǎng)名副其實(shí)的綜合考驗(yàn)。它需要硬件側(cè)的算力配合,需要影像系統(tǒng)的支撐,同時(shí)也需要模型側(cè)的算法加持,更需要應(yīng)用開發(fā)創(chuàng)意以及AIGC專屬的視覺審美。從務(wù)實(shí)到務(wù)虛,從底層硬件到頂層應(yīng)用,大模型+手機(jī)影像的競(jìng)賽近乎覆蓋了手機(jī)行業(yè)的每個(gè)層級(jí)。
而重點(diǎn)來看,搶占大模型+影像的戰(zhàn)略高地,需要手機(jī)廠商在三個(gè)方面集結(jié)重兵:
1.AI基礎(chǔ)設(shè)施更新。這個(gè)基礎(chǔ)設(shè)施包括了AI算力與AI算法兩個(gè)部分。涉及芯片能力,端云協(xié)同能力,以及基礎(chǔ)算法能力。手機(jī)的AI基礎(chǔ)設(shè)施更新需求,也將帶動(dòng)產(chǎn)業(yè)鏈展開新一輪洗牌。
2.AI應(yīng)用的準(zhǔn)確把握。AI大模型能夠手機(jī)影像帶來的可能性不是太少,而是太多了。如何在有限的算力條件下,給用戶最準(zhǔn)確,最吸引人的AI影像應(yīng)用,將成為手機(jī)廠商面對(duì)的頭一道考題。
3.AI審美能力的建設(shè)。最近很多人注意到Sora團(tuán)隊(duì)有專門的藝術(shù)人才加入。藝術(shù)與審美能力在AIGC時(shí)代非常重要。隨著產(chǎn)業(yè)發(fā)展,算法能力會(huì)趨同,審美能力的差異化則會(huì)暴露出來。手機(jī)廠商過去更重視的是設(shè)計(jì)能力,這與藝術(shù)表達(dá)、審美判斷等能力是存在一定差異的。構(gòu)建屬于AI手機(jī)的新審美能力,是一項(xiàng)全新的賽事。
最后,說一個(gè)有點(diǎn)反常識(shí)的判斷:大模型+手機(jī)影像這座“春山”,其實(shí)還是很容易上的。其門檻遠(yuǎn)沒有手機(jī)廠商宣傳得那么夸張,但如果你最近用心學(xué)習(xí)了“春山學(xué)”教材,就會(huì)知道真正困難的不是上山,而是賴在山上不下來。
如何把大模型+手機(jī)影像從一個(gè)年度噱頭,變成可以多年發(fā)展的長(zhǎng)期賽道,甚至變成改寫產(chǎn)業(yè)格局的錨點(diǎn),那才是真正的考驗(yàn)。
不過好消息是,有春山可上至少證明了一件事:包裹手機(jī)行業(yè)的堅(jiān)冰正在技術(shù)暖風(fēng)的吹拂下開裂、消融。能否就此別冬入春,選擇權(quán)在從業(yè)者手中。