AR技術(shù)現(xiàn)已成為繼多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)之后被廣泛關(guān)注及研究的又一大熱點(diǎn)技術(shù)?,F(xiàn)如今,如論是國(guó)外的谷歌、蘋果、微軟等科技巨頭,還是國(guó)內(nèi)BAT都在加大力度布局AR。
近些年來,AR一直是資本追逐的焦點(diǎn)。在經(jīng)歷了2016的“爆紅”和2017年的“養(yǎng)精蓄銳”后,到了2018年,AR的市場(chǎng)環(huán)境已趨于穩(wěn)定,無論是技術(shù)研發(fā)、產(chǎn)品應(yīng)用還是投資方面都變得更加平穩(wěn),沒有大波動(dòng)。同時(shí),巨頭的框架布局已經(jīng)全部完成。國(guó)外的谷歌、蘋果、微軟等巨頭對(duì)于AR的布局已經(jīng)成型,國(guó)內(nèi)BAT等大公司也已經(jīng)完成了AR SDK的發(fā)布,有的已經(jīng)被開發(fā)者應(yīng)用。
那么,AR這么“紅”,到底是憑什么呢?就讓小編來告訴你吧!
什么是AR?詳見:《什么是AR?AR到底能干嘛?》
AR是增強(qiáng)現(xiàn)實(shí)(Augmented Reality)的簡(jiǎn)稱,指通過計(jì)算機(jī)系統(tǒng)提供的信息增加用戶對(duì)現(xiàn)實(shí)世界感知的技術(shù),將虛擬的信息應(yīng)用到真實(shí)世界,并將計(jì)算機(jī)生成的虛擬物體、場(chǎng)景或系統(tǒng)提示信息疊加到真實(shí)場(chǎng)景中,從而實(shí)現(xiàn)對(duì)現(xiàn)實(shí)的增強(qiáng)。
或許很多人對(duì)它的“近親”VR(虛擬現(xiàn)實(shí))更為熟悉,甚至常常將兩者混淆。不過,雖然AR技術(shù)的出現(xiàn)源于虛擬現(xiàn)實(shí)技術(shù)(Virtual Reality,簡(jiǎn)稱VR)的發(fā)展,但二者還是存在明顯差別的。那么什么是VR呢?詳見:《什么是VR?VR到底能干嘛?》
AR與VR的區(qū)別
虛擬現(xiàn)實(shí)(VR)是利用PC模擬出三維空間的虛擬世界,可以提供給用戶關(guān)于視覺、聽覺等感官的模擬,并且能夠及時(shí)、沒有限制地觀察三維空間內(nèi)的事物,從而達(dá)到以假亂真的沉浸感。
增強(qiáng)現(xiàn)實(shí)(AR)則是通過攝像機(jī)影像的位置及角度精算并加上圖像分析技術(shù),讓屏幕上虛擬世界可以和現(xiàn)實(shí)世界場(chǎng)景進(jìn)行結(jié)合與互動(dòng)。
簡(jiǎn)單來說,VR技術(shù)給予用戶一種在虛擬世界中完全沉浸的效果,是另外創(chuàng)造一個(gè)世界;而AR技術(shù)則把計(jì)算機(jī)帶入到用戶的真實(shí)世界中,通過聽、看、摸、聞虛擬信息,來增強(qiáng)對(duì)現(xiàn)實(shí)世界的感知,實(shí)現(xiàn)了從“人去適應(yīng)機(jī)器”到技術(shù)“以人為本”的轉(zhuǎn)變。
什么?還要再簡(jiǎn)單點(diǎn)?沒問題,上圖:
這是VR:
而這才是AR:
現(xiàn)在你應(yīng)該理解二者的不同,并可以成功將它們區(qū)分開了吧。很好!那讓我們趁熱打鐵,了解一下AR的技術(shù)原理。
AR的技術(shù)原理
AR從其技術(shù)手段和表現(xiàn)形式上,可以明確分為大約兩類,一是Vision based AR,即基于計(jì)算機(jī)視覺的AR,二是LBS basedAR,即基于地理位置信息的AR。
1.Vision based AR
基于計(jì)算機(jī)視覺的AR是利用計(jì)算機(jī)視覺方法建立現(xiàn)實(shí)世界與屏幕之間的映射關(guān)系,使我們想要繪制的圖形或是3D模型可以如同依附在現(xiàn)實(shí)物體上一般展現(xiàn)在屏幕上,如何做到這一點(diǎn)呢?本質(zhì)上來講就是要找到現(xiàn)實(shí)場(chǎng)景中的一個(gè)依附平面,然后再將這個(gè)3維場(chǎng)景下的平面映射到我們2維屏幕上,然后再在這個(gè)平面上繪制你想要展現(xiàn)的圖形,從技術(shù)實(shí)現(xiàn)手段上可以分為2類:
(1)Marker-Based AR
這種實(shí)現(xiàn)方法需要一個(gè)事先制作好的Marker(例如:繪制著一定規(guī)格形狀的模板卡片或者二維碼),然后把Marker放到現(xiàn)實(shí)中的一個(gè)位置上,相當(dāng)于確定了一個(gè)現(xiàn)實(shí)場(chǎng)景中的平面,然后通過攝像頭對(duì)Marker進(jìn)行識(shí)別和姿態(tài)評(píng)估(Pose Estimation),并確定其位置,然后將該Marker中心為原點(diǎn)的坐標(biāo)系稱為Marker Coordinates即模板坐標(biāo)系,我們要做的事情實(shí)際上是要得到一個(gè)變換從而使模板坐標(biāo)系和屏幕坐標(biāo)系建立映射關(guān)系,這樣我們根據(jù)這個(gè)變換在屏幕上畫出的圖形就可以達(dá)到該圖形依附在Marker上的效果,理解其原理需要一點(diǎn)3D射影幾何的知識(shí),從模板坐標(biāo)系變換到真實(shí)的屏幕坐標(biāo)系需要先旋轉(zhuǎn)平移到攝像機(jī)坐標(biāo)系(Camera Coordinates)然后再?gòu)臄z像機(jī)坐標(biāo)系映射到屏幕坐標(biāo)系。
在實(shí)際的編碼中,所有這些變換都是一個(gè)矩陣,在線性代數(shù)中矩陣代表一個(gè)變換,對(duì)坐標(biāo)進(jìn)行矩陣左乘便是一個(gè)線性變換(對(duì)于平移這種非線性變換,可以采用齊次坐標(biāo)來進(jìn)行矩陣運(yùn)算)。公式如下:
矩陣C的學(xué)名叫攝像機(jī)內(nèi)參矩陣,矩陣Tm叫攝像機(jī)外參矩陣,其中內(nèi)參矩陣是需要事先進(jìn)行攝像機(jī)標(biāo)定得到的,而外參矩陣是未知的,需要我們根據(jù)屏幕坐標(biāo)(xc,yc)和事先定義好的Marker坐標(biāo)系以及內(nèi)參矩陣來估計(jì)Tm,然后繪制圖形的時(shí)候根據(jù)Tm來繪制(初始估計(jì)的Tm不夠精確,還需要使用非線性最小二乘進(jìn)行迭代尋優(yōu)),比如使用OpenGL繪制的時(shí)候就要在GL_MODELVIEW的模式下加載Tm矩陣來進(jìn)行圖形顯示。
(2)Marker-Less AR
基本原理與Marker based AR相同,不過它可以用任何具有足夠特征點(diǎn)的物體(例如:書的封面)作為平面基準(zhǔn),而不需要事先制作特殊的模板,擺脫了模板對(duì)AR應(yīng)用的束縛。它的原理是通過一系列算法(如:SURF,ORB,F(xiàn)ERN等)對(duì)模板物體提取特征點(diǎn),并記錄或者學(xué)習(xí)這些特征點(diǎn)。當(dāng)攝像頭掃描周圍場(chǎng)景,會(huì)提取周圍場(chǎng)景的特征點(diǎn)并與記錄的模板物體的特征點(diǎn)進(jìn)行比對(duì),如果掃描到的特征點(diǎn)和模板特征點(diǎn)匹配數(shù)量超過閾值,則認(rèn)為掃描到該模板,然后根據(jù)對(duì)應(yīng)的特征點(diǎn)坐標(biāo)估計(jì)Tm矩陣,之后再根據(jù)Tm進(jìn)行圖形繪制(方法與Marker-Based AR類似)。
2.LBS-Based AR
其基本原理是通過GPS獲取用戶的地理位置,然后從某些數(shù)據(jù)源(比如wiki,google)等處獲取該位置附近物體(如周圍的餐館,銀行,學(xué)校等)的POI信息,再通過移動(dòng)設(shè)備的電子指南針和加速度傳感器獲取用戶手持設(shè)備的方向和傾斜角度,通過這些信息建立目標(biāo)物體在現(xiàn)實(shí)場(chǎng)景中的平面基準(zhǔn)(相當(dāng)于marker),之后坐標(biāo)變換顯示等的原理與Marker-Based AR類似。
這種AR技術(shù)利用設(shè)備的GPS功能及傳感器來實(shí)現(xiàn),擺脫了應(yīng)用對(duì)Marker的依賴,用戶體驗(yàn)方面要比Marker-Based AR更好,而且由于不用實(shí)時(shí)識(shí)別Marker姿態(tài)和計(jì)算特征點(diǎn),性能方面也好于Marker-Based AR和Marker-Less AR,因此對(duì)比Marker-Based AR和Marker-Less AR,LBS-Based AR可以更好的應(yīng)用到移動(dòng)設(shè)備上。
AR系統(tǒng)組成形式
一個(gè)完整的增強(qiáng)現(xiàn)實(shí)系統(tǒng)是由一組緊密聯(lián)結(jié)、實(shí)時(shí)工作的硬件部件與相關(guān)的軟件系統(tǒng)協(xié)同實(shí)現(xiàn)的,常用的有如下三種組成形式:
1.Monitor-Based
在基于計(jì)算機(jī)顯示器的AR實(shí)現(xiàn)方案中,攝像機(jī)攝取的真實(shí)世界圖像輸入到計(jì)算機(jī)中,與計(jì)算機(jī)圖形系統(tǒng)產(chǎn)生的虛擬景象合成,并輸出到屏幕顯示器。用戶從屏幕上看到最終的增強(qiáng)場(chǎng)景圖片。它雖然簡(jiǎn)單,但不能帶給用戶多少沉浸感。Monitor-Based增強(qiáng)現(xiàn)實(shí)系統(tǒng)實(shí)現(xiàn)方案如下圖所示。
由于這套方案的硬件要求很低,因此被實(shí)驗(yàn)室中的AR系統(tǒng)研究者們大量采用。
2.視頻透視式
頭盔式顯示器(Head-mounted displays,簡(jiǎn)稱HMD)被廣泛應(yīng)用于虛擬現(xiàn)實(shí)系統(tǒng)中,用以增強(qiáng)用戶的視覺沉浸感。增強(qiáng)現(xiàn)實(shí)技術(shù)的研究者們也采用了類似的顯示技術(shù),這就是在AR中廣泛應(yīng)用的穿透式HMD。根據(jù)具體實(shí)現(xiàn)原理又劃分為兩大類,分別是基于光學(xué)原理的穿透式HMD(Optical See-through HMD)和基于視頻合成技術(shù)的穿透式HMD(Video See-through HMD)。光學(xué)透視式增強(qiáng)現(xiàn)實(shí)系統(tǒng)實(shí)現(xiàn)方案如下圖所示。
3.光學(xué)透視式
在上述的兩套系統(tǒng)實(shí)現(xiàn)方案中,輸入計(jì)算機(jī)中的有兩個(gè)通道的信息,一個(gè)是計(jì)算機(jī)產(chǎn)生的虛擬信息通道,一個(gè)是來自于攝像機(jī)的真實(shí)場(chǎng)景通道。而在optical see-through HMD實(shí)現(xiàn)方案中去處了后者,真實(shí)場(chǎng)景的圖像經(jīng)過一定的減光處理后,直接進(jìn)入人眼,虛擬通道的信息經(jīng)投影反射后再進(jìn)入人眼,兩者以光學(xué)的方法進(jìn)行合成。
光學(xué)透視式增強(qiáng)現(xiàn)實(shí)系統(tǒng)具有簡(jiǎn)單、分辨率高、沒有視覺偏差等優(yōu)點(diǎn),但它同時(shí)也存在著定位精度要求高、延遲匹配難、視野相對(duì)較窄和價(jià)格高等不足。
AR的現(xiàn)實(shí)應(yīng)用
AR游戲玩到嗨
AR技術(shù)在游戲方式方面帶來了巨大的革新。像大家比較熟悉的《Pokemon Go》、《小龍斯派羅》等,都是非常不錯(cuò)的AR游戲。想象一下,往后的游戲不再需要復(fù)雜的場(chǎng)景建模,而是在真實(shí)的世界里游戲,同時(shí)在真實(shí)的世界里又能出現(xiàn)許多虛擬疊加進(jìn)去的事物,這是一種多么棒的體驗(yàn)!游戲也能擺脫場(chǎng)地與空間的束縛,可以隨時(shí)隨地開始。
“透視眼”逛博物館
在底特律藝術(shù)學(xué)院,參觀者可以借助一部搭載Tango技術(shù)的手機(jī)查看到展出的埃及木乃伊內(nèi)部結(jié)構(gòu)以及其他展品細(xì)節(jié)。簡(jiǎn)單來說,Tango會(huì)將掃描獲得的木乃伊石棺內(nèi)部圖像疊加到手機(jī)拍攝畫面上,于是,隱藏在紗布最里面的古埃及骷髏骨架和其他隱藏藝術(shù)文物就展現(xiàn)在我們面前。這就相當(dāng)于你擁有了一雙透視眼。
足不出戶選家具
有一款叫做iStaging的Tango應(yīng)用,可以讓你足不出戶選購(gòu)家具,并且可以通過3D模擬繪圖,將家具虛擬地?cái)[放到家中合適的位置,讓你預(yù)覽整體效果。這些家具的AR呈現(xiàn)效果在空間感和大小比例上都非常出色,幾乎和在宜家逛樣板間沒什么區(qū)別。
總結(jié)
盡管目前就AR技術(shù)而言,國(guó)內(nèi)技術(shù)略遜色于國(guó)外,但就應(yīng)用來說,我國(guó)還是占據(jù)明顯優(yōu)勢(shì)的。有專家預(yù)測(cè),到2020年,AR將開始在B端爆發(fā),預(yù)計(jì)到2025年,AR會(huì)真正迎來全面的爆發(fā)。是否真會(huì)如此,還讓我們拭目以待。
(原標(biāo)題:AR為什么現(xiàn)在那么火,一篇干貨告訴你?。?/p>