關於擴增實境(AR)圖像辨識應用方法解析

在擴增實境(AR)的應用方式,有多種應用類型,包含:圖像辨識、陀螺儀、空間辨識、臉部辨識、肢體辨識、物件辨識、手部辨識….等多元化的辨識技術。在這些辨識技術中,可以看到現今其實有非常多不同的APP可以啟動各種有趣的AR應用,本文章將針對圖像辨識進行說明,在我的解說中Lina老師不會用太技術面的方式解釋,將會以應用面帶入概念。

在擴增實境(AR)的應用技術中,在2014年初期最常見的應用就是圖像辨識,透過一張特定的圖,你就可以啟動AR的虛擬內容,並透過不同的「圖卡」去啟動相關的虛擬物件。因此,過去大家都會覺得「玩AR一定要掃描特定的圖片」的既定印象,但這個其實只是AR中的其中一個應用方法。

常見的圖像辨識在數位影響處理中,都會引用萊娜圖(Lenna)來進行各種測試,該圖在數位影像處理學習與研究中頗為知名,常被用作數位影像處理各種實驗(例如資料壓縮和降噪)及科學出版物的例圖(取自維基百科),該圖片很好的包含了平坦區域、陰影和紋理等細節,這些都有益於測試各種不同的圖像處理演算法,因此是一個很適合用來測試的圖像。

萊娜圖(Lenna)

一、圖像辨識

在選擇圖像時,究竟哪種圖像可以提升整體的圖像辨識度呢?關於圖像辨識的簡單概念如下,通常我們上傳辨識圖至AR辨識系統中,系統會自動判斷該圖像的辨識度是否可達成辨識功能。若該圖像如左圖,沒有太多的複雜元素,僅有簡單的圓形與方形,那麼辨識度將可能為「無法辨識」;若該圖像為右圖,有較複雜的設計元素與內容,那麼該辨識圖經過圖像辨識系統運算過後將會提供辨識度1-5顆星的結果。而辨識圖的星星多寡,影響的是辨識速度與圖像追蹤率的穩定度。

辨識圖的圖像與辨識點概念

可以怎麼選擇辨識圖?

因此,你可以想像,你手邊的可以看到的,包含:照片、圖片、雜誌、名片、卡片等,甚至是你隨手拿起手機進行翻拍的照片都可以成為你的辨識圖。

其中,需要注意的項目則是該張圖片上傳到電腦的解析度、色彩格式是什麼?當然,這個問題是沒有絕對值得,以下為建議圖像辨識所上傳使用時格式。

1.較為複雜化的圖形
2.顏色對比較高
3.圖像解析度建議為500px-1000px
4.圖像格式為RGB 72dip
5.檔案格式為.JPEG
6.若沒有電子原始檔案,亦可使用掃描檔或手機翻拍使用。
7.辨識圖不局限於印刷品、電腦螢幕及手機螢幕顯示才可進行AR掃描。

我想創建第一個AR專案,所以我需要準備什麼?

1.辨識圖電子檔案 ( 長寬建議為800x800px , 尺寸1mb以下,色彩RBG格式)
2.一個短影片,也就是30~60秒的短影片
3.將辨識圖及影片素材上傳至軟體中,就可以進行編輯了。

有沒有實際的案例可以體驗與觀看?
啟動WebAR影片體驗 或 掃描QR CODE 啟動

完成啟動後,那拿起攝影機掃描下方辨識圖

辨識圖

在AR體驗的整個過程中,你會發現,當AR攝影機照到辨識圖時,影片將會黏在上面,我們稱為:圖像追蹤技術。當攝影機畫面離開辨識圖時,影像將會在畫面中間,他則是遺失了追蹤對象。當然,在設定上是否可以讓圖像遺失追蹤時,物件就消失?

答案是:可以。

但是因應不同的使用者對象,與需求方式,將會有不同的APP呈現成果,所以此答案不代表所有APP都是相同的,以本體驗案例來說他就不會關閉遺失追蹤的物件。

除了影片之外,還可以出現哪些資訊?

在AR的世界中,你可以將任何多媒體資訊匯入,包含:聲音(mp3,ogg)、圖像(jpg,png,gif)、影像(mp4)、模型(.fbx)..等格式匯入,並根據需求擺放物件位置,以下方英文字卡為例,啟動後掃描辨識圖,就會啟動多元的模型內容(案例體驗)。

因此,你可以根據需求,在圖像上開始卻擺設你希望出現的虛擬對應物件,而這個物件,也將因應你在虛擬世界中所擺放的位置擴增在AR的成果中。

簡單的分享,期待來到ARVR學習樂園的你有個小收穫喔!也歡迎大家在文章下留言(*^_^*)

作者

Lina老師

我喜歡將美學與科技結合,讓創新的火花產生更多不同的可能性。現在,您也可以輕鬆進入 AR/VR 市場,只需要動動您的小指頭。跟著我,一起探索 AR/VR 的奇妙世界吧!

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s