關於擴增實境(AR)圖像辨識應用方法解析

在擴增實境(AR)的應用方式，有多種應用類型，包含：圖像辨識、陀螺儀、空間辨識、臉部辨識、肢體辨識、物件辨識、手部辨識….等多元化的辨識技術。在這些辨識技術中，可以看到現今其實有非常多不同的APP可以啟動各種有趣的AR應用，本文章將針對圖像辨識進行說明，在我的解說中Lina老師不會用太技術面的方式解釋，將會以應用面帶入概念。

在擴增實境(AR)的應用技術中，在2014年初期最常見的應用就是圖像辨識，透過一張特定的圖，你就可以啟動AR的虛擬內容，並透過不同的「圖卡」去啟動相關的虛擬物件。因此，過去大家都會覺得「玩AR一定要掃描特定的圖片」的既定印象，但這個其實只是AR中的其中一個應用方法。

常見的圖像辨識在數位影響處理中，都會引用萊娜圖（Lenna）來進行各種測試，該圖在數位影像處理學習與研究中頗為知名，常被用作數位影像處理各種實驗（例如資料壓縮和降噪）及科學出版物的例圖（取自維基百科），該圖片很好的包含了平坦區域、陰影和紋理等細節，這些都有益於測試各種不同的圖像處理演算法，因此是一個很適合用來測試的圖像。

一、圖像辨識

在選擇圖像時，究竟哪種圖像可以提升整體的圖像辨識度呢？關於圖像辨識的簡單概念如下，通常我們上傳辨識圖至AR辨識系統中，系統會自動判斷該圖像的辨識度是否可達成辨識功能。若該圖像如左圖，沒有太多的複雜元素，僅有簡單的圓形與方形，那麼辨識度將可能為「無法辨識」；若該圖像為右圖，有較複雜的設計元素與內容，那麼該辨識圖經過圖像辨識系統運算過後將會提供辨識度1-5顆星的結果。而辨識圖的星星多寡，影響的是辨識速度與圖像追蹤率的穩定度。

可以怎麼選擇辨識圖？

因此，你可以想像，你手邊的可以看到的，包含：照片、圖片、雜誌、名片、卡片等，甚至是你隨手拿起手機進行翻拍的照片都可以成為你的辨識圖。

其中，需要注意的項目則是該張圖片上傳到電腦的解析度、色彩格式是什麼？當然，這個問題是沒有絕對值得，以下為建議圖像辨識所上傳使用時格式。

1.較為複雜化的圖形
2.顏色對比較高
3.圖像解析度建議為500px-1000px
4.圖像格式為RGB 72dip
5.檔案格式為.JPEG
6.若沒有電子原始檔案，亦可使用掃描檔或手機翻拍使用。
7.辨識圖不局限於印刷品、電腦螢幕及手機螢幕顯示才可進行AR掃描。

我想創建第一個AR專案，所以我需要準備什麼？

1.辨識圖電子檔案 ( 長寬建議為800x800px , 尺寸1mb以下,色彩RBG格式)
2.一個短影片，也就是30~60秒的短影片
3.將辨識圖及影片素材上傳至軟體中，就可以進行編輯了。

有沒有實際的案例可以體驗與觀看？
啟動WebAR影片體驗 或掃描QR CODE 啟動

完成啟動後，那拿起攝影機掃描下方辨識圖

在AR體驗的整個過程中，你會發現，當AR攝影機照到辨識圖時，影片將會黏在上面，我們稱為：圖像追蹤技術。當攝影機畫面離開辨識圖時，影像將會在畫面中間，他則是遺失了追蹤對象。當然，在設定上是否可以讓圖像遺失追蹤時，物件就消失？

答案是：可以。

但是因應不同的使用者對象，與需求方式，將會有不同的APP呈現成果，所以此答案不代表所有APP都是相同的，以本體驗案例來說他就不會關閉遺失追蹤的物件。

除了影片之外，還可以出現哪些資訊？

在AR的世界中，你可以將任何多媒體資訊匯入，包含：聲音(mp3,ogg)、圖像(jpg,png,gif)、影像(mp4)、模型(.fbx)..等格式匯入，並根據需求擺放物件位置，以下方英文字卡為例，啟動後掃描辨識圖，就會啟動多元的模型內容（案例體驗）。

因此，你可以根據需求，在圖像上開始卻擺設你希望出現的虛擬對應物件，而這個物件，也將因應你在虛擬世界中所擺放的位置擴增在AR的成果中。

簡單的分享，期待來到ARVR學習樂園的你有個小收穫喔！也歡迎大家在文章下留言(*^_^*)

關於擴增實境(AR)圖像辨識應用方法解析

請按讚：

相關

作者:

Lina老師

發表迴響取消回覆

分享此文：

請按讚：

相關

作者:

Lina老師

發表迴響取消回覆

探索更多來自 ARVR學習樂園 的內容

探索更多來自 ARVR學習樂園的內容