google

Google Cloud Vision 初體驗

蔡志隆 2018/11/15 11:14:15

0 862

Google Cloud Vision 初體驗

簡介	Google Cloud Vision 透過此功能能從圖片之中擷取內容的特徵，例如照片中出現的物體、是否有煽情露骨內容等等。
作者	蔡志隆

Cloud Vision 簡介

Cloud Vision 就像是 Google 的照片搜尋功能，主要能夠讓機器辨識物件，如標籤、商標 Logo、圖片中的文字，還可以偵測是否有暴力內容等等。簡單來說，Vision會自動辨認照片出現的物品並逐一標記標籤。

馬上試試

前往 Google Cloud Vision API 的官方網站

連結：https://cloud.google.com/vision/

於Try the API處上傳一張圖片

分析與結果

API分析的結果可分成以下幾種：

一、Labels (標籤偵測)：把圖中有的元素截取出來，並賦予一個 confidence 值，代表這個 label 在這張圖片裡出現的信心程度。

下方圖片地點為「騎乘公路車於南投上武嶺前2km天堂路」，Cloud Vision 分析出來Cycling(騎車)為98%、land vehicle(陸地車輛)為98%、Road Bicycle(公路車)為98%、Road(公路)為98、Mountain Range(山脈)為97%、Mountainous Landforms(山地地形)為97%.....等。整體來說辨識度滿高的。

二、Web：結合Google圖片搜尋引擎，偵測出各種不同的物件。

下圖中，偵測出來的物件如：

Road Bicycle(公路車)、Mountain Bicycle(登山車)、bicycle(單車)、Racing bicycle(競速單車)、Hybrid bicycle(混合式單車)、Alps(阿爾卑斯山)、Cycling(騎車)、transport(交通)、terrain(地形)、Wheel(輪子)、Travel(旅行)、Highway(公路)、Road(道路)。

上述的物件來說，除了將武嶺誤判為阿爾卑斯山外，其餘皆正確偵測出符合圖片的物件。

三、Properties：則是顯示圖片的 dominant color(主色)，以及建議切割 image 的範圍 (crop hints)。

四、Safe Serarch(內容審核)：Google 會自動擋掉成人、血腥等內容，靠的就是一樣的技術。使用此功能可偵測5種內容：Adult(成人)、Spoof(欺騙) 、Medical(醫學)、Violence(暴力)和Racy(兒童不宜)，幫助使用者過濾不適合顯示出來的圖片。

五、JSON：所有分析結果的統整，也是 Vision API 回傳的內容。

mid：Machine-generated identifier。如果 API 偵測出的物件或特徵是 Google Knowledge Graph 裡面有的資料，那麼就會秀出該物件在 Knowledge Graph 知識圖譜中的位置。

description：對該物件的文字敘述，例如：公路車。

score：對該物件的信心指數。

topicality：話題性。

結語

Google Cloud Vision 配合著自身強大的搜尋引擎和互聯網大數據分析下，上傳的圖片內容辨識度來說相當的高，官網上介紹的功能不僅上述這五種，例如還有像地標偵測、人臉偵測、標誌偵測、、物件定位、OCR偵測、手寫偵測和整合REST API ....等相當多元化功能可嘗鮮。希望透過此次初體驗的介紹，讓更多人來了解與激發想像力，在未來有更多豐富視覺化、便民利民、城市安全等相關的應用。