google

Google Cloud Vision 初體驗

蔡志隆 2018/11/15 11:14:15
862

Google Cloud Vision 初體驗


簡介

Google Cloud Vision 透過此功能能從圖片之中擷取內容的特徵,例如照片中出現的物體、是否有煽情露骨內容等等。

作者

蔡志隆


Cloud Vision 簡介

Cloud Vision 就像是 Google 的照片搜尋功能,主要能夠讓機器辨識物件,如標籤、商標 Logo、圖片中的文字,還可以偵測是否有暴力內容等等。簡單來說 ,Vision會自動辨認照片出現的物品並逐一標記標籤。

馬上試試

前往 Google Cloud Vision API 的官方網站
連結:https://cloud.google.com/vision/
於Try the API處上傳一張圖片

分析與結果

API分析的結果可分成以下幾種:
 
一、Labels (標籤偵測):把圖中有的元素截取出來,並賦予一個 confidence 值,代表這個 label 在這張圖片裡出現的信心程度。
 
下方圖片地點為「騎乘公路車於南投上武嶺前2km天堂路」,Cloud Vision 分析出來Cycling(騎車)為98%、land vehicle(陸地車輛)為98%、Road Bicycle(公路車)為98%、Road(公路)為98、Mountain Range(山脈)為97%、Mountainous Landforms(山地地形)為97%.....等。整體來說辨識度滿高的。
 
二、Web:結合Google圖片搜尋引擎,偵測出各種不同的物件。
 
下圖中,偵測出來的物件如:
Road Bicycle(公路車)、Mountain Bicycle(登山車)、bicycle(單車)、Racing bicycle(競速單車)、Hybrid bicycle(混合式單車)、Alps(阿爾卑斯山)、Cycling(騎車)、transport(交通)、terrain(地形)、Wheel(輪子)、Travel(旅行)、Highway(公路)、Road(道路)。
 
上述的物件來說,除了將武嶺誤判為阿爾卑斯山外,其餘皆正確偵測出符合圖片的物件。
 
 
 
三、Properties:則是顯示圖片的 dominant color(主色),以及建議切割 image 的範圍 (crop hints)。
 
四、Safe Serarch(內容審核):Google 會自動擋掉成人、血腥等內容,靠的就是一樣的技術。使用此功能可偵測5種內容:Adult(成人)、Spoof(欺騙) 、Medical(醫學)、Violence(暴力)和Racy(兒童不宜),幫助使用者過濾不適合顯示出來的圖片。
 
五、JSON:所有分析結果的統整,也是 Vision API 回傳的內容。
 
mid:Machine-generated identifier。如果 API 偵測出的物件或特徵是 Google Knowledge Graph 裡面有的資料,那麼就會秀出該物件在 Knowledge Graph 知識圖譜中的位置。
description:對該物件的文字敘述,例如:公路車。
score:對該物件的信心指數。
topicality:話題性。
 

結語

Google Cloud Vision 配合著自身強大的搜尋引擎和互聯網大數據分析下,上傳的圖片內容辨識度來說相當的高,官網上介紹的功能不僅上述這五種,例如還有像地標偵測、人臉偵測、標誌偵測、、物件定位、OCR偵測、手寫偵測和整合REST API ....等相當多元化功能可嘗鮮。希望透過此次初體驗的介紹,讓更多人來了解與激發想像力,在未來有更多豐富視覺化、便民利民、城市安全等相關的應用。
蔡志隆