科技前瞻

自駕車也有識人之明?如何利用機器學習來實現影像辨識系統

自動駕駛是現在非常熱門的話題,但要讓自動駕駛成真,需要搭配很多感測周圍情況的設備,才能夠讓自駕車安全上路。在本篇文章中,我們將介紹自駕車的影像自動辨識系統,在透過 video cameras 得到車前影像後,該如何利用這些影像資料來進行機器學習,進而辨識出道路上的物件,以保障行車的安全。

影像辨識技術的基本需求,就是希望能從影像中自動找出想要辨識的物件。在自駕車的應用上,為了達到自動駕駛的目的以及保護在道路上行車的安全,我們希望能從影像中自動判斷出是否出現行人或車輛等物件。然而從影像中自動辨別物件的方法有很多種,如過去許多經典的影像處理方法,分析並比較照片中的某些特徵。但這些傳統的影像辨識方法,一直具有錯誤率過高的瓶頸,直到機器深度學習的出現後,才徹底改善物件辨識率過低的問題。

機器越學習越聰明?

機器學習通常可以這樣定義:「從過往的資料和經驗中學習與訓練,最後達到自主判斷或預測結果的目標。」也就是它能為未曾見過的圖像做辨識,並預測這個新圖像可能是什麼。機器學習又分成很多類型,圖像辨識經常使用監督式學習(Supervised learning)。監督式學習是要先提供問題以及正確的答案,讓電腦去學習辨認。就像在教育小孩一樣,你要教小孩叫媽媽,首先你要告訴他誰是媽媽。所以在辨識行人或車輛前,你得要先告訴它什麼是行人,什麼是車輛。當我們要辨識圖中的車輛,就要把車輛標示出來,告訴機器,框框內的物件就是車輛,而把行人與車輛標示出來的這個動作,我們稱為標籤化。

這些標籤化的影像,其實就是提供電腦我們希望它能夠辨識的物件,讓電腦去學習。所以若我們想要提高其辨識的準確度,就需要大量的標籤化影像,而這些大量標籤化後的影像資料,將成為我們用來訓練類神經網路系統的影像資料庫。透過大量影像資料的訓練,讓機器能夠不斷的學習,並透過結果的反饋,也就是告訴機器判斷的結果是否正確,進而修正調整類神經網路上每個神經元的參考權重值,最後機器判斷的結果將會越來越準確。

為了達到較高的辨識準確率,在影像的辨識系統上,通常會使用深度學習(deep learning)。這是一種特定的機器學習法:「深度神經網路」,也就是使用較多層的類神經網路,它的辨識準確率比其他的機器學習方法要高很多。深度學習這項現在最熱門的技術,其實並非最近幾年才提出的構想,而是因為過去硬體處理器無法負荷深度學習所帶來龐大的運算量,因此過去難以實現這套理論架構。但因為現在的硬體處理器技術與速度都比過去提升很多,也使利用深度學習的影像與聲音辨識技術得以實現。

[related-post url=”https://tomorrowsci.com/technology/mit-%E9%81%93%E5%BE%B7%E5%BF%83%E7%90%86%E5%AD%B8%E7%A0%94%E7%A9%B6-%E8%87%AA%E5%8B%95%E9%A7%95%E9%A7%9B-%E8%BB%8A%E7%A6%8D-%E7%94%9F%E6%AD%BB%E6%8A%89%E6%93%87/”]

讓智慧駕駛成真

上述為利用機器學習進行圖形辨識的最基本介紹。人工智慧在影像辨識技術上不斷有所突破,讓自駕車能自動辨識出前方的障礙物,並做出相對應減速或煞車的動作,以確保車輛駕駛的安全。其實,自動駕駛要能夠實現,最重要的還是要能保護自身與用路人的安全。雖然再先進的感測裝置都無法保證百分之百準確,但可以期待的是,隨著未來科技不斷發展與創新,不論無人駕駛或輔助駕駛,一定都能讓未來的行車更加安全且有保障。

 

參考資料:

  1. 涂煥昌 (2017)。讓機器「看懂」世界–掌握人工智能發展關鍵的「DT42」團隊。科技部科技大觀園網站
  2. 財團法人車輛研究測試中心 (簡稱車輛中心,ARTC)。影像式前方障礙物辨識系統
  3. 粘為博、陳澤民、張雍昌、陳立函、楊宗賢、徐志偉 (2017)。無人駕駛車/自駕車技術探索。電通與通訊期刊