自駕車也有識人之明?如何利用機器學習來實現影像辨識系統

賓士的自動駕駛概念車(圖:Gizmodo)

自動駕駛是現在非常熱門的話題,但要讓自動駕駛成真,需要搭配很多感測周圍情況的設備,才能夠讓自駕車安全上路。在本篇文章中,我們將介紹自駕車的影像自動辨識系統,在透過 video cameras 得到車前影像後,該如何利用這些影像資料來進行機器學習,進而辨識出道路上的物件,以保障行車的安全。

影像辨識技術的基本需求,就是希望能從影像中自動找出想要辨識的物件。在自駕車的應用上,為了達到自動駕駛的目的以及保護在道路上行車的安全,我們希望能從影像中自動判斷出是否出現行人或車輛等物件。然而從影像中自動辨別物件的方法有很多種,如過去許多經典的影像處理方法,分析並比較照片中的某些特徵。但這些傳統的影像辨識方法,一直具有錯誤率過高的瓶頸,直到機器深度學習的出現後,才徹底改善物件辨識率過低的問題。

機器越學習越聰明?

機器學習通常可以這樣定義:「從過往的資料和經驗中學習與訓練,最後達到自主判斷或預測結果的目標。」也就是它能為未曾見過的圖像做辨識,並預測這個新圖像可能是什麼。機器學習又分成很多類型,圖像辨識經常使用監督式學習(Supervised learning)。監督式學習是要先提供問題以及正確的答案,讓電腦去學習辨認。就像在教育小孩一樣,你要教小孩叫媽媽,首先你要告訴他誰是媽媽。所以在辨識行人或車輛前,你得要先告訴它什麼是行人,什麼是車輛。當我們要辨識圖中的車輛,就要把車輛標示出來,告訴機器,框框內的物件就是車輛,而把行人與車輛標示出來的這個動作,我們稱為標籤化。

這些標籤化的影像,其實就是提供電腦我們希望它能夠辨識的物件,讓電腦去學習。所以若我們想要提高其辨識的準確度,就需要大量的標籤化影像,而這些大量標籤化後的影像資料,將成為我們用來訓練類神經網路系統的影像資料庫。透過大量影像資料的訓練,讓機器能夠不斷的學習,並透過結果的反饋,也就是告訴機器判斷的結果是否正確,進而修正調整類神經網路上每個神經元的參考權重值,最後機器判斷的結果將會越來越準確。

為了達到較高的辨識準確率,在影像的辨識系統上,通常會使用深度學習(deep learning)。這是一種特定的機器學習法:「深度神經網路」,也就是使用較多層的類神經網路,它的辨識準確率比其他的機器學習方法要高很多。深度學習這項現在最熱門的技術,其實並非最近幾年才提出的構想,而是因為過去硬體處理器無法負荷深度學習所帶來龐大的運算量,因此過去難以實現這套理論架構。但因為現在的硬體處理器技術與速度都比過去提升很多,也使利用深度學習的影像與聲音辨識技術得以實現。

讓智慧駕駛成真

上述為利用機器學習進行圖形辨識的最基本介紹。人工智慧在影像辨識技術上不斷有所突破,讓自駕車能自動辨識出前方的障礙物,並做出相對應減速或煞車的動作,以確保車輛駕駛的安全。其實,自動駕駛要能夠實現,最重要的還是要能保護自身與用路人的安全。雖然再先進的感測裝置都無法保證百分之百準確,但可以期待的是,隨著未來科技不斷發展與創新,不論無人駕駛或輔助駕駛,一定都能讓未來的行車更加安全且有保障。

 

參考資料:

  1. 涂煥昌 (2017)。讓機器「看懂」世界–掌握人工智能發展關鍵的「DT42」團隊。科技部科技大觀園網站
  2. 財團法人車輛研究測試中心 (簡稱車輛中心,ARTC)。影像式前方障礙物辨識系統
  3. 粘為博、陳澤民、張雍昌、陳立函、楊宗賢、徐志偉 (2017)。無人駕駛車/自駕車技術探索。電通與通訊期刊
國立中山大學 IT Superhero 團隊
國立中山大學 IT Superhero 團隊 6 文章
主要是以時下最流行與民眾生活息息相關且正在快速發展的資訊科技話題作為撰寫題材。本團隊由資訊工程、教育科學、傳播管理、外國語文等專業領域的教授組成跨領域執行團隊,其目的旨在將生活裡常見的新興資訊科技講清楚說明白,幫助民眾輕鬆無負擔的理解科學原理,提昇科學學習興趣,促進創新思考模式,並且建立正確的科學觀念,在科技快速發展的社會中培養具備科學素養的社會公民。
Contact: Facebook