2024-07-09
551
機器視覺是人工智慧的一個分支,使機器和人一樣「看懂」圖像與物件後進行判斷與決策,常用在工業自動化與機器人領域如: 視覺瑕疵檢測、3D視覺定位、分類計數,甚至影像監控/辨識等應用,也是新興的AR + AI視覺系統技術核心。
從AOI這種Rule-based到深度學習技術(為機器學習的分支,透過模擬人腦的類神經網路,形成數學函數集並將資料代入做訓練與運算,能處理非結構化資料,使機器和人一樣進行判斷),通常包含以下5個環節。
包含工業相機、IP Cam拍攝或現成圖像資料等來源。除了像素規格,光源也至關重要,需考量亮度/光通量、色溫、色彩再現性等,確保影像符合實際需求與品質。
影像處理或轉換如二值化、濾波、增強、降噪和縮放等操作,提高影像品質和可用性後,提取有用的特徵如: 邊緣、紋理、色彩,或文章裡的詞組,選擇最具代表性的特徵,以降低計算成本並提高識別性能。
常由人工或AI技術進行標記與訓練,並建立AI模型,透過特徵來識別和分類模式。常用的模型包括支持向量機(SVM)、卷積神經網絡(CNN)和循環神經網絡(RNN)等。
訓練後的模型依照需求辨識圖像中的物體、人物、文字或模式等。如何評估模型性能?通常包含精確度(模型正確預測的樣本數除以總樣本數。然而,對於不平衡的數據集,精確度可能不是一個很好的指標)、混淆矩陣(一個矩陣表格,包括真正例、假正例、真反例和假反例的結果。)和信心值等各種指標。
根據識別的資訊進行決策如: 辨識物件與方位後,控制機器手臂取放、OCR字元讀取、組裝/設備操作步驟SOP確認等應用。
從自動駕駛到廠區智慧巡檢,可用人眼做判斷與檢測/檢查的部分,就有機器視覺的應用機會,但仍面臨原始資料品質差與樣本數不足的挑戰,且無法直接將模型從某領域轉移到另一個領域使用,AI建模成本(訓練時間、能耗、人力與樣本數等)也至關重要,即便是簡單的機械式指針讀取與辨識,一般傳統AI可能需上百甚至上千張樣本進行訓練。
AI並不是要取代人類,而是幫助人類更高效、準確地運用資源甚至解放雙手等,以AR擴增實境 + AI的視覺系統來說,由於可搭載於穿戴式裝置,作業員組裝設備時,AI可對現實世界物件做辨識與判斷,並透過AR眼鏡,即時提供操作員組裝指引,或自動檢查線路是否正確連接等。
AR和AI的結合能夠以合宜成本,提高資源運用效率、良率和確保工安等優點與全新應用,這種技術的應用有望在未來持續擴大,提供更多創新的解決方案。
所羅門 Solomon
76 Followers
延伸閱讀
所羅門 Solomon
76 Followers
我們使用本身的Cookie和第三方的Cookie進行分析,並根據您的瀏覽習慣和個人資料向您展示與您的偏好相關的廣告。如欲瞭解更多資訊,您可以查閱我們的隱私權政策。