在設計機器人時,例如波士頓動力公司 (Boston Dynamics) 的人形機器人阿特拉斯 (Atlas),這些機器人會運動和分類箱子,識別標記是幫助它們移動、檢測物體和確定確切位置的指導工具。這是一種機器視覺工具,用來估計物體的位置。乍一看,它們是平坦的、高對比度的黑白方形碼,類似於QR碼系統,但有一個優點:它們可以在更遠的距離被檢測到。
在物流方面,機器人頂部的相機可以自動識別包裹的位置,利用這些標記來節省時間和金錢。然而,直到現在,這個系統的弱點在於光照條件,因為傳統的機器視覺技術在低光環境下無法準確定位和解碼標記。
為了解決這個問題,來自科爾多瓦大學 (University of Córdoba) 的機器視覺應用研究小組的研究人員拉斐爾·貝拉爾 (Rafael Berral)、拉斐爾·穆尼奧斯 (Rafael Muñoz)、拉斐爾·梅迪納 (Rafael Medina) 和曼努埃爾·J·馬林 (Manuel J. Marín) 開發了一個系統,首次能在困難的光照條件下檢測和解碼識別標記,使用了神經網絡。這篇論文發表在《影像與視覺計算》期刊上。
研究員貝拉爾解釋說:「在模型中使用神經網絡使我們能以更靈活的方式檢測這類標記,解決了檢測和解碼過程中所有階段的光照問題。」整個過程分為三個步驟:標記檢測、角落優化和標記解碼,每個步驟都基於不同的神經網絡。
這是首次對這個問題提供完整的解決方案,正如曼努埃爾·J·馬林所指出的:「過去有很多嘗試在最佳光照條件下提高速度,但低光或多陰影的問題並未完全解決以改善這個過程。」
如何訓練你的機器視覺模型
在訓練這個提供端到端解決方案的模型時,團隊創建了一個合成數據集,可靠地反映了在不理想條件下工作時可能遇到的光照情況。一旦訓練完成,「模型使用真實世界數據進行測試,其中一些是在這裡內部生成的,其他則是來自先前工作的參考資料。」研究人員指出。
用來訓練模型的人工生成數據和真實世界中的不利光照情況數據都是開放的。因此,這個系統今天就可以應用,「因為代碼已經發布,並且可以用任何包含識別標記的圖像來測試代碼。」拉斐爾·穆尼奧斯回憶道。
多虧了這項工作,機器視覺應用克服了一個新障礙:在黑暗中移動。
更多資訊:
拉斐爾·貝拉爾-索萊爾 (Rafael Berral-Soler) 等,DeepArUco++:在挑戰性光照條件下改善方形識別標記的檢測,《影像與視覺計算》 (2024)。DOI: 10.1016/j.imavis.2024.105313
科爾多瓦大學 (University of Córdoba)
引用:
神經網絡模型改善低光條件下的機器視覺和物體檢測 (2025年1月24日)
於2025年1月26日檢索自 https://techxplore.com/news/2025-01-neural-networks-machine-vision-conditions.html
本文件受版權保護。除非出於私人學習或研究的合理使用,否則不得未經書面許可複製任何部分。內容僅供資訊用途。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!