這項成果象征著業界正朝著讓機器人了解視覺世界的未來更邁進了一步。今天,人類專家通常以一種相對較緩慢的兩步驟過程訓練廠房中的機器人重復幾個動作,但這有時還需要人類編寫客制軟件。
Embodied Intelligence共同創辦人兼執行長Peter Chen表示:「我們提供的工具并非編程每一步驟,而是證實機器人并不需要人類專家的協助……它也能從嘗試與錯誤中學習。」
「我們的機器人軟件并不限于固定的動作。當今的機器人一遍又一遍地重復執行相同的機械式任務。透過我們的軟件,能夠賦予機器人經由攝影機真正『看』到的能力,并因而進行調整。」
除了更迅速且便宜地訓練機器人之外,該軟件工具還為教授新的任務開啟了大門。例如,這套系統能教導機器人如何將線穿過機械組件。由于追蹤與編程彈性化對象極其復雜性,使得大多數計算機視覺系統都無法順利實現這一類的應用。
Embodied Intelligence采用虛擬現實(VR)頭戴式裝置來訓練機器人。目前使用的是HTC Vive頭戴式裝置及其動作控制器,但任何VR裝置都適用。
他說:「你可以看機器人『看』到什么了,并根據機器人『看』到的對象做決定,而機器人也會加以模仿。」
Peter Chen曾經是美國加州大學柏克萊分校(UC Berkeley)的研究人員,他和其他2位研究人員在今年初發表其采用機器學習與VR連結,教導機器人10項基本任務的實驗結果。「在進行3分鐘的VR展示中,機器人解決了以往可能需要由博士編寫算法的所有任務。」
該途徑使用了Google和Facebook等網絡巨擘用于辨識影像和其他任務的相同深度神經網絡技術。VR展示就像訓練一樣,設定神經網絡路徑或策略,并讓機器人能在執行推論后加以改善。