美國科學家開發新技術:讓機器人也能“三思后行”
新浪科技訊 北京時間1月2日早間消息,加州大學伯克利分校的最新研究成果顯示,機器人也可以具備“預見”功能,通過視頻識別技術在移動物體之前預測到可能發生的情況。
人類有能力在采取行動之前首先進行思考。例如,如果有人想踢球,可能就會考慮球會跑到那里去,以及把球踢到新位置的概率。機器人往往不具備這種能力,因為它們內部的程序通常只能執行簡單的任務,沒有配備人工智能程序的機器人尤其如此。
但加州大學伯克利分校的研究人員卻發現,機器人也可以具備這種直覺。為了證明這一點,他們開發了新的機器人學習技術,使得機器人可以提前思考,以便“搞清楚如何操縱他們之前從未碰到過的物體。”
該團隊將這項技術稱作“視覺遠見”,但這并不表示機器人具備預測未來的能力——至少目前沒有。
伯克利的研究人員將這項技術應用到一臺名為Vestri的機器人身上,使之可以預測機器人的攝像頭幾秒種后能夠看到的內容。具備了新的“遠見”后,Vestri便可在不觸碰附近其他物體的情況下,在桌子上移動各種小物體。最令人驚訝的是,這項技術還能讓機器人在沒有人類指導和監督,也沒有物理知識的情況下,完成這些小任務。
“跟我們在環境中采取行動的方式一樣,這種方法也能讓機器人對不同行為如何影響周圍的世界進行視覺化。”伯克利電機工程和計算機科學系助理教授賽季·萊文(Sergey Levine)說,“這就能在復雜的現實環境中對高度靈活的技能展開智能規劃。”
“視覺遠見”的基礎是“卷積循環視頻預測”,或稱動態神經平流(DNA)。該團隊表示,基于DNA的模型可以根據機器人的行為,預測圖像中的像素如何從一幀跳入另外一幀。作為萊文實驗室的博士生兼最初的DNA模型的發明人,切爾西·菲恩(Chelsea Finn)解釋道,像Vestri這樣的機器人現在可以“完全靠自己來掌握一系列視覺對象操控能力”。
萊文實驗室的費德里科·艾伯特(Frederik Ebert)則將這種機器人的運作方式與人類在其所處環境中與物體的互動方式進行對比:
“通過一生當中與各種物體的數百萬次互動,人類便可在沒有老師的情況下學會操控物體的技巧。”艾伯特說,“我們已經證明,完全有可能開發一套機器人系統,利用大量自動收集的數據來學習可以廣泛使用的操控能力,尤其是推動物體的能力。”
萊文指出,Vestri的能力仍然存在一些局限,但他們將會采取更多措施來改進這項技術。有朝一日,這種技術或許可以對無人駕駛汽車起到幫助,使之更好地應對新的環境和不熟悉的物體。
但這項技術還需要很多改進才能實現這一目標,例如吸收更多經過提煉的視頻預測和方法。
今后的機器人或許可以借助類似的技術完成更加復雜的任務,例如拿起和放置物體,或者處理衣服或繩子等柔軟且容易變形的物體。照此推測,洗衣機有朝一日或許還能額外配備疊衣服功能。(書聿)