許多機器人和機械手已經精通某些抓握或其他動作,比如工廠里的機器人可以比人類更靈巧地揮舞螺栓槍。但是幫助機器人完成這項任務的軟件很可能是手寫的,而且非常復雜。即使是在同一條生產線上,比如焊接,也需要一個全新的系統。
對于人類來說,拿起蘋果和拿起杯子似乎沒什么區別。不過,差異是確實存在的,只是我們的大腦會自動填補空白,讓我們可以隨機應變,安全地握住不熟悉的物體。這是機器人遠遠落后于人類的領域。
此外,你不能僅僅通過訓練機器人去做人類能做的事,你必須提供數以百萬計的例子來充分展示,人類如何操控成千上萬個給定的物體。
openai的研究人員認為,解決方案就是根本不使用人類數據。取而代之的是,他們讓計算機在模擬中反復嘗試和失敗,慢慢地學習如何移動手指,以便它所掌握的對象能夠按照需要移動。
研究人員稱這套系統為dactyl,他們只為其提供手指的位置和三種手持對象的攝像頭視角。但在訓練時,所有這些數據都是在虛擬環境中進行模擬的。
在這種環境中,計算機不需要實時工作。它可以在幾秒鐘內嘗試上千種不同的方法去抓住一個對象,分析結果并將數據轉發到下一次嘗試中。這只機械手本身就像影子般靈巧的手,也比大多數機械手復雜。
除了需要了解的不同物體和姿勢之外,還有其他隨機參數,比如指尖的摩擦力、場景的顏色和燈光等等。你不能模擬現實中的每個方面,但是你可以確保系統不只是在一個藍色的房間里工作,或在帶有特殊標記的立方體上工作。
研究人員在這個問題上投入了大量的精力:6144個cpu和8個gpu,在50個小時內收集了大約100年的經驗。然后他們將這個系統首次應用到現實世界中,它展示了許多令人驚訝的類人行為。
我們在不經意間用手做的事情,比如把一個蘋果轉過來看看有沒有擦傷,或者把一杯咖啡遞給朋友時,需要用很多小技巧來穩定或移動物體。dactyl重新創建了其中的幾個過程,例如用拇指和中指握住物體,而用剩下的手指將其旋轉到想要的方向。
這個系統的偉大之處在于它的運動的自然性,以及它們是通過反復試驗而獨立完成的,它與任何特定的形狀或物體類型無關。就像人類一樣,dactyl的確可以控制和操縱被放在它手里的任何東西。
來源:網絡
以上是網絡信息轉載,信息真實性自行斟酌。