當(dāng)前,讓機(jī)器人擁有像人類(lèi)一樣靈巧的雙手還未成為現(xiàn)實(shí),但人工智能技術(shù)的飛速進(jìn)步讓我們比以往任何時(shí)候都更接近于這一目標(biāo)。
近日,來(lái)自人工智能研究機(jī)構(gòu)openai的研究人員開(kāi)發(fā)出一種機(jī)器人手臂,它使用人工智能來(lái)單手還原魔方。據(jù)了解,這款靈巧的機(jī)器人擁有24個(gè)關(guān)節(jié),類(lèi)似于人手的設(shè)計(jì),而不是在工廠里看到的那種鉗子式的機(jī)械手。
450 >
研究人員通過(guò)在上進(jìn)行模擬,來(lái)教這個(gè)被稱(chēng)為“dactyl”的機(jī)器人如何用手破解魔方,視覺(jué)傳感器和立方體求解算法為人工智能提供了如何移動(dòng)的指令。
“我們面臨的最大挑戰(zhàn)是在模擬環(huán)境中創(chuàng)建足夠多樣化的環(huán)境,以捕捉現(xiàn)實(shí)世界的物理情況。”openai的技術(shù)總監(jiān)ashley pilipiszyn表示,“對(duì)于像魔方或機(jī)械手這樣復(fù)雜的物體來(lái)說(shuō),很難測(cè)量和建模諸如摩擦、彈性和動(dòng)力學(xué)等因素,僅僅依靠域隨機(jī)數(shù)據(jù)生成是遠(yuǎn)遠(yuǎn)不夠的。”
為了克服這個(gè)問(wèn)題,研究人員開(kāi)發(fā)了一種稱(chēng)為自動(dòng)域隨機(jī)化(automaticdomainrandomization,adr)的新算法,該算法自動(dòng)生成一個(gè)用于訓(xùn)練強(qiáng)化學(xué)習(xí)模型的分布和一個(gè)模塊。其中,該模塊可以通過(guò)視覺(jué)估計(jì)對(duì)象的狀態(tài)——在本例中是一個(gè)魔方。強(qiáng)化學(xué)習(xí)通過(guò)使用重復(fù)的獎(jiǎng)勵(lì)或懲罰,使人工智能系統(tǒng)朝著理想目標(biāo)的發(fā)展。
380 >
openai希望其開(kāi)發(fā)的人工智能可以用于控制機(jī)器人的手,完成各種任務(wù)。
來(lái)源:網(wǎng)絡(luò)
以上是網(wǎng)絡(luò)信息轉(zhuǎn)載,信息真實(shí)性自行斟酌。