麻省理工最新機(jī)器學(xué)習(xí)系統(tǒng),讓機(jī)器人互相學(xué)習(xí)!

時(shí)間:2017-05-15

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的研究人員最近開發(fā)的C-LEARN系統(tǒng)旨在將這兩種技術(shù)結(jié)合在一起,該系統(tǒng)通過提供一些關(guān)于物體如何操作的信息,然后展示給機(jī)器人某項(xiàng)任務(wù)如何完成,可教給機(jī)器人完成一系列任務(wù)。

很快,在將來的某一天,機(jī)器人助手會(huì)成為我們?nèi)粘I畹囊徊糠?,即使我們不編程也可教他們新的任?wù)。如果你必須要學(xué)代碼,你也可以自己做三明治了?,F(xiàn)在,有一個(gè)新系統(tǒng)可讓教機(jī)器人變得像教孩子一樣簡(jiǎn)單。機(jī)器人可以使用這個(gè)系統(tǒng)來分享他們的技能。

培養(yǎng)機(jī)器人有兩種基本方法。一個(gè)是編程它的活動(dòng)軌跡,這需要時(shí)間和編碼的專業(yè)知識(shí)。另一個(gè)是通過觸碰它的四肢來表示你想要的東西,或者自己做,讓機(jī)器人模仿。但有些精妙的任務(wù),其精度不是手能表達(dá)的,拆除炸彈是很好的例子。現(xiàn)在,用一個(gè)叫做C-LEARN的系統(tǒng),科學(xué)家們讓一個(gè)機(jī)器人擁有具有簡(jiǎn)單步驟的知識(shí)庫,它可以在學(xué)習(xí)新任務(wù)時(shí)智能地應(yīng)用。

大多數(shù)機(jī)器人編程采用以下兩種方法之一:示范學(xué)習(xí),他們觀看正在進(jìn)行的任務(wù)然后模仿復(fù)制,或通過運(yùn)動(dòng)規(guī)劃技術(shù),如優(yōu)化或采樣,這需要程序員明確指定一個(gè)任務(wù)的目標(biāo)和約束。

這兩種方法都有弊端。從示范中學(xué)習(xí)的機(jī)器人不能輕易地將他們學(xué)到的技能轉(zhuǎn)移到另一種情況,并保證精確。另一方面,運(yùn)動(dòng)規(guī)劃系統(tǒng),使用采樣或優(yōu)化可適應(yīng)這些變化,但十分耗時(shí),因?yàn)樗麄兺ǔ1仨氂沙绦驅(qū)<沂止ぞ幋a。

麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的研究人員最近開發(fā)的C-LEARN系統(tǒng)旨在將這兩種技術(shù)結(jié)合在一起,該系統(tǒng)通過提供一些關(guān)于物體如何操作的信息,然后展示給機(jī)器人某項(xiàng)任務(wù)如何完成,可教給機(jī)器人完成一系列任務(wù)。

在伯克利加利福尼亞大學(xué),未參與此項(xiàng)研究的機(jī)器人專家AncaDragan表示:“C-LEARN系統(tǒng)采取非常實(shí)用的方法,效果非常好?!?/p>

在這個(gè)系統(tǒng)中,人類用戶第一次幫助建立機(jī)器人的知識(shí)庫。研究人員通過在一個(gè)軟件程序中點(diǎn)擊并拖動(dòng)它的四肢來教一個(gè)叫做Optimus的雙臂機(jī)器人。他們展示了動(dòng)作,例如抓住圓柱體的頂部或塊的側(cè)面。他們從不同的位置將每個(gè)任務(wù)執(zhí)行7次。每次移動(dòng)都有輕微的變化,機(jī)器人找到變化的模式,并將其融入到系統(tǒng)。例如,如果抓取器總是最終大致平行于物體,機(jī)器人將推斷并行性是該過程的重要約束。

麻省理工學(xué)院計(jì)算機(jī)科學(xué)家以及本研究工作的負(fù)責(zé)人ClaudiaPérezD’Arpino表示:“在這一點(diǎn)上,機(jī)器人就像一個(gè)2歲的嬰兒,只是知道怎樣夠到并抓住東西。”借助其知識(shí)庫,機(jī)器人只需一次演示即可學(xué)習(xí)新的多步驟任務(wù)。用戶使用C-LEARN軟件向機(jī)器人展示所需的任務(wù),然后批準(zhǔn)或改正機(jī)器人的嘗試。

西雅圖華盛頓大學(xué)未參與此次研究的機(jī)器人專家MayaCakmak表示:“可以服從幾何約束的機(jī)器人已經(jīng)存在了十多年,然而,目前為止,只有專家能利用他們?!?/p>

為測(cè)試該系統(tǒng),研究人員教了Optimus四項(xiàng)多步驟任務(wù):撿起一個(gè)瓶子并把它放進(jìn)桶里;雙手水平抓取和提起托盤;用一只手打開一個(gè)盒子,然后用另一只手按盒子里的按鈕;用一只手抓住立方體上的把手,并用另一只手將立方體中的一根桿拉出來。對(duì)于每一個(gè)任務(wù),Optimus會(huì)得到一次示范,并做出了10次嘗試。40次嘗試中,成功37次。研究人員將于本月晚些時(shí)候在IEEE國(guó)際機(jī)器人與自動(dòng)化大會(huì)上發(fā)表報(bào)告。

對(duì)于一個(gè)更嚴(yán)峻的挑戰(zhàn),研究人員將Optimus的知識(shí)庫及其四項(xiàng)任務(wù)的計(jì)劃傳輸給了Atlas——一個(gè)必須保持其平衡的雙足機(jī)器人。Atlas努力完成這四項(xiàng)任務(wù)。但當(dāng)研究人員刪除一些轉(zhuǎn)移的知識(shí)時(shí),例如保持某些移動(dòng)平行的約束,它就失敗了。

D’Arpino說,這種知識(shí)轉(zhuǎn)移將有實(shí)際應(yīng)用。“在德國(guó)的工廠里,你可以教一個(gè)機(jī)器人做一些事,沒有理由不能將其轉(zhuǎn)移到加拿大的不同機(jī)器人?!碑?dāng)然,對(duì)未來具有反烏托邦觀點(diǎn)的人關(guān)心的是,通過互聯(lián)網(wǎng)互相傳遞新技能的機(jī)器人將是走向機(jī)器人世界統(tǒng)治的第一步。

D’Arpino正在研究人們第一次與Optimus互動(dòng)是否能教會(huì)他新技能。盡管她還沒準(zhǔn)備好詳細(xì)討論這些問題,目前的結(jié)果還是很樂觀的。下一步,她希望教會(huì)機(jī)器人靈活地調(diào)整他們所學(xué)的飛行技能。

最終目標(biāo)是教機(jī)器人拆除炸彈,機(jī)器人需要快速、準(zhǔn)確地進(jìn)行該項(xiàng)精妙的任務(wù)。其他應(yīng)用還包括在災(zāi)難中尋人,制造電子產(chǎn)品,幫助生病或懶人做家務(wù)。D’Arpino表示:“有機(jī)器人在家服務(wù)的這個(gè)承諾,但現(xiàn)實(shí)是,現(xiàn)在他們什么都做不了。”她希望能改變現(xiàn)狀。

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0