從精確性到靈巧性,機(jī)器人變革背后的原因是什么?

時(shí)間:2017-10-09

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:我們發(fā)現(xiàn),機(jī)器人現(xiàn)在需要有一個(gè)根本性的進(jìn)化,這就是逐漸從精確性進(jìn)入到了靈巧性。新的應(yīng)用需求要處理不確定性,處理不完全信息,具體表現(xiàn)為非結(jié)構(gòu)化環(huán)境,這些需求和現(xiàn)有技術(shù)比較還是有一點(diǎn)差距的。

我們發(fā)現(xiàn),機(jī)器人現(xiàn)在需要有一個(gè)根本性的進(jìn)化,這就是逐漸從精確性進(jìn)入到了靈巧性。新的應(yīng)用需求要處理不確定性,處理不完全信息,具體表現(xiàn)為非結(jié)構(gòu)化環(huán)境,這些需求和現(xiàn)有技術(shù)比較還是有一點(diǎn)差距的。

陳小平教授曾任2015年世界人工智能大會(huì)機(jī)器人領(lǐng)域主席,2008年、2015年兩年的機(jī)器人世界杯及學(xué)術(shù)大會(huì)主席。在2016年獲得IEEEROBIO大會(huì)最佳論文獎(jiǎng),同時(shí)還獲得了國(guó)務(wù)院政府特殊津貼,是中科大杰出研究校長(zhǎng)獎(jiǎng)獲得者。

陳小平教授從精確性和靈巧性兩個(gè)方面深入分析了機(jī)器人過去取得的成就,及將來面臨的挑戰(zhàn)。以下是陳教授在機(jī)器人大講堂的演講實(shí)錄(為使文章簡(jiǎn)介規(guī)范,略有改動(dòng)):

機(jī)器人靈巧性:需求推動(dòng)的技術(shù)變革

機(jī)器人從精確性向靈巧性轉(zhuǎn)變

對(duì)于機(jī)器人的發(fā)展,我們一方面結(jié)合國(guó)家戰(zhàn)略需求和市場(chǎng)的需求研發(fā)機(jī)器人;另一方面,根據(jù)我們了解的全球機(jī)器人技術(shù)都取得了什么樣的成果,能夠支撐什么樣的應(yīng)用,來衡量技術(shù)的有效性。當(dāng)把兩個(gè)方面放在一起時(shí),我們發(fā)現(xiàn),機(jī)器人現(xiàn)在需要有一個(gè)根本性的進(jìn)化,這就是逐漸從精確性進(jìn)入到了靈巧性。

回顧一下機(jī)器人產(chǎn)業(yè)的歷史。1961在通用汽車生產(chǎn)線上用了工業(yè)機(jī)器人,到現(xiàn)在56年了。人工智能領(lǐng)域到現(xiàn)在已經(jīng)做了60多年,取得的成果國(guó)內(nèi)比較關(guān)注的是阿爾法狗,但西方民眾開始重視人工智能是在1997年,當(dāng)時(shí)IBM的深藍(lán)戰(zhàn)勝了十年棋王卡斯特羅夫。

所以,對(duì)西方人來說,他們感受到人工智能超過人的時(shí)間比我們?cè)?0年。但是為什么工業(yè)機(jī)器人能夠成功,而所謂的智能機(jī)器人到現(xiàn)在還不成功?

工業(yè)機(jī)器人回顧

其實(shí)工業(yè)機(jī)器人是比較簡(jiǎn)單的,其硬件本體基于關(guān)節(jié)-連桿機(jī)構(gòu),用運(yùn)動(dòng)學(xué)來計(jì)算關(guān)節(jié)的角度,保證機(jī)械臂的末端能夠達(dá)到指定的位置。這很容易給人帶來一個(gè)誤區(qū),覺得機(jī)器人的成功完全是因?yàn)闄C(jī)械臂的精確性,其實(shí)不是這樣的。

近幾年我們到很多生產(chǎn)現(xiàn)場(chǎng)去實(shí)地學(xué)習(xí),發(fā)現(xiàn)生產(chǎn)線上還需要大量輔助設(shè)備,其中一種叫夾具。夾具相對(duì)于機(jī)器人來說古老得多,這個(gè)領(lǐng)域有很多成熟的技術(shù)。一般來說,在國(guó)內(nèi),一條生產(chǎn)線只有1/3到1/5的開支是機(jī)械臂的,其它的都是這些輔助設(shè)備的,包括夾具的。

在國(guó)外,他們的加工精度更高,所以他們輔助裝備的開支占比更大,只有1/5到1/8是機(jī)械臂,其它都是輔助設(shè)備的。我們這樣全面的一看才發(fā)現(xiàn):工業(yè)機(jī)器人能夠成功,并不是單純的因?yàn)闄C(jī)械臂的精確性,還要加上環(huán)境的精確性。

環(huán)境怎么能精確?必需經(jīng)過精確化改造,也就是說造一條生產(chǎn)線,以保證生產(chǎn)線上的每一個(gè)操作對(duì)象(如工件)在任何時(shí)刻都被精確定位,使得機(jī)械臂和其他加工設(shè)備可以精確地進(jìn)行操作。這才是工業(yè)機(jī)器人的一個(gè)完整圖像。

傳統(tǒng)主流控制策略

工業(yè)機(jī)器人背后的技術(shù)主要是控制技術(shù)。傳統(tǒng)的主流控制技術(shù)有四種:優(yōu)化控制、適應(yīng)性控制、Robust控制,這三種都試圖讓機(jī)器人有一定的靈活性或者靈巧性,第四種叫分層控制。當(dāng)問題太復(fù)雜了,就需要分層控制了。

各種傳統(tǒng)控制策略背后的原理,其實(shí)就兩種。

第一種是基于決策論的精確控制,也就是基于馬爾可夫決策過程理論的控制原理。這種原理對(duì)問題做了一個(gè)抽象,把實(shí)際問題抽象為狀態(tài)集、行動(dòng)集、回報(bào)函數(shù)和概率轉(zhuǎn)移函數(shù)四個(gè)基本構(gòu)件。在這套基本構(gòu)件的基礎(chǔ)上,引入一些數(shù)學(xué)規(guī)劃的方法。首先定義值函數(shù),值函數(shù)是評(píng)價(jià)一個(gè)動(dòng)作的價(jià)值的。

值函數(shù)怎么計(jì)算?原始的辦法是用貝爾曼公式,后來有很多種改進(jìn)的計(jì)算辦法。有了值函數(shù),就可以計(jì)算最優(yōu)策略,從而決定在什么狀態(tài)下執(zhí)行什么策略最好。決策論的一個(gè)基本要素是概率轉(zhuǎn)移函數(shù),概率轉(zhuǎn)移函數(shù)在馬爾可夫決策里扮演了關(guān)鍵性的角色,后面的值函數(shù)和最優(yōu)策略求解,都依靠概率轉(zhuǎn)移函數(shù),沒有它后面的事情都干不了。

這套體系在理論上有很多成果,但在實(shí)際應(yīng)用中,根據(jù)我們的觀察和了解,得到一個(gè)大規(guī)模實(shí)際問題的可實(shí)用的概率轉(zhuǎn)移函數(shù)是非常困難的,鮮見成功實(shí)例。也就是說,這套理論假定了一種數(shù)學(xué)機(jī)制,但那個(gè)機(jī)制在大規(guī)模實(shí)際問題中通常是得不到的。

那么,工業(yè)機(jī)器人實(shí)際上是怎么干的?就是用運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)來簡(jiǎn)化決策論模型,關(guān)鍵是把概率轉(zhuǎn)移函數(shù)給取代了,這樣就沒問題了。這樣做的效果是達(dá)到了精確性,但很大程度上喪失了靈巧性,因?yàn)樵隈R氏決策論體系中,沒有概率就無法表達(dá)不確定性。因此,在工業(yè)上實(shí)際我們用的是運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)這套辦法。

還有一種是基于模糊數(shù)學(xué)的模糊控制。模糊數(shù)學(xué)也可以用一段話來概括,核心思想是用實(shí)數(shù)區(qū)間[0,1],即用連續(xù)統(tǒng)上的分類/建模替代二值布爾分類/建模。比如講臺(tái)邊緣能精確測(cè)量嗎?不能。那么按照模糊數(shù)學(xué),對(duì)桌面邊緣上的每一點(diǎn),給它一個(gè)隸屬度。

比如給它1,表示這一點(diǎn)肯定在桌面上;給它0,肯定不在桌面上;其他情況,用隸屬度大小表示在桌面上的模糊度。隸屬度和馬氏決策論中的概率轉(zhuǎn)移函數(shù)一樣,對(duì)于大規(guī)模實(shí)際問題很難得到實(shí)用化的隸屬度。

1997年,IBM的深藍(lán)打敗了卡斯帕羅夫,當(dāng)時(shí)西方人和我們看到阿爾法狗打敗李世石是一樣的,感覺天都塌了。深藍(lán)的核心技術(shù)是前瞻至少14步,對(duì)前瞻得到的棋局用專家的知識(shí)做判斷,選擇最有利的走步。這么簡(jiǎn)單的辦法計(jì)算量非常大,所以用了人工智能的一種技術(shù)叫剪枝,把前瞻棋局減到了600億個(gè),但還是算不過來。

人工智能硬件什么時(shí)候開始做?深藍(lán)就開始做了,不是現(xiàn)在才做。許峰雄做了專用的芯片,計(jì)算國(guó)際象棋棋局的評(píng)價(jià),一秒鐘算5億個(gè)棋局,600億個(gè)棋局5分鐘就算完了,可以用于比賽實(shí)戰(zhàn)。這套技術(shù)看上去很簡(jiǎn)單,但是意義非常重大,我把它的意義總結(jié)為“許峰雄不等式”:

人工智能+專家+高性能計(jì)算>頂級(jí)專家

其中“人工智能”就是搜索技術(shù)、剪枝技術(shù),高性能計(jì)算就是那些芯片,專家是加入深藍(lán)小組的一些國(guó)際象棋大師級(jí)棋手。所以,這件事意義非凡,這是人類歷史上第一次人工智能在復(fù)雜博弈問題上戰(zhàn)勝人類。在這一點(diǎn)上,深藍(lán)的貢獻(xiàn)超過了阿爾法狗。

下面就到圍棋了,看一下阿爾法狗是怎么做的。兩個(gè)所謂的“大腦”就是兩個(gè)神經(jīng)網(wǎng)絡(luò)。這樣一說其實(shí)又容易給我們?cè)斐梢恍┱`區(qū),好像阿爾法狗技術(shù)跟以前的人工智能博弈沒有關(guān)系,其實(shí)不是的。

這兩個(gè)網(wǎng)絡(luò)在理論上都是我前面跟各位介紹的決策論模型中的東西,都是馬爾可夫決策里面的東西。但是它是有創(chuàng)新的,通過引進(jìn)機(jī)器學(xué)習(xí)技術(shù),直接學(xué)習(xí)Policynetwork和Valuenetwork,繞過了概率轉(zhuǎn)移函數(shù),直接學(xué)出了回報(bào)函數(shù),根本不去學(xué)概率轉(zhuǎn)移矩陣。

也就是說,現(xiàn)在阿爾法狗也還是學(xué)不了概率轉(zhuǎn)移矩陣,所以它繞過去了。但新聞報(bào)道里沒有人說這個(gè)事,說的都是深度學(xué)習(xí)。其實(shí)深度學(xué)習(xí)技術(shù)支撐了阿爾法狗的理論創(chuàng)新。

我們分析人工智能獲得成功的領(lǐng)域,發(fā)現(xiàn)都有一些共同的特征,一個(gè)是確定性的,比如下棋就是確定的,一個(gè)子落在哪里不能含糊。還有一個(gè)是規(guī)則化,下棋一定是有明確規(guī)則的。第三,環(huán)境也是結(jié)構(gòu)化的。在這三個(gè)條件成立的場(chǎng)景中,人工智能已經(jīng)可以超過人。但三個(gè)條件之一不成立,人工智能就不行了。

當(dāng)然我們也得留一個(gè)尾巴,做阿爾法狗的公司是不是有一些沒有公布的東西,而那些東西能夠超越這三個(gè)要求,超越固定性、規(guī)則性和結(jié)構(gòu)化的局限仍然可以戰(zhàn)勝人類?如果有這樣的技術(shù),那是非常強(qiáng)大的,同時(shí)也就變得非常危險(xiǎn)。但目前我們看到的已經(jīng)公開的技術(shù)是無法超越的,現(xiàn)有成果是在這三個(gè)條件下的科技創(chuàng)新。

機(jī)器人應(yīng)用的新需求

既然是有條件的,在這些條件下,這些新的智能技術(shù)能不能用來滿足機(jī)器人應(yīng)用的新的需求?舉幾個(gè)例子。一個(gè)是家庭服務(wù)機(jī)器人,這張圖是服務(wù)機(jī)器人的比賽,現(xiàn)在服務(wù)機(jī)器人還沒有在家庭里應(yīng)用。

這張圖里有一個(gè)人在家里摔倒了,你不知道摔在什么地方,沒有夾具把他夾住的,機(jī)器人要去找,要觀察他是不是真的倒了,倒的是一個(gè)人還是一條狗。找到以后先通過對(duì)話詢問,你感覺好不好?是自己累了在地上躺著休息休息,還是需要我?guī)椭??如果需要幫助,需要什么幫助?是需要拿藥,還是抱起來?抱起來現(xiàn)在還不容易做到。

這個(gè)比賽顯然跟工業(yè)機(jī)器人完全不一樣,環(huán)境沒有精確化,環(huán)境中的對(duì)象都得靠機(jī)器人自己去感知,而且是變化的,比如人每次摔倒的位置可能都不一樣。所以家庭應(yīng)用真的是挺難的,但確實(shí)是人類所需要的。

還有一個(gè)更難一點(diǎn)的應(yīng)用,即救援機(jī)器人,救援比在家庭里提供服務(wù)更復(fù)雜。你執(zhí)行了一個(gè)動(dòng)作,這個(gè)動(dòng)作的結(jié)果是什么?你事先是不知道的,沒有辦法確定的。很多復(fù)雜的環(huán)境因素決定了行動(dòng)的結(jié)果。這就是所謂的“不確定性”。當(dāng)前國(guó)際人工智能最大的挑戰(zhàn)就在于不確定性問題。救援就是不確定性問題的一個(gè)非常好的例子。

精確性-靈巧性譜系

這張圖中,工業(yè)機(jī)器人具有最大的精確性,最少的靈巧性。再看手術(shù)機(jī)器人,它和工業(yè)機(jī)器人不是同類,卻也很成功,為什么?因?yàn)槭中g(shù)機(jī)器人也是主要靠精確性的,靈巧性很少。手術(shù)前醫(yī)生為患者打麻藥,再捆皮帶,確?;颊咴谑中g(shù)過程中不會(huì)亂動(dòng),而且很多手術(shù)機(jī)器人是人來操作的,這樣就多了一些靈巧性。

最右邊是家庭服務(wù)機(jī)器人,需要很大的靈巧性。在它的右邊是救援機(jī)器人,救援機(jī)器人我都沒畫到圖里。農(nóng)業(yè)機(jī)器人比家庭機(jī)器人需要的靈巧性要少一些,精確性稍微多一些。這樣一看,農(nóng)業(yè)機(jī)器人的投資方向非常好。

因?yàn)檗r(nóng)作物在播種前可以對(duì)田地做一些安排,所以農(nóng)業(yè)生y產(chǎn)其實(shí)是一個(gè)半結(jié)構(gòu)化環(huán)境,因此農(nóng)業(yè)機(jī)器人難度是比較低的。智能制造需要更多的精確性,相對(duì)少一點(diǎn)的靈巧性。智能制造精確性和靈巧性都需要的比較多,所以比農(nóng)業(yè)機(jī)器人還要更難一點(diǎn)。

最有意思的是中間的自主無人駕駛汽車,出來兩條線,左邊一條線需要比較多的精確性,這代表自主駕駛的理想狀態(tài),包括兩個(gè)方面的要求。一個(gè)是路況和所有的交通標(biāo)識(shí),要求自動(dòng)駕駛所需要的交通標(biāo)識(shí)都能夠被無人車傳感器得到。

另一個(gè)是周圍其他的車輛和行人都遵守交規(guī)。這兩個(gè)條件都滿足了,無人車是很簡(jiǎn)單的,現(xiàn)在的技術(shù)就能實(shí)現(xiàn)。但實(shí)際上這兩個(gè)條件很難滿足,特別是在中國(guó),不遵守交規(guī)的太多了,有的地方交通標(biāo)識(shí)也不是很清晰,有的被破壞了。這就是現(xiàn)實(shí)狀態(tài),需要很大的靈巧性(靈敏性、靈活性)。所以在中國(guó)做全自主無人車是非常了不起的。

機(jī)器人新應(yīng)用挑戰(zhàn)

傳統(tǒng)機(jī)器人依靠精確性,新的人工智能依賴確定性。我們面臨新的應(yīng)用,需要用靈巧性處理不確定性。這是新的應(yīng)用需求對(duì)我們提出的主要挑戰(zhàn)。我們?nèi)绻茉诩夹g(shù)上對(duì)這種挑戰(zhàn)想出一些好的辦法,或者在工程上想出好的辦法,那就可以滿足新的應(yīng)用需求。

需求是“家”,技術(shù)是“回家”的路。新的應(yīng)用和老的應(yīng)用是什么關(guān)系?老的應(yīng)用相當(dāng)于我們過去的“家”,新的應(yīng)用相當(dāng)于我們有了一個(gè)新“家”。但是人都有路徑依賴性,我們不自覺的就會(huì)往老路上走。所以,現(xiàn)在大部分機(jī)器人的研發(fā)都是立足于精確性技術(shù)途徑的。我理解這是一種路徑依賴性。

針對(duì)我們面臨的挑戰(zhàn),中科大發(fā)展了一套靈巧性技術(shù)。這里用一個(gè)例子加以說明。

假設(shè)想讓機(jī)器人給我送一杯水,放桌邊,離我越近越好。但是,由于存在感知誤差和操作誤差,在誤差區(qū)域內(nèi)是不能放東西的,那我們就不在那個(gè)區(qū)域放。所以在很多應(yīng)用里,特別是在很多新的應(yīng)用里,是不需要太精確的,有些危險(xiǎn)的區(qū)域避開就行了。

我們提出了一個(gè)框架:全局有一個(gè)粗略模型,機(jī)器人先按照粗略模型做一個(gè)全局決策,在執(zhí)行全局決策的過程中根據(jù)任務(wù)需要進(jìn)行局部觀察,對(duì)全局的決策做局部調(diào)整,這樣就不需要對(duì)桌面形狀、邊緣做精確的度量和建模,就能完成靈巧操作。

我們做過一個(gè)實(shí)驗(yàn),用可佳機(jī)器人來操作微波爐,加熱食品,整個(gè)過程都是機(jī)器人獨(dú)立完成的,現(xiàn)在世界上還沒有第二個(gè)團(tuán)隊(duì)完整實(shí)現(xiàn)過。這個(gè)實(shí)驗(yàn)和背后的技術(shù)體系也得過不少獎(jiǎng)。最近我們提出了一個(gè)新的框架,將精確性和靈巧性相結(jié)合,再加上局部的深度強(qiáng)化學(xué)習(xí)。我們用新的框架重新開發(fā)了系統(tǒng),開發(fā)效率大大提升了。

總結(jié)

當(dāng)前我們所處的歷史階段,一個(gè)是工業(yè)機(jī)器人大規(guī)模的應(yīng)用,已經(jīng)成功了半個(gè)世紀(jì)。二是人工智能研究了半個(gè)世紀(jì),現(xiàn)在也有一些新的發(fā)展,特別是以深度學(xué)習(xí)為代表的新技術(shù)達(dá)到了非常高的水平。

新的應(yīng)用需求要處理不確定性,處理不完全信息,具體表現(xiàn)為非結(jié)構(gòu)化環(huán)境,這些需求和現(xiàn)有技術(shù)比較還是有一點(diǎn)差距的。不是說深度學(xué)習(xí)出來了以后,馬上就能解決我們所有實(shí)際問題,其實(shí)不能完全解決。但是,如果我們轉(zhuǎn)到靈巧性,轉(zhuǎn)到以靈巧性為核心的技術(shù)體系,現(xiàn)有的很多技術(shù)可以組合起來,那就能達(dá)到很好的效果。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0