temptations,强行冲破那层薄薄的障碍视频,中国合伙人电影在线观看播放

我們發(fā)現(xiàn)，機(jī)器人現(xiàn)在需要有一個(gè)根本性的進(jìn)化，這就是逐漸從精確性進(jìn)入到了靈巧性。新的應(yīng)用需求要處理不確定性，處理不完全信息，具體表現(xiàn)為非結(jié)構(gòu)化環(huán)境，這些需求和現(xiàn)有技術(shù)比較還是有一點(diǎn)差距的。

陳小平教授曾任2015年世界人工智能大會(huì)機(jī)器人領(lǐng)域主席，2008年、2015年兩年的機(jī)器人世界杯及學(xué)術(shù)大會(huì)主席。在2016年獲得IEEEROBIO大會(huì)最佳論文獎(jiǎng)，同時(shí)還獲得了國(guó)務(wù)院政府特殊津貼，是中科大杰出研究校長(zhǎng)獎(jiǎng)獲得者。

陳小平教授從精確性和靈巧性兩個(gè)方面深入分析了機(jī)器人過去取得的成就，及將來面臨的挑戰(zhàn)。以下是陳教授在機(jī)器人大講堂的演講實(shí)錄(為使文章簡(jiǎn)介規(guī)范，略有改動(dòng))：

機(jī)器人靈巧性：需求推動(dòng)的技術(shù)變革

機(jī)器人從精確性向靈巧性轉(zhuǎn)變

對(duì)于機(jī)器人的發(fā)展，我們一方面結(jié)合國(guó)家戰(zhàn)略需求和市場(chǎng)的需求研發(fā)機(jī)器人；另一方面，根據(jù)我們了解的全球機(jī)器人技術(shù)都取得了什么樣的成果，能夠支撐什么樣的應(yīng)用，來衡量技術(shù)的有效性。當(dāng)把兩個(gè)方面放在一起時(shí)，我們發(fā)現(xiàn)，機(jī)器人現(xiàn)在需要有一個(gè)根本性的進(jìn)化，這就是逐漸從精確性進(jìn)入到了靈巧性。

回顧一下機(jī)器人產(chǎn)業(yè)的歷史。1961在通用汽車生產(chǎn)線上用了工業(yè)機(jī)器人，到現(xiàn)在56年了。人工智能領(lǐng)域到現(xiàn)在已經(jīng)做了60多年，取得的成果國(guó)內(nèi)比較關(guān)注的是阿爾法狗，但西方民眾開始重視人工智能是在1997年，當(dāng)時(shí)IBM的深藍(lán)戰(zhàn)勝了十年棋王卡斯特羅夫。

所以，對(duì)西方人來說，他們感受到人工智能超過人的時(shí)間比我們?cè)?0年。但是為什么工業(yè)機(jī)器人能夠成功，而所謂的智能機(jī)器人到現(xiàn)在還不成功？

工業(yè)機(jī)器人回顧

其實(shí)工業(yè)機(jī)器人是比較簡(jiǎn)單的，其硬件本體基于關(guān)節(jié)-連桿機(jī)構(gòu)，用運(yùn)動(dòng)學(xué)來計(jì)算關(guān)節(jié)的角度，保證機(jī)械臂的末端能夠達(dá)到指定的位置。這很容易給人帶來一個(gè)誤區(qū)，覺得機(jī)器人的成功完全是因?yàn)闄C(jī)械臂的精確性，其實(shí)不是這樣的。

近幾年我們到很多生產(chǎn)現(xiàn)場(chǎng)去實(shí)地學(xué)習(xí)，發(fā)現(xiàn)生產(chǎn)線上還需要大量輔助設(shè)備，其中一種叫夾具。夾具相對(duì)于機(jī)器人來說古老得多，這個(gè)領(lǐng)域有很多成熟的技術(shù)。一般來說，在國(guó)內(nèi)，一條生產(chǎn)線只有1/3到1/5的開支是機(jī)械臂的，其它的都是這些輔助設(shè)備的，包括夾具的。

在國(guó)外，他們的加工精度更高，所以他們輔助裝備的開支占比更大，只有1/5到1/8是機(jī)械臂，其它都是輔助設(shè)備的。我們這樣全面的一看才發(fā)現(xiàn)：工業(yè)機(jī)器人能夠成功，并不是單純的因?yàn)闄C(jī)械臂的精確性，還要加上環(huán)境的精確性。

環(huán)境怎么能精確？必需經(jīng)過精確化改造，也就是說造一條生產(chǎn)線，以保證生產(chǎn)線上的每一個(gè)操作對(duì)象(如工件)在任何時(shí)刻都被精確定位，使得機(jī)械臂和其他加工設(shè)備可以精確地進(jìn)行操作。這才是工業(yè)機(jī)器人的一個(gè)完整圖像。

傳統(tǒng)主流控制策略

工業(yè)機(jī)器人背后的技術(shù)主要是控制技術(shù)。傳統(tǒng)的主流控制技術(shù)有四種：優(yōu)化控制、適應(yīng)性控制、Robust控制，這三種都試圖讓機(jī)器人有一定的靈活性或者靈巧性，第四種叫分層控制。當(dāng)問題太復(fù)雜了，就需要分層控制了。

各種傳統(tǒng)控制策略背后的原理，其實(shí)就兩種。

第一種是基于決策論的精確控制，也就是基于馬爾可夫決策過程理論的控制原理。這種原理對(duì)問題做了一個(gè)抽象，把實(shí)際問題抽象為狀態(tài)集、行動(dòng)集、回報(bào)函數(shù)和概率轉(zhuǎn)移函數(shù)四個(gè)基本構(gòu)件。在這套基本構(gòu)件的基礎(chǔ)上，引入一些數(shù)學(xué)規(guī)劃的方法。首先定義值函數(shù)，值函數(shù)是評(píng)價(jià)一個(gè)動(dòng)作的價(jià)值的。

值函數(shù)怎么計(jì)算？原始的辦法是用貝爾曼公式，后來有很多種改進(jìn)的計(jì)算辦法。有了值函數(shù)，就可以計(jì)算最優(yōu)策略，從而決定在什么狀態(tài)下執(zhí)行什么策略最好。決策論的一個(gè)基本要素是概率轉(zhuǎn)移函數(shù)，概率轉(zhuǎn)移函數(shù)在馬爾可夫決策里扮演了關(guān)鍵性的角色，后面的值函數(shù)和最優(yōu)策略求解，都依靠概率轉(zhuǎn)移函數(shù)，沒有它后面的事情都干不了。

這套體系在理論上有很多成果，但在實(shí)際應(yīng)用中，根據(jù)我們的觀察和了解，得到一個(gè)大規(guī)模實(shí)際問題的可實(shí)用的概率轉(zhuǎn)移函數(shù)是非常困難的，鮮見成功實(shí)例。也就是說，這套理論假定了一種數(shù)學(xué)機(jī)制，但那個(gè)機(jī)制在大規(guī)模實(shí)際問題中通常是得不到的。

那么，工業(yè)機(jī)器人實(shí)際上是怎么干的？就是用運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)來簡(jiǎn)化決策論模型，關(guān)鍵是把概率轉(zhuǎn)移函數(shù)給取代了，這樣就沒問題了。這樣做的效果是達(dá)到了精確性，但很大程度上喪失了靈巧性，因?yàn)樵隈R氏決策論體系中，沒有概率就無法表達(dá)不確定性。因此，在工業(yè)上實(shí)際我們用的是運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)這套辦法。

還有一種是基于模糊數(shù)學(xué)的模糊控制。模糊數(shù)學(xué)也可以用一段話來概括，核心思想是用實(shí)數(shù)區(qū)間[0，1]，即用連續(xù)統(tǒng)上的分類/建模替代二值布爾分類/建模。比如講臺(tái)邊緣能精確測(cè)量嗎？不能。那么按照模糊數(shù)學(xué)，對(duì)桌面邊緣上的每一點(diǎn)，給它一個(gè)隸屬度。

比如給它1，表示這一點(diǎn)肯定在桌面上；給它0，肯定不在桌面上；其他情況，用隸屬度大小表示在桌面上的模糊度。隸屬度和馬氏決策論中的概率轉(zhuǎn)移函數(shù)一樣，對(duì)于大規(guī)模實(shí)際問題很難得到實(shí)用化的隸屬度。

1997年，IBM的深藍(lán)打敗了卡斯帕羅夫，當(dāng)時(shí)西方人和我們看到阿爾法狗打敗李世石是一樣的，感覺天都塌了。深藍(lán)的核心技術(shù)是前瞻至少14步，對(duì)前瞻得到的棋局用專家的知識(shí)做判斷，選擇最有利的走步。這么簡(jiǎn)單的辦法計(jì)算量非常大，所以用了人工智能的一種技術(shù)叫剪枝，把前瞻棋局減到了600億個(gè)，但還是算不過來。

人工智能硬件什么時(shí)候開始做？深藍(lán)就開始做了，不是現(xiàn)在才做。許峰雄做了專用的芯片，計(jì)算國(guó)際象棋棋局的評(píng)價(jià)，一秒鐘算5億個(gè)棋局，600億個(gè)棋局5分鐘就算完了，可以用于比賽實(shí)戰(zhàn)。這套技術(shù)看上去很簡(jiǎn)單，但是意義非常重大，我把它的意義總結(jié)為“許峰雄不等式”：

人工智能+專家+高性能計(jì)算>頂級(jí)專家

其中“人工智能”就是搜索技術(shù)、剪枝技術(shù)，高性能計(jì)算就是那些芯片，專家是加入深藍(lán)小組的一些國(guó)際象棋大師級(jí)棋手。所以，這件事意義非凡，這是人類歷史上第一次人工智能在復(fù)雜博弈問題上戰(zhàn)勝人類。在這一點(diǎn)上，深藍(lán)的貢獻(xiàn)超過了阿爾法狗。

下面就到圍棋了，看一下阿爾法狗是怎么做的。兩個(gè)所謂的“大腦”就是兩個(gè)神經(jīng)網(wǎng)絡(luò)。這樣一說其實(shí)又容易給我們?cè)斐梢恍┱`區(qū)，好像阿爾法狗技術(shù)跟以前的人工智能博弈沒有關(guān)系，其實(shí)不是的。

這兩個(gè)網(wǎng)絡(luò)在理論上都是我前面跟各位介紹的決策論模型中的東西，都是馬爾可夫決策里面的東西。但是它是有創(chuàng)新的，通過引進(jìn)機(jī)器學(xué)習(xí)技術(shù)，直接學(xué)習(xí)Policynetwork和Valuenetwork，繞過了概率轉(zhuǎn)移函數(shù)，直接學(xué)出了回報(bào)函數(shù)，根本不去學(xué)概率轉(zhuǎn)移矩陣。

也就是說，現(xiàn)在阿爾法狗也還是學(xué)不了概率轉(zhuǎn)移矩陣，所以它繞過去了。但新聞報(bào)道里沒有人說這個(gè)事，說的都是深度學(xué)習(xí)。其實(shí)深度學(xué)習(xí)技術(shù)支撐了阿爾法狗的理論創(chuàng)新。

我們分析人工智能獲得成功的領(lǐng)域，發(fā)現(xiàn)都有一些共同的特征，一個(gè)是確定性的，比如下棋就是確定的，一個(gè)子落在哪里不能含糊。還有一個(gè)是規(guī)則化，下棋一定是有明確規(guī)則的。第三，環(huán)境也是結(jié)構(gòu)化的。在這三個(gè)條件成立的場(chǎng)景中，人工智能已經(jīng)可以超過人。但三個(gè)條件之一不成立，人工智能就不行了。

當(dāng)然我們也得留一個(gè)尾巴，做阿爾法狗的公司是不是有一些沒有公布的東西，而那些東西能夠超越這三個(gè)要求，超越固定性、規(guī)則性和結(jié)構(gòu)化的局限仍然可以戰(zhàn)勝人類？如果有這樣的技術(shù)，那是非常強(qiáng)大的，同時(shí)也就變得非常危險(xiǎn)。但目前我們看到的已經(jīng)公開的技術(shù)是無法超越的，現(xiàn)有成果是在這三個(gè)條件下的科技創(chuàng)新。

機(jī)器人應(yīng)用的新需求

既然是有條件的，在這些條件下，這些新的智能技術(shù)能不能用來滿足機(jī)器人應(yīng)用的新的需求？舉幾個(gè)例子。一個(gè)是家庭服務(wù)機(jī)器人，這張圖是服務(wù)機(jī)器人的比賽，現(xiàn)在服務(wù)機(jī)器人還沒有在家庭里應(yīng)用。

這張圖里有一個(gè)人在家里摔倒了，你不知道摔在什么地方，沒有夾具把他夾住的，機(jī)器人要去找，要觀察他是不是真的倒了，倒的是一個(gè)人還是一條狗。找到以后先通過對(duì)話詢問，你感覺好不好？是自己累了在地上躺著休息休息，還是需要我?guī)椭?？如果需要幫助，需要什么幫助？是需要拿藥，還是抱起來？抱起來現(xiàn)在還不容易做到。

這個(gè)比賽顯然跟工業(yè)機(jī)器人完全不一樣，環(huán)境沒有精確化，環(huán)境中的對(duì)象都得靠機(jī)器人自己去感知，而且是變化的，比如人每次摔倒的位置可能都不一樣。所以家庭應(yīng)用真的是挺難的，但確實(shí)是人類所需要的。

還有一個(gè)更難一點(diǎn)的應(yīng)用，即救援機(jī)器人，救援比在家庭里提供服務(wù)更復(fù)雜。你執(zhí)行了一個(gè)動(dòng)作，這個(gè)動(dòng)作的結(jié)果是什么？你事先是不知道的，沒有辦法確定的。很多復(fù)雜的環(huán)境因素決定了行動(dòng)的結(jié)果。這就是所謂的“不確定性”。當(dāng)前國(guó)際人工智能最大的挑戰(zhàn)就在于不確定性問題。救援就是不確定性問題的一個(gè)非常好的例子。

精確性-靈巧性譜系

這張圖中，工業(yè)機(jī)器人具有最大的精確性，最少的靈巧性。再看手術(shù)機(jī)器人，它和工業(yè)機(jī)器人不是同類，卻也很成功，為什么？因?yàn)槭中g(shù)機(jī)器人也是主要靠精確性的，靈巧性很少。手術(shù)前醫(yī)生為患者打麻藥，再捆皮帶，確?；颊咴谑中g(shù)過程中不會(huì)亂動(dòng)，而且很多手術(shù)機(jī)器人是人來操作的，這樣就多了一些靈巧性。

最右邊是家庭服務(wù)機(jī)器人，需要很大的靈巧性。在它的右邊是救援機(jī)器人，救援機(jī)器人我都沒畫到圖里。農(nóng)業(yè)機(jī)器人比家庭機(jī)器人需要的靈巧性要少一些，精確性稍微多一些。這樣一看，農(nóng)業(yè)機(jī)器人的投資方向非常好。

因?yàn)檗r(nóng)作物在播種前可以對(duì)田地做一些安排，所以農(nóng)業(yè)生y產(chǎn)其實(shí)是一個(gè)半結(jié)構(gòu)化環(huán)境，因此農(nóng)業(yè)機(jī)器人難度是比較低的。智能制造需要更多的精確性，相對(duì)少一點(diǎn)的靈巧性。智能制造精確性和靈巧性都需要的比較多，所以比農(nóng)業(yè)機(jī)器人還要更難一點(diǎn)。

最有意思的是中間的自主無人駕駛汽車，出來兩條線，左邊一條線需要比較多的精確性，這代表自主駕駛的理想狀態(tài)，包括兩個(gè)方面的要求。一個(gè)是路況和所有的交通標(biāo)識(shí)，要求自動(dòng)駕駛所需要的交通標(biāo)識(shí)都能夠被無人車傳感器得到。

另一個(gè)是周圍其他的車輛和行人都遵守交規(guī)。這兩個(gè)條件都滿足了，無人車是很簡(jiǎn)單的，現(xiàn)在的技術(shù)就能實(shí)現(xiàn)。但實(shí)際上這兩個(gè)條件很難滿足，特別是在中國(guó)，不遵守交規(guī)的太多了，有的地方交通標(biāo)識(shí)也不是很清晰，有的被破壞了。這就是現(xiàn)實(shí)狀態(tài)，需要很大的靈巧性(靈敏性、靈活性)。所以在中國(guó)做全自主無人車是非常了不起的。

機(jī)器人新應(yīng)用挑戰(zhàn)

傳統(tǒng)機(jī)器人依靠精確性，新的人工智能依賴確定性。我們面臨新的應(yīng)用，需要用靈巧性處理不確定性。這是新的應(yīng)用需求對(duì)我們提出的主要挑戰(zhàn)。我們?nèi)绻茉诩夹g(shù)上對(duì)這種挑戰(zhàn)想出一些好的辦法，或者在工程上想出好的辦法，那就可以滿足新的應(yīng)用需求。

需求是“家”，技術(shù)是“回家”的路。新的應(yīng)用和老的應(yīng)用是什么關(guān)系？老的應(yīng)用相當(dāng)于我們過去的“家”，新的應(yīng)用相當(dāng)于我們有了一個(gè)新“家”。但是人都有路徑依賴性，我們不自覺的就會(huì)往老路上走。所以，現(xiàn)在大部分機(jī)器人的研發(fā)都是立足于精確性技術(shù)途徑的。我理解這是一種路徑依賴性。

針對(duì)我們面臨的挑戰(zhàn)，中科大發(fā)展了一套靈巧性技術(shù)。這里用一個(gè)例子加以說明。

假設(shè)想讓機(jī)器人給我送一杯水，放桌邊，離我越近越好。但是，由于存在感知誤差和操作誤差，在誤差區(qū)域內(nèi)是不能放東西的，那我們就不在那個(gè)區(qū)域放。所以在很多應(yīng)用里，特別是在很多新的應(yīng)用里，是不需要太精確的，有些危險(xiǎn)的區(qū)域避開就行了。

我們提出了一個(gè)框架：全局有一個(gè)粗略模型，機(jī)器人先按照粗略模型做一個(gè)全局決策，在執(zhí)行全局決策的過程中根據(jù)任務(wù)需要進(jìn)行局部觀察，對(duì)全局的決策做局部調(diào)整，這樣就不需要對(duì)桌面形狀、邊緣做精確的度量和建模，就能完成靈巧操作。

我們做過一個(gè)實(shí)驗(yàn)，用可佳機(jī)器人來操作微波爐，加熱食品，整個(gè)過程都是機(jī)器人獨(dú)立完成的，現(xiàn)在世界上還沒有第二個(gè)團(tuán)隊(duì)完整實(shí)現(xiàn)過。這個(gè)實(shí)驗(yàn)和背后的技術(shù)體系也得過不少獎(jiǎng)。最近我們提出了一個(gè)新的框架，將精確性和靈巧性相結(jié)合，再加上局部的深度強(qiáng)化學(xué)習(xí)。我們用新的框架重新開發(fā)了系統(tǒng)，開發(fā)效率大大提升了。

總結(jié)

當(dāng)前我們所處的歷史階段，一個(gè)是工業(yè)機(jī)器人大規(guī)模的應(yīng)用，已經(jīng)成功了半個(gè)世紀(jì)。二是人工智能研究了半個(gè)世紀(jì)，現(xiàn)在也有一些新的發(fā)展，特別是以深度學(xué)習(xí)為代表的新技術(shù)達(dá)到了非常高的水平。

新的應(yīng)用需求要處理不確定性，處理不完全信息，具體表現(xiàn)為非結(jié)構(gòu)化環(huán)境，這些需求和現(xiàn)有技術(shù)比較還是有一點(diǎn)差距的。不是說深度學(xué)習(xí)出來了以后，馬上就能解決我們所有實(shí)際問題，其實(shí)不能完全解決。但是，如果我們轉(zhuǎn)到靈巧性，轉(zhuǎn)到以靈巧性為核心的技術(shù)體系，現(xiàn)有的很多技術(shù)可以組合起來，那就能達(dá)到很好的效果。