AI人工智能在運(yùn)用過去的經(jīng)驗(yàn)和知識方面存在著局限性

時間:2017-03-27

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:具備知識技能遷移能力,代表可以關(guān)聯(lián)不同的任務(wù),充分利用已掌握的技能來解決新的問題。具備這種能力的AI,便在接近人類智慧的道路上更進(jìn)了一步。

具備知識技能遷移能力,代表可以關(guān)聯(lián)不同的任務(wù),充分利用已掌握的技能來解決新的問題。具備這種能力的AI,便在接近人類智慧的道路上更進(jìn)了一步。

AI距離人類智慧究竟還有多長的路要走?

問題突破口之一便是發(fā)展"通用型人工智能"。

"人類和動物能夠掌握大量知識的一個關(guān)鍵因素,就在于他們可以在以前知識的基礎(chǔ)上不斷學(xué)習(xí)新東西。"具備知識技能遷移能力,代表可以關(guān)聯(lián)不同的任務(wù),充分利用已掌握的技能來解決新的問題。具備這種能力的AI,便在接近人類智慧的道路上更進(jìn)了一步。

當(dāng)下,人工智能概念大火,仿佛未來人類的一切都將被AI所接管,但實(shí)際上,人工智能的發(fā)展中仍有一個特別棘手的問題有待解決,那就是機(jī)器無法像人類一樣自由靈活的運(yùn)用通用智慧來應(yīng)對挑戰(zhàn)。換言之:人工智能在運(yùn)用過去的經(jīng)驗(yàn)和知識方面是受限的。同理,答案就在問題中,發(fā)展"通用型人工智能(artificialgeneralintelligence)"就成了是最明確的主攻方向。

如今,谷歌的DeepMind團(tuán)隊(duì)剛剛發(fā)表的新論文《EnablingContinualLearninginNeuralNetwork》就又在這一問題上取得了突破,其聯(lián)合帝國理工學(xué)院開發(fā)出一套名為彈性權(quán)重固化(elasticweightconsolidation)新的算法,描述了讓機(jī)器學(xué)習(xí)、記住并重新使用信息將成為可能。

DeepMind的JamesKirkpatrick就說:"如果我們想要擁有更智能、更有應(yīng)用價值的計(jì)算機(jī)程序,那么,它就必須具備"通用型人工智能"的能力。"

人機(jī)有別

對于人類來說,知識技能的遷移是再正常不過的事情了,最典型的例子是:一個專業(yè)的滑雪玩家往往在滑冰上面也會表現(xiàn)的得心應(yīng)手。但這一步的跨越對于人工智能來說卻是不小的挑戰(zhàn)。

其癥結(jié)在于大多數(shù)的人工智能系統(tǒng)都是基于所謂的神經(jīng)網(wǎng)絡(luò)來解決問題,就像DeepMind的AI可以學(xué)會下圍棋或打撲克,這其實(shí)都是在經(jīng)歷了無數(shù)次的訓(xùn)練和失誤之后才練就的技能。但這兩種技能實(shí)際上是不能并存的,就比如AI學(xué)會了打撲克,那它就必須要把有關(guān)下圍棋的知識抹除掉。想來也是可惜,難怪研究人員將之稱為"災(zāi)難性遺忘"。

這一問題得不到解決,人工智能就永遠(yuǎn)不會達(dá)到人類的智慧程度,自然其解決問題靈活程度也就不會和人類看齊。"人類和動物能夠掌握大量知識的一個關(guān)鍵因素,就在于他們可以在以前知識的基礎(chǔ)上不斷學(xué)習(xí)新東西。"Kirkpatrick說。

而為了實(shí)現(xiàn)這一目標(biāo),研究人員首先在神經(jīng)科學(xué)領(lǐng)域進(jìn)行了探索,他們發(fā)現(xiàn),動物是通過保持住頭腦中關(guān)于過往技能印象,來實(shí)現(xiàn)不斷的學(xué)習(xí),而這往往也是在面臨生存的壓力使所不得不做出的抉擇,就比如老鼠如果不能快速地學(xué)會尋找食物的技能,那它們很快就會被餓死。

早在2014年,DeepMind通過用機(jī)器學(xué)習(xí)的方法,教會AI玩一款A(yù)tari公司出品的游戲,由此突然間吸引了極大關(guān)注。那時,AI可以做到順利通關(guān),并取得比人類更高的得分,但卻不能記住它贏得游戲的過程。

玩每一款A(yù)tari公司出品的游戲,AI都需要創(chuàng)建一個單獨(dú)的神經(jīng)網(wǎng)絡(luò)。一旦沒有把游戲相關(guān)的信息傳遞給計(jì)算機(jī),AI就無法運(yùn)行這一款游戲。

如今,DeepMind聯(lián)合帝國理工學(xué)院開發(fā)出一套新的算法,讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、記住并重新使用信息成為可能。這種名為彈性權(quán)重固化(elasticweightconsolidation)的算法所依賴的是"突觸固化(synapticconsolidation)"理論。在人腦中,這一點(diǎn)被稱為學(xué)習(xí)和記憶的基礎(chǔ)。

論文稱:"我們的方法是通過有選擇性地減慢對重要權(quán)重值的學(xué)習(xí),使機(jī)器能記住之前的任務(wù)。"

Kirkpatrick解釋說,算法會選擇運(yùn)用它所學(xué)習(xí)的內(nèi)容來玩一款游戲,然后保留其中學(xué)到的最為重要的部分。他也提到,"我們只允許程序間非常緩慢地漸進(jìn)式的改變,那樣的話才總是會有學(xué)習(xí)新任務(wù)的空間,而同時這種改變不會覆蓋我們之前學(xué)到的內(nèi)容。"

在測試中,研究人員利用被新算法強(qiáng)化過的DQN深度神經(jīng)網(wǎng)絡(luò)隨機(jī)玩10款A(yù)tari公司的游戲,幾天之后,他們發(fā)現(xiàn)AI已經(jīng)可以做到和人類玩家一樣優(yōu)秀了,這其中很大的一部分功勞都在于這種新的算法。沒了它,人工智能幾乎學(xué)不會其中任何一個游戲。

Kirkpatrick說,"我們之前的游戲AI只能學(xué)習(xí)玩一款游戲,而如今我們新發(fā)布的系統(tǒng)已經(jīng)對多款游戲都得心應(yīng)手了。"

在AI玩游戲的過程中,研究人員還注意到一些有趣的現(xiàn)象。例如,當(dāng)AI在玩賽車類游戲的時候,對于游戲中的白天、晚上、雪等不同的場景,AI已經(jīng)可以將它們分解為不同的任務(wù)來一一進(jìn)行解決了,這倒是很出乎大家的預(yù)料。

然而,緊接著又有新的問題出現(xiàn)了,那就是研究人員無法證明,AI是否可以把每一款游戲都玩到極致。概括來講,AI雖然已經(jīng)可以利用學(xué)過的知識來解決現(xiàn)有的問題,但它是否會因?yàn)檫\(yùn)用這種方法而將問題解決的更好,還值得商榷。"對于AI來說,還有改進(jìn)的余地。"Kirkpatrick說。

而AI沒有精通每一款游戲的一個原因就在于,它對于游戲策略的運(yùn)用仍然非常茫然。"雖然我們知道連貫學(xué)習(xí)的重要性,但我們始終沒能做出突破,進(jìn)入到模擬人類和動物那種學(xué)習(xí)模式的階段。這的確是一個艱難的挑戰(zhàn),但我們知道沒有什么事是不可逾越的。"Kirkpatrick說。

"我們距離通用型人工智能還有很長的路要走,也還有很多的研究和挑戰(zhàn)需要解決",Kirkpatrick補(bǔ)充道。"關(guān)鍵在于,搭建起一個可以學(xué)習(xí)解決新任務(wù)和新挑戰(zhàn)的系統(tǒng),同時還要繼續(xù)保留他們已經(jīng)學(xué)到的技能。而我們所做的研究就是朝這個方向所做的一個有意義的摸索。"

倫敦大學(xué)學(xué)院Gatsby計(jì)算神經(jīng)科學(xué)科主任PeterDayan也十分稱贊這項(xiàng)研究工作。他說,計(jì)算機(jī)如果實(shí)現(xiàn)通用型人工智能就意味著,它已經(jīng)可以做到將不同任務(wù)進(jìn)行關(guān)聯(lián),充分利用已掌握的技能來解決新的問題。

但質(zhì)疑的聲音自然也是存在的。英國西部大學(xué)布里斯托機(jī)器人實(shí)驗(yàn)室的AlanWinfield說,這項(xiàng)研究的確很好,但它顯然沒有做到更接近通用人工智能。至少,DeepMind的專家們沒有透露學(xué)習(xí)能力的遷移是如何具體操作的,我們到底能不能直接運(yùn)用它也都還沒有定論。

更多資訊請關(guān)注工業(yè)機(jī)器人頻道

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0