AlphaGo之父:解析人工智能發(fā)展里程碑意義

時間:2017-04-24

來源:網(wǎng)絡轉(zhuǎn)載

導語:谷歌旗下人工智能研究部門DeepMind聯(lián)合創(chuàng)始人兼CEO德米斯·哈薩比斯(DemisHassabis)近日在英國《金融時報》上撰文,

谷歌旗下人工智能研究部門DeepMind聯(lián)合創(chuàng)始人兼CEO德米斯·哈薩比斯(DemisHassabis)近日在英國《金融時報》上撰文,全面闡述了人工智能如何幫助人類在理解未知世界方面取得當前難以想象的飛躍。

現(xiàn)代文明是一個神奇的壯舉,一個可由科學實現(xiàn)的壯舉。每次乘飛機的時候,我都驚訝于使我們能夠翱翔在云層之上的技術(shù)——這種技術(shù)使得乘飛機旅行成為家常便飯。我們已經(jīng)繪制了基因組圖譜,開發(fā)了超級計算機和互聯(lián)網(wǎng),向彗星發(fā)射了探測器,在粒子加速器中以接近于光速的速度擊碎了原子,并實現(xiàn)了人類登陸月球的偉業(yè)。我們是如何做到這一切的呢?當一個人開始去思考我們的大腦所能實現(xiàn)的成就時,這確實是一件了不起的事情。

科學方法可能是人類所擁有的最強大的一個創(chuàng)意,而啟蒙運動以來的進步更是驚人。但是,我們目前正處于一個關(guān)鍵時刻,我們需要掌握的許多系統(tǒng)都極為復雜——從氣候變化、宏觀經(jīng)濟問題到阿爾茨海默式病。我們能否解決這些挑戰(zhàn)以及我們解決此類挑戰(zhàn)的速度,將會影響未來數(shù)十億人的福祉及我們所生活的環(huán)境。

問題恰恰在于,這些挑戰(zhàn)非常復雜,即使是世界頂尖的科學家、臨床醫(yī)師和工程師,也很難領(lǐng)悟取得這些突破所需要的一切復雜性。據(jù)說,萊昂納多·達芬奇(LeonardodaVinci)也許是他那個年代最后一個完全明白知識廣度的人。從那以后,我們不得不擁有某種專長,而今天,即使是天體物理學或量子力學等單一領(lǐng)域的知識,也需要一個人傾注畢生精力才能完全掌握。

我們現(xiàn)在想要理解的那些系統(tǒng)是以大量數(shù)據(jù)為支撐——通常是高度動態(tài)、非線性、具有突現(xiàn)屬性的數(shù)據(jù),使得我們難以從中找到某種結(jié)構(gòu)和連接,揭示其中隱藏的奧秘。開普勒和牛頓可以通過方程式來描述地球上行星和物體的運動,但當今的問題極少可以簡化成一套簡潔而緊湊的公式。

最艱巨的科學任務之一

這恰恰是我們這個時代所面臨的最大科學挑戰(zhàn)之一。阿蘭·圖靈(AlanTuring)、約翰·馮·諾依曼(JohnvonNeumann)、克勞德·香農(nóng)(ClaudeShannon)等現(xiàn)代計算機時代的奠基人,都明白信息理論的核心重要性,而今天我們已經(jīng)意識到,幾乎所有的東西都可以在這種模式下進行思考或表達出來。這一點在生物信息學領(lǐng)域體現(xiàn)地最為明顯——在那個領(lǐng)域,基因組實際上就是一個巨大的信息編碼模式。我相信有朝一日,信息將被視為與能源和物質(zhì)同等重要的東西。

智能的核心在于,它可以被視為一個將非結(jié)構(gòu)化信息轉(zhuǎn)化為有用且可操作知識的過程。作為一個我傾注畢生精力所從事的研究項目,人工智能的科學承諾是,我們可以綜合、自動化和優(yōu)化這一過程,進而以技術(shù)為工具,幫助我們在一些領(lǐng)域快速獲得新知識——對人類來說,這些領(lǐng)域目前仍然令人不堪重負。

今天,從事人工智能研究成了一件非常時髦的事情。然而,人工智能一詞可能意味著無數(shù)取決于語境的事情。在我參與創(chuàng)辦的公司DeepMind,我們所采取的方法側(cè)重于學習和普遍性概念,目的是開發(fā)我們可用于科學研究的人工智能。如果我們想要電腦去發(fā)現(xiàn)新知識,那么我們就必須讓它們真正掌握自學能力。

我們開發(fā)的算法可以學習如何直接從原始經(jīng)驗中掌握任務,這意味著它們所獲得的知識最終是基于某種形式的感官現(xiàn)實而不是抽象符號。我們進一步要求它們必須感覺到,具有相同參數(shù)的相同系統(tǒng)可以在一系列任務中表現(xiàn)良好。

DeepMind曾在2015年《自然》雜志上闡述了這兩個原則,并稱一個計算機程序通過“自學成才”,可以玩幾十種經(jīng)典Atari游戲,這種游戲除了屏幕上的像素和得分外,不需要其他任何形式的信息輸入。我們還使用系統(tǒng)級神經(jīng)科學作為新算法和結(jié)構(gòu)思想的主要靈感來源。畢竟,大腦才是我們唯一存在的證據(jù),證明基于體驗的通用型學習系統(tǒng)是可以實現(xiàn)的。

人工智能發(fā)展史上的里程碑

這與我們許多前輩的做法完全背道而馳。通過比較在游戲領(lǐng)域取得世界第一的兩項突破性研究,或許最能體現(xiàn)出這種差異:IBM的“深藍”(DeepBlue)超級計算機(1997年擊敗了世界象棋冠軍加里·卡斯帕羅夫),以及我們最近的AlphaGo計劃(去年在世界最復雜的游戲圍棋比賽中擊敗了世界冠軍李世石)。

“深藍”使用了所謂的“專家系統(tǒng)”(expertsystems)方法:一個程序開發(fā)團隊與幾位國際象棋大師坐下來商討,如何將他們的知識明確地提煉出來并編寫成一套復雜的試探程序。接著,超級計算機就使用這些規(guī)則來評估海量的潛在變量,盡全力計算出正確的方法。

“深藍”戰(zhàn)勝卡斯帕羅夫是人工智能發(fā)展歷史上的一個重大里程碑。但是,這場勝利只是更多地證明了IBM開發(fā)團隊和國際象棋大師的聰明才智以及當代硬件的計算能力,而不是程序本身的任何內(nèi)在智能。在國際象棋大師卡斯帕羅夫被擊敗后,圍棋成為人工智能研究的“新圣杯”。

圍棋具有大約3000年的歷史,在亞洲具有深遠的文化影響,不僅被認為是游戲,還是一種藝術(shù)形式,其職業(yè)冠軍是公眾崇拜的偶像。圍棋的潛在下法數(shù)量達到10的171次方,超過了可觀測宇宙范圍內(nèi)的原子總數(shù),即10的80次方,因此即使窮盡整個宇宙的物質(zhì)也不能存下圍棋的所有可能性。人類頂尖圍棋選手往往通過直覺和本能來處理這種巨大的復雜性,而國際象棋棋手則更依賴于精確計算。

至于AlphaGo,我們意識到為了捕捉圍棋的這種直覺,我們必須采取與“深藍”等國際象棋程序截然不同的方法。我們使用包括深層神經(jīng)網(wǎng)絡在內(nèi)的通用技術(shù)來構(gòu)建學習系統(tǒng),而不是手工編碼的人類專家策略,并向其展示了數(shù)千個功能強大的業(yè)余游戲,以幫助它形成自己對于人類游戲玩法合理性的理解。

然后,我們用不同版本的系統(tǒng)玩了數(shù)千次游戲,每次從錯誤中不斷學習并逐漸改進,直到系統(tǒng)變得異常強大。2016年3月,我們做好了進行終極挑戰(zhàn)的準備:與世界頂尖圍棋棋手李世石(LeeSe-dol)對決,此人獲得過18個世界圍棋比賽冠軍,被廣泛認為是過去十年最偉大的圍棋選手。

人工智能對科學發(fā)展的益處

超過2億人在線觀看了這場對決,最終AlphaGo以四比一戰(zhàn)勝李世石,專家們對此的一致意見是,這一突破比預期時間提前了十年。更為重要的是,在比賽期間,AlphaGo下出很多創(chuàng)造性的絕招。令人驚訝的是,其中一種下法顛覆了數(shù)百年來的智慧結(jié)晶,并從此被棋手們深入研究。在獲勝的過程中,AlphaGo向全世界傳授了這項可能是歷史上最受關(guān)注的游戲的全新知識。

這些算法獲得靈感的瞬間讓我們終于明白人工智能為何對科學如此有益:機器輔助科學發(fā)現(xiàn)的可能性。我們相信,AlphaGo的基礎技術(shù)是通用的,可以被廣泛應用于其他一系列領(lǐng)域,特別是可以優(yōu)化的、具有明確目標功能的領(lǐng)域,以及可以精確模擬的環(huán)境中,從而實現(xiàn)高效的高速實驗。

例如,在能源效率方面,我們使用這些算法的一個版本,就發(fā)明了一套能將谷歌數(shù)據(jù)中心能耗降低40%的新技術(shù),我們現(xiàn)在正在谷歌所有數(shù)據(jù)中心推廣這種新技術(shù),希望最終能實現(xiàn)巨大的成本節(jié)約,并為環(huán)境做出巨大的貢獻。

我們認為,在接下來的幾年間,科學家和研究人員使用類似的方法,將會給人在超導材料設計到藥物發(fā)現(xiàn)等多個領(lǐng)域產(chǎn)生深刻見解。在許多方面,我看到人工智能就好比是“哈勃”太空望遠鏡,后者是一種科學工具,可以讓我們看得更遠,更好地了解宇宙。

加深對人類自身的了解

當然,像任何強大的技術(shù)一樣,人工智能也必須以負責任、有道德的方式進行使用,使每個人都從中受益。我們還必須明確認識到人工智能算法的實用性和局限性。但是,由于對人工智能的密切關(guān)注,加上對相關(guān)數(shù)據(jù)質(zhì)量影響的更多研究,我們終有一天會發(fā)現(xiàn),人工智能通過發(fā)現(xiàn)可逃過人眼的模式和來源,在支持各類專家的工作方面發(fā)揮至關(guān)重要的作用。

正是科學家與算法之間的這種合作,將決定著未來幾十年里科學進步的具體成就。我相信,人工智能將成為科學家可以部署的解決方案,進而提升我們的日常生活質(zhì)量,使得我們所有人都能更快、更高效地工作。如果我們可以廣泛、適度地部署這些工具,創(chuàng)造一種生機勃勃的環(huán)境,讓每個人都能參與并從中受益,那么我們就有機會豐富和推進人類的整體發(fā)展。

在此過程中,我們可能還會學到一些關(guān)于我們自己的東西。我一直覺得物理和神經(jīng)科學在某種程度上是最根本的學科:一個與外部世界有關(guān),另一個與我們頭腦中的內(nèi)部世界有關(guān)。因此,兩者之間涵蓋一切東西。人工智能可以幫助我們更好地理解這兩個學科。當我們發(fā)現(xiàn)了更多有關(guān)學習過程本身的事情,并將其與人類大腦進行比較時,我們有一天就可以更好地了解使人類獨一無二的東西,比如揭示思維中一些長期未解的謎團,如夢想、創(chuàng)造力、甚至是意識。

如果人工智能不僅可以幫助我們整個社會拯救環(huán)境、治愈疾病和探索宇宙,還能更好地了解我們自己,這也許最終會成為人類獲得的最偉大的發(fā)現(xiàn)之一。

更多資訊請關(guān)注工業(yè)機器人頻道

中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0