谷歌與DeepMind:史上最強人工智能拉鋸戰(zhàn)

時間:2019-03-19

來源:獵云網(wǎng)

導語:AGI將高速地處理信息且高度智能,不斷自我改進的系統(tǒng)將急劇提升機器智能程度。但是AGI的未來難以預測,沒人知道這一切是好是壞。

AGI將高速地處理信息且高度智能,不斷自我改進的系統(tǒng)將急劇提升機器智能程度。但是AGI的未來難以預測,沒人知道這一切是好是壞。

2010年奇點峰會,DeepMind創(chuàng)始人DemisHassabis在會上發(fā)表了關于AGI的演講,演講題目是:建立AGI的系統(tǒng)神經(jīng)學方法。

AGI指通用人工智能,它是一種假設的計算機程序,可以和人類一樣執(zhí)行智能任務,甚至有希望超越人類。AGI將能夠完成離散的任務,比如識別照片或翻譯。此外,它將會加減運算、下棋、說法語,還能理解物理論文、撰寫小說、設計投資策略、與陌生人談話。它將能夠監(jiān)測核反應、管理電網(wǎng)和交通流量,它可以輕易地做任何事情。相比之下,目前最先進的AI在AGI面前看起來就簡單得像個便攜式計算器。

上述任務目前只能由人類完成。但是人類智力受到腦容量所限,更受人類渺小脆弱的身體限制。既然AGI在計算機上運行,它就不會受到這些機體條件限制,其智能水平只受處理器數(shù)量的影響。AGI可能會先從監(jiān)測核反應開始。但很快,它在一秒內(nèi)消化的物理論文數(shù)量比一個人在千年內(nèi)消化的還要多,并可以據(jù)此發(fā)現(xiàn)新能源。人類智慧,再加上計算機的速度和可擴展性,將解決目前看來無解的問題。Hassabis預計AGI將掌握各種學科,包括癌癥研究、氣候變化、能源、基因組學、宏觀經(jīng)濟、金融系統(tǒng)等等。

AGI將高速地處理信息且高度智能,不斷自我改進的系統(tǒng)將急劇提升機器智能程度。但是AGI的未來難以預測,沒人知道這一切是好是壞。

Hassabis解釋說,到目前為止,科學家們一直從兩個途徑發(fā)展AGI。第一個途徑是符號AI。研究人員試圖描述編寫一套完整的規(guī)則,使之能像人類一樣思考。這種方法在上世紀八九十年代很流行,但沒有達到預期的結果。Hassabis認為,人類大腦神經(jīng)結構太過微妙,編程模仿是做不到的。第二個途徑是以數(shù)字形式復制大腦的生物網(wǎng)絡。這聽起來似乎可行,畢竟大腦是人類智力的中心。但操作起來并不現(xiàn)實,因為這么做就好比繪制宇宙中每一顆恒星的地圖。最根本的問題在于,這種途徑是在錯位研究大腦功能。打個比方,這就像試圖通過打開計算機并檢查晶體管的交互來理解MicrosoftExcel是如何工作的。

Hassabis提出了中間立場:AGI應該從大腦處理信息的廣泛方法中汲取靈感,而不是在特定情況下應用生物系統(tǒng)或特定規(guī)則。換句話說,它應該專注于理解大腦的軟件運作,而不是大腦的硬件構成。功能性磁共振成像等新技術使人們能夠在大腦活動的同時觀察大腦內(nèi)部,因此理解“大腦的軟件運作”漸漸成為可能。最新研究表明,大腦通過在睡眠中重演經(jīng)驗來學習,從而得出一般原則。AI研究者應該模仿這種系統(tǒng)。

當年Hassabis參加奇點峰會最重要的目的是募資,DeepMind最終獲得200萬英鎊投資,其中著名風險投資人彼得·泰爾投資了140萬英鎊。谷歌在2014年1月以6億美元收購該公司時,Thiel和其他早期投資者的投資回報率高達5000%。

對許多創(chuàng)始人來說,這已經(jīng)算是一個完美的結局。但對Hassabis來說,被谷歌收購只是他追求AGI過程的一個步驟而已。2013年,他花費大量時間進行協(xié)議條款談判,目的在于保持DeepMind的獨立性。它可以獲得被谷歌收購的好處,比如獲得現(xiàn)金流和計算能力,但是創(chuàng)始人仍然保有對公司的控制權。

Hassabis認為DeepMind具備多種優(yōu)勢:擁有創(chuàng)企的動力、頂尖大學的優(yōu)異人才、大公司的財力支持??芍^萬事俱備,因此AGI的時代會加速到來,從而為人類造福。

天才游戲少年

DemisHassabis1976年出生于倫敦,他4歲開始下國際象棋,13歲時成為了世界上同年齡段中位列第二的棋手。8歲在老式電腦上自學編程。1992年提前兩年完成高中課程。他在BullfrogProductions找到一份電子游戲編程的工作,編寫的虛擬游戲ThemePark大賣1500萬張拷貝。

十幾歲的時候,Hassabis同時參加國際象棋、拼字游戲、撲克和西洋雙陸棋的比賽。1995年,在劍橋大學學習計算機科學時,又參加了學生圍棋錦標賽且成績出色。下棋激發(fā)了Hassabis對人工智能的興趣。當他下棋時也在思考,計算機是否也可以像人類一樣通過經(jīng)驗積累不斷學習。游戲提供了脫離現(xiàn)實的完美學習環(huán)境。游戲世界純粹又包容,玩游戲不會受到干擾而且可以迅速掌握。

先搞定智能,其它問題就能迎刃而解

1997年5月,IBM超級計算機DeepBlue擊敗了國際象棋世界冠軍GarryKasparov。這是計算機首次擊敗一位大師級棋手。這場比賽受到廣泛關注,也引起了人們對計算機不斷增長的力量和潛在威脅的擔憂。當時Hassabis產(chǎn)生了一個想法,他要把戰(zhàn)略游戲和AI結合起來,有一天,他會建立一個計算機程序,打敗最高段位的人類圍棋手。

Hassabis有條不紊地規(guī)劃職業(yè)生涯。1998年,他創(chuàng)辦了自己的游戲工作室Elixir,專注開發(fā)一款復雜的模擬政治游戲Republic:TheRevolution。還在學校時,Hassabis就有這樣的想法:通過超級計算機來模擬復雜的世界動態(tài),以解決最棘手的社會問題。當時,他試著在游戲中實踐自己的想法。不過現(xiàn)實很骨感,Elixir最終發(fā)布了精簡版的游戲但是反響平平。其它游戲也沒有成功。2005年4月,Hassabis關閉了Elixir。有人認為Hassabis創(chuàng)立Elixir只是為了獲得管理經(jīng)驗?,F(xiàn)在,在正式踏上AGI之路以前,他只缺少一個關鍵的知識領域——了解人類的大腦。

2005年,Hassabis在倫敦大學學院開始攻讀神經(jīng)科學博士學位。他發(fā)表的關于記憶和想象力的研究很有影響力。一篇被引用上千次的論文顯示,患有健忘癥的人也很難想象新的體驗,這表明記憶和創(chuàng)造大腦圖像之間存在聯(lián)系。Hassabis所作的研究都是朝著AGI邁進。他大部分研究都回歸一個問題:人腦是如何獲得并保留概念和知識的?

2010年11月15日,Hassabis正式成立DeepMind。從那時起,公司的宗旨就一直沒有變過:先搞定智能,其它問題就能迎刃而解。也就是說,把大腦如何完成任務的理解轉化為計算機軟件,軟件可以使用相同的方法進行自我學習。

Hassabis并沒有假裝科學已經(jīng)完全理解了人類的思想。AGI的藍圖不能簡單地從數(shù)百項神經(jīng)科學研究中得出。我們對大腦的功能仍然知之甚少。2018年,Hassabis自己的博士研究結果甚至受到了澳大利亞研究團隊的質(zhì)疑。所以DeepMind的起步工作還是很艱難。

Suleyman和ShaneLegg加入了公司聯(lián)合創(chuàng)始人的行列。公司位于倫敦,許多新員工來自歐洲,有效避開了和谷歌、Facebook等硅谷巨頭爭奪人才。也許DeepMind成功秘訣之一就在于留住了最優(yōu)秀的員工。

公司花大力氣發(fā)展的一種機器學習技術——強化學習,源于Hassabis所擅長了兩個領域:游戲和神經(jīng)科學。建立這樣一個程序是為了收集有關其環(huán)境的信息,然后通過重復經(jīng)驗來從中學習,就像Hassabis所說的“睡眠期間大腦活動”一樣。

在此之前,強化學習在計算機領域還是一片空白。程序顯示了一個虛擬環(huán)境,除了游戲規(guī)則,它什么也不知道。程序包含至少一個稱為神經(jīng)網(wǎng)絡的組件。由計算結構層組成,可篩選信息,目的是識別特定特征或策略。每一層都在不同的抽象層次上檢查環(huán)境。起初,這些網(wǎng)絡的成功率很低。當他們嘗試不同的策略時,變得越來越老練,當成功時,也會得到獎勵。程序不會再次范同樣的錯誤。AI神奇的地方就在于它重復任務的速度。

DeepMind的AI項目在2016年獲得重大勝利,當年,AlphaGo在首爾舉行的五局三勝比賽中擊敗圍棋世界冠軍,震驚世人。2.8億人見證了AlphaGo的勝利,有專家曾預測人機對戰(zhàn)機器取勝還需要十年時間。次年,升級版AlphaGo擊敗了中國圍棋冠軍。

人類智慧將被人工智能超越嗎?

就像1997年的DeepBlue一樣,AlphaGo改變了人們對人類成就的看法。人類冠軍無疑擁有地球上最聰明的頭腦,可是他們已經(jīng)被AI超越。近20年后,Hassabis實現(xiàn)了自己當年的野心,他說這場比賽讓他熱淚盈眶。

當年DeepBlue殺伐決斷,通過快速計算贏得了勝利,但是AlphaGo的風格看起來卻很有藝術氣質(zhì),幾乎是人類的風格。它的優(yōu)雅、復雜以及卓越的計算能力,似乎表明,在治療疾病和管理城市等領域,DeepMind將比競爭對手走得更遠。

DeepMind控制權之爭

Hassabis一直說,DeepMind將使世界變得更好。但AGI存在不確定性。如果它真的出現(xiàn),我們不知道它是善是惡,也不知道它是否會服從于人類控制。即便它聽從人類控制,那這個人類舵手又會是誰呢?

從一開始,Hassabis就試圖保護DeepMind的獨立性。他一直堅持讓DeepMind留在倫敦。Hassabis不愿交出自己一手帶大的公司。因此DeepMind制定了一項協(xié)議,阻止谷歌單方面控制該公司的知識產(chǎn)權。據(jù)知情人士透露,在收購前一年,雙方簽署了《道德與安全審查協(xié)議》。該協(xié)議將DeepMind的核心AGI技術的控制權交給了一個名為EthicsBoard的委員會。EthicsBoard為DeepMind提供了堅實的法律支持,以保持對其最有價值、也可能是最危險的技術的控制。小組成員的名字尚未公布,但據(jù)消息人士透露,DeepMind的三位創(chuàng)始人都是EthicsBoard成員。

此外DeepMind在市場公關方面表現(xiàn)極好。AlphaGo就是典型的例子。自谷歌被收購以來,DeepMind多次創(chuàng)造了舉世矚目的奇跡。比如,一個軟件可以在眼睛掃描中發(fā)現(xiàn)黃斑病變。另一個程序使用與AlphaGo類似的架構從無到有地學會了下棋,僅僅花費九個小時。2018年12月,一個名為AlphaFold的程序被證明可以從復合物列表中預測蛋白質(zhì)的三維結構,其準確率高于同行競爭對手,這有助于治療帕金森病和阿爾茨海默癥等疾病。

谷歌數(shù)據(jù)中心預計包含250萬臺服務器,DeepMind開發(fā)了一套算法,以優(yōu)化谷歌數(shù)據(jù)中心冷卻方案,DeepMind深以為傲,因為谷歌因此降低了40%的能源成本。谷歌母公司Alphabet為這類服務付給DeepMind豐厚的報酬。2017年,DeepMind向Alphabet收取了5400萬英鎊。但與DeepMind的日常管理費用相比,這一數(shù)字顯得微不足道。那一年僅在DeepMind員工身上就花了2億英鎊??傮w而言,公司在2017年支出2.82億英鎊。

谷歌收購DeepMind五年后,控制權之爭不可避免。考慮到Hassabis對事業(yè)的執(zhí)著,他不太可能離開公司。他對金錢感興趣只是因為錢能幫助他完成事業(yè)追求。到目前為止,谷歌對DeepMind的干預還不大。但最近發(fā)生的一件事卻引發(fā)了對公司未來獨立性的擔憂。

2016年2月,DeepMind成立了新醫(yī)療保健部門DeepMindHealth,由公司聯(lián)合創(chuàng)始人之一的MustafaSuleyman領導。公司希望創(chuàng)建Streams項目,當病人的健康狀況惡化時,可以向醫(yī)生發(fā)出警告。DeepMind將獲得基于績效的費用。由于這項工作需要獲得有關病人的敏感信息,Suleyman建立了一個獨立的審查小組(IRP)。

2018年11月8日,谷歌宣布成立自己的醫(yī)療保健部門GoogleHealth。五天后,公司宣布將把DeepMindHealth并入母公司相關部門。Suleyman曾在2016年寫道:“在任何階段,患者數(shù)據(jù)都不會與谷歌賬戶、產(chǎn)品或服務相關聯(lián)?!钡某兄Z似乎已經(jīng)落空。不過DeepMind還是說:“在這個階段,我們的合同都沒有轉到谷歌,只有得到合作伙伴的同意,才會轉去谷歌?!焙喜⒓づ薉eepMindHealth的員工。據(jù)消息人士說,一旦合并完成,就會有更多員工計劃離職。據(jù)多名知情人士透露,有員工于2017年12月辭職,原因是擔心合并后該獨立審查小組更多的是為了裝門面,而不會對病人隱私數(shù)據(jù)使用情況進行真正的監(jiān)督。

這一事件表明,DeepMind的非核心業(yè)務容易受到谷歌的左右。DeepMind在一份聲明中對此次合并給出了正面評價。但是我們不禁要問,谷歌是否會將同樣的邏輯應用于DeepMind在AGI方面的工作。

強化學習

總體上來說DeepMind進步明顯。它的軟件可以模擬甚至超越人類學習執(zhí)行任務。比如打磚塊游戲。沒有人類指導,DeepMind的程序不僅學會了玩這個游戲,而且還學會了如何把球打進磚塊后面的空間,利用球回彈來打更多的磚塊。Hassabis說,這證明了強化學習的力量和DeepMind計算程序的非凡能力。

這個游戲演示令人印象深刻,但有個問題。如果虛擬球拍移動得更高一些,程序就會失敗。AI項目所掌握的技能非常有限,即使對環(huán)境的微小變化也無法做出反應,除非接受數(shù)千輪強化學習?,F(xiàn)實世界的變化太多了。對于智能診斷來說,沒有兩個身體器官是完全相同的。對于智能機械,沒有兩個引擎可以用相同的方式調(diào)整。因此,將虛擬空間中完善的程序投放到現(xiàn)實世界困難重重。

另外一個問題是,虛擬環(huán)境中的成功取決于獎勵機制:一個允許軟件衡量其進程的信號。程序了解到物體從墻上回彈會加分。AlphaGo很多編程工作都是在構建與復雜游戲兼容的獎勵函數(shù)。不幸的是,現(xiàn)實世界并不提供這種簡單的獎勵。政治因素使問題更加復雜化。要協(xié)調(diào)氣候健康的獎勵信號(單位體積二氧化碳粒子數(shù))與石油公司的獎勵信號(股價),牽涉到許多動機矛盾的各方。獎勵信號往往非常微弱。而人腦在執(zhí)行任務的過程中不會去想有沒有獎勵的問題。

DeepMind通過大量計算機電力找到了解決方法。公司最近專注于策略電腦游戲星際爭霸II,游戲早期所做的決定對后來會產(chǎn)生影響,這更接近于現(xiàn)實世界任務所特有的那種復雜而延遲的反饋。今年1月,DeepMind軟件擊敗了一些頂級人類玩家,給人留下了深刻印象。它的程序也已經(jīng)開始學習經(jīng)由人類反饋的獎勵功能。不過,把人類指令置于計算循環(huán)中,比起純粹的計算機處理,其計算規(guī)模和速度都會受到影響。

公司研究人員匿名表示,他們也對DeepMind能否通過這些方法達到AGI表示懷疑,專注于在模擬環(huán)境中實現(xiàn)高性能,這使得獎勵信號問題很難解決。然而,這種方法又是DeepMind的核心。

Hassabis的人生一直在和游戲打交道。就像公司的軟件一樣,Hassabis只能從以往的經(jīng)驗中學習。在發(fā)明了一些有用的醫(yī)療技術,并超越了世界上最偉大的棋類游戲玩家之后,對AGI的追求最終還是可能會失敗。公司取得的成績斐然,卻不是Hassabis最終想要的。他仍然可以開創(chuàng)AGI的時代,就在谷歌的眼皮底下,但卻超出了它的控制范圍。如果這樣做,Hassabis將贏得最艱難的比賽。

聲明:本文為轉載類文章,如涉及版權問題,請及時聯(lián)系我們刪除(QQ: 2737591964,不便之處,敬請諒解!

中傳動網(wǎng)版權與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0