变形金刚3国语版,武则天a级片

北京時間10月19日凌晨，谷歌旗下的人工智能公司DeepMind在世界頂級科學雜志Nature雜志上宣布了AlphaGo的新進步，可以在沒有人類干預的情況下自我學習，新的AlphaGoZero在自我學習3天之后，就以100比0的成績戰(zhàn)勝了第一代AlphaGo。

自我學習能力的出現(xiàn)，對于人工智能和機器學習來說，是一個新的突破?！斑^去人們普遍認為機器學習是基于海量的大數據，但是從AlphaGoZero身上，我們發(fā)現(xiàn)算法比數據更重要?！盇lphaGo項目的主要負責人戴維·席爾瓦(DavidSilver)說道。

也由于使用了更多的算法和更少的數據，所以AlphaGoZero只使用了一臺計算機器和4個TPU，被它打敗的一代AlphaGo則用到多臺機器和48個TPU。

當人們驚訝于AlphaGoZero在圍棋領域的神級水平時，對于DeepMind團隊來說，這才只是剛剛開始，他們的目的是通過培養(yǎng)自主學習的能力，來解決更多其他領域目前無法解決的棘手問題。

從AlphaGo、AlphaGoMaster到AlphaGoZero

AlphaGo于2015年10月面世，在廣為人知的與棋手李世石對弈之前，它已經打敗了歐洲圍棋冠軍樊麾。樊麾接受《財經》記者采訪時表示，當時在他看來，一個計算程序要打敗職業(yè)棋手是不可能的事情。

結果他以0-5輸給了AlphaGo，但他也因此加入了DeepMind團隊，幫助訓練AlphaGo。2016年3月，在他幫助訓練下的AlphaGo以4-1的成績打敗了人類頂尖棋手李世石。2017年初，AlphaGo化名為“Master”，在網絡上挑戰(zhàn)60名人類棋手，保持全勝的成績。2017年5月，在烏鎮(zhèn)的，名為Master的第二代AlphaGo以3-0戰(zhàn)勝了目前人類最強棋手柯潔。

今年5月的比賽期間，DeepMind的多位高管就已經向《財經》記者透露，Master已經實現(xiàn)了自我學習能力，甚至有了自己的“直覺”，“我們發(fā)現(xiàn)AlphaGo已經不需要依賴人類訓練師了?！贝骶S·席爾瓦告訴《財經》記者。

與柯潔的對弈中，AlphaGo已經能下出很多人類棋手完全無法想象的路數，比賽后柯潔表示，第一代的AlphaGo還能找到破綻，Master已經實現(xiàn)了“從人到神”的飛躍。

而AlphaGoZero在“獨立”上更進一步，在訓練的過程中，它是自我對弈。從訓練圖上可以看出，由于一開始并不熟悉圍棋，對弈雙方的水平都很弱，但是隨著時間的推進，在短短3天互相博弈490萬局后，越來越強，實現(xiàn)了圍棋水平的突破。

△AlphaGo訓練的72小時圖譜

人類頂尖棋手柯潔被認為是圍棋天才，6歲開始學棋，17歲時在世界范圍內排名第一，一個人類天才十幾年的學習，被AlphaZero用3天時間超越。

但DeepMind團隊志不在此，“AlphaGo的意義不在于打敗人類，而是領悟知識，解決更多的問題?！贝骶S·席爾瓦表示。

商業(yè)化加速：1/4精力用于商業(yè)變現(xiàn)

今年5月，DeepMind創(chuàng)始人杰米斯·哈薩比斯在接受《財經》記者采訪時表示：“如果說谷歌是火箭，DeepMind就是燃料?！?/p>

在此定位之下，AlphaGo雖然進化神速，但絕對不會止步于圍棋。

這家公司一開始只是一家位于英國倫敦的人工智能實驗室，研究方向是開發(fā)通用自我學習算法。2011年，哈薩比斯在埃隆·馬斯克等人的投資下，成立了DeepMind。2014年，谷歌以4億英鎊(約6.5億美元)的價格收購該公司，當時這家公司只有50名員工。AlphaGo就來自于這家公司。

AlphaGo戰(zhàn)勝韓國第一棋手李世石引爆了AI技術和市場，也讓DeepMind在谷歌AI戰(zhàn)略中地位舉足輕重。

不過，DeepMind團隊從一開始研發(fā)AlphaGo系統(tǒng)的目的就是能實現(xiàn)行業(yè)應用，并帶來商業(yè)價值。圍棋為AlphaGo帶來了光環(huán)，卻并非最終目標。

哈薩比斯對《財經》記者說，“下一階段，DeepMind整個團隊75%的精力用于人工智能技術的研發(fā)，另外25%精力放在行業(yè)應用上?！?/p>

具體分工上，哈薩比斯繼續(xù)主導技術研究，另一位創(chuàng)始人穆斯塔法·蘇萊曼則負責主導商業(yè)化。

穆斯塔法認為，繼續(xù)技術研究和商業(yè)化是一種平衡?！拔覀兪掷镉泻芏鄬嶒炇依锏男录夹g，都是寶貴的資源，而這些技術的商用不僅能造福社會，一家公司也必須有可持續(xù)的商業(yè)利潤來源?！彼嬖V《財經》記者。

據他介紹，目前DeepMind由兩個團隊組成，哈薩比斯負責研發(fā)團隊，而他負責技術應用業(yè)務。技術應用團隊又再分為三個組，一個組服務谷歌的產業(yè)和谷歌的其他業(yè)務部門;第二個是醫(yī)療組，已經與英國的國家醫(yī)療健康局合作;第三個組是能源組，目前還在啟動階段。

“這樣的分組是為了方便與不同領域的專家更好地合作?！彼f。

此前，DeepMind已經牛刀小試，成功利用機器學習為谷歌大幅度節(jié)約電量，帶來實際收益。

2016年，DeepMind團隊就利用AlphaGo的學習能力，不斷模擬探索更加省電的方案。DeepMind接管了谷歌數據中心的一些控制單元，包括風扇、空調、窗戶和服務器等，通過機器學習，幫助谷歌數據中心的冷卻系統(tǒng)節(jié)約用電40%，并提高了15%的能源使用效率。

哈薩比斯對《財經》記者說：“谷歌在數據中心設備上的用電太多，幾個百分點就意味著每年幾百萬美元，節(jié)約電力的算法每分鐘都在給公司省一大筆錢。”

這個算法團隊的開發(fā)團隊僅有5、6個人，耗時僅兩三個月。

目前，DeepMind的部分研發(fā)項目已經開始用于能源基礎設施管理、醫(yī)療系統(tǒng)和潔凈水源的改進等方面，公司也已經從中獲得收益。

DeepMind也已開始進軍醫(yī)療市場并從中盈利。2015年11月，它與英國倫敦皇家自由醫(yī)院簽訂了為期五年的合同，任務是處理170萬名患者的醫(yī)療記錄。

在這次Nature雜志上發(fā)表的論文中，戴維·席爾瓦也強調了未來的行業(yè)應用，例如蛋白質折疊(用于破譯遺傳密碼)、能量節(jié)約以及新材料的研發(fā)等等。

在過去，機器學習未能得到廣泛應用，主要原因之一就在于很多人類無法解決的領域中，也缺少大量的數據樣本來讓機器進行學習，例如醫(yī)療圖像處理等。AlphaGoZero能夠擺脫人類的依賴，不需要人類給出數據和樣本，這為更廣泛的行業(yè)應用提供了新的可能性。

這與谷歌成立母公司Alphabet實現(xiàn)組織變身的目的一致。母公司Alphabet創(chuàng)立后，整個企業(yè)資產負債表開始分賬計算，業(yè)務被獨立出來，明確了職責和成績，提升創(chuàng)新效率。

一位資本市場分析人士向《財經》記者分析評價，如果一直在之前的架構中，DeepMind對谷歌的技術輸血價值難以清晰衡量，DeepMind也很難有一個明確、長期、符合谷歌戰(zhàn)略的研究目標。

更重要的一個原因是，資深科學家和強大的計算能力對AI業(yè)務的開展固然重要，但DeepMind走出去，獲取真實環(huán)境數據同樣重要，這些深入到行業(yè)的數據，比如醫(yī)療，恰恰是谷歌缺失的數據源。作為一家搜索、社交基因的互聯(lián)網公司，谷歌手中的巨量數據，多是開放社交屬性類數據。