人工智能轉(zhuǎn)戰(zhàn)德州撲克人類冠軍 20萬美金花落誰家?

時(shí)間:2017-01-12

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:本周晚些時(shí)候,由卡耐基梅隆大學(xué)(CMU)開發(fā)的“Libratus”人工智能(AI)系統(tǒng)將開始一場(chǎng)新的挑戰(zhàn)

本周晚些時(shí)候,由卡耐基梅隆大學(xué)(CMU)開發(fā)的“Libratus”人工智能(AI)系統(tǒng)將開始一場(chǎng)新的挑戰(zhàn):試圖在一對(duì)一、無限制投注的“無限注德州撲克”(No-LimitTexasHold'em)比賽中挑戰(zhàn)人類頂級(jí)職業(yè)玩家,獲勝者將獲得20萬美元的獎(jiǎng)金。

卡耐基梅隆大學(xué)研究人員表示,希望Libratus最終能夠贏得比賽,這樣他們就可以首次向全世界宣布:人工智能又攻克了德州撲克,首次戰(zhàn)勝人類冠軍。但同時(shí),卡耐基梅隆大學(xué)的競(jìng)爭(zhēng)對(duì)手又表示不服。

加拿大阿爾伯塔大學(xué)、捷克布拉格查理大學(xué)和捷克理工大學(xué)的研究者近日聯(lián)合發(fā)表論文稱,其所研發(fā)的人工智能系統(tǒng)已經(jīng)在德州撲克比賽中達(dá)到了專家級(jí)水平。因此,他們的人工智能系統(tǒng)才是第一個(gè)戰(zhàn)勝人類的。

需要指出的是,該論文尚未經(jīng)過“同行評(píng)議”,因此目前尚不可盡信。但基于這支團(tuán)隊(duì)的歷史成就,他們聲稱的結(jié)果絕非空穴來風(fēng)。

2008年,幾乎由同一批研究人員組成的一個(gè)團(tuán)隊(duì)開發(fā)了出了一套系統(tǒng),首次在有投注限制的“有限注德州撲克”(LimitTexasHold'em)比賽中戰(zhàn)勝人類高手。2015年,該團(tuán)隊(duì)又完成了對(duì)該系統(tǒng)的升級(jí),并稱已接近完美。

阿爾伯塔大學(xué)研究人員在論文中稱,他們開發(fā)的這套系統(tǒng)使用了一種名為“DeepStack”的通用算法,近期在“一對(duì)一無限注德州撲克”(Heads-upNo-LimitTexasHold'em)比賽中戰(zhàn)勝了人類。

2016年11月7日至12月12日,DeepStack共與33位人類選手在互聯(lián)網(wǎng)上進(jìn)行了44852手較量。比賽結(jié)果顯示,DeepStack的平均贏率為492mbb/g。DeepStack團(tuán)隊(duì)稱,一般人類玩家到50mbb/g就被認(rèn)為擁有較大優(yōu)勢(shì),而750mbb/g就是對(duì)手每局都棄牌的贏率。

但是,幫助卡耐基梅隆大學(xué)設(shè)計(jì)Libratus人工智能系統(tǒng)的托馬斯·桑德霍姆(TuomasSandholm)教授稱:“DeepStack并未戰(zhàn)勝頂尖高手,因此還不能說它已經(jīng)戰(zhàn)勝了人類?!?/P>

桑德霍姆還稱:“我們兩年前已經(jīng)達(dá)到他們的水平了,但那不是我們的目標(biāo)。我們的目標(biāo)從來就不是‘專家級(jí)’,而是‘超人水平’,就像‘深藍(lán)’和‘沃森’那樣?!?/P>

到目前為止,無論是在“有限注德州撲克”,還是“無限注德州撲克”比賽中,人工智能系統(tǒng)只能應(yīng)對(duì)“一對(duì)一”的比賽。而在多人(五人或更多)同時(shí)比賽中,其復(fù)雜性仍是人工智能目前所難以應(yīng)付的。但不管怎樣,這些比賽結(jié)果表明,至少有兩套人工智能系統(tǒng)又要?jiǎng)?chuàng)造新的里程碑。

DeepStack研究人員稱,德州撲克是一種典型的非完整信息游戲,因?yàn)槟悴恢栏?jìng)爭(zhēng)對(duì)手的牌,也不知道下一手牌是什么。因此,對(duì)于人工智能而言,其復(fù)雜性要超過象棋。而DeepStack是一種可用于一個(gè)很大類別的序列非完整信息博弈的通用算法,它所取得的成績(jī)表明,人工智能系統(tǒng)已經(jīng)精通非完整信息游戲。

與谷歌(微博)的AlphaGo一樣,Libratus和DeepStack并不試圖解決整個(gè)比賽的所有問題,因?yàn)檫@需要考慮到太多的可能性。相反,這兩套人工智能系統(tǒng)利用深度學(xué)習(xí)來培養(yǎng)一種直覺。DeepStack研究人員稱:“在比賽之前,DeepStack不會(huì)計(jì)算和存儲(chǔ)完整的戰(zhàn)略,而是使用一種快速的‘近似估算’法,我們稱之為‘直覺’?!?/P>

如果人工智能這一次能在德州撲克比賽中能戰(zhàn)勝人類高手,則意味著研究人員可以利用這套技術(shù)來解決日常生活中的一些實(shí)際問題,尤其是涉及到非完整信息的一些問題,如商務(wù)談判。在談判中,雙方都會(huì)隱藏一些信息。

參與Libratus研發(fā)的卡耐基梅隆大學(xué)博士生諾姆·布朗(NoamBrown)稱:“在現(xiàn)實(shí)世界中,信息不可能像棋盤上的棋子那樣整潔有序,總有一些重要信息被丟失或隱藏,而人工智能需要有能力來處理這個(gè)問題?!?/P>

更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0