深化學(xué)習(xí)人工智能領(lǐng)域最熱門方向

時間:2018-01-19

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:深度強(qiáng)化學(xué)習(xí)就是用具有感知能力的深度學(xué)習(xí)自動提取網(wǎng)絡(luò)動態(tài)場景的特征,然后通過具有決策能力的強(qiáng)化學(xué)習(xí)做出最優(yōu)決策。

先是撂倒人類圍棋界頂尖高手李世石、柯潔的“阿爾法狗”,接著又是零基礎(chǔ)自學(xué)成才、100比0擊敗“阿爾法狗”的“阿爾法元”。隨著“阿爾法狗”和“阿爾法元”的誕生,掀起了深度強(qiáng)化學(xué)習(xí)技術(shù)的一輪熱潮,該方向已成為人工智能領(lǐng)域最熱門的方向之一。作為2017-2019年度“中國計算機(jī)協(xié)會青年人才托舉工程”和天津市青年千人計劃專家入選者的天津大學(xué)軟件學(xué)院副教授郝建業(yè),就在深度強(qiáng)化學(xué)習(xí)領(lǐng)域碩果累累,先后主持參與過多項相關(guān)方面的國家及省部級科研項目,并致力于將那些宏偉的人工智能憧憬落實到實際的日常生活中去。

深度強(qiáng)化學(xué)習(xí)就是用具有感知能力的深度學(xué)習(xí)自動提取網(wǎng)絡(luò)動態(tài)場景的特征,然后通過具有決策能力的強(qiáng)化學(xué)習(xí)做出最優(yōu)決策。郝建業(yè)團(tuán)隊通過研究設(shè)計單個體及多個體(深度)強(qiáng)化學(xué)習(xí)及博弈算法和模型,提升智能體在復(fù)雜環(huán)境下學(xué)習(xí)到最優(yōu)決策的性能和效率。其研究成果主要應(yīng)用于自動談判、智能電網(wǎng)等領(lǐng)域。

在智能電網(wǎng)領(lǐng)域,郝建業(yè)團(tuán)隊同帝國理工大學(xué)合作,針對倫敦市歷年電量生產(chǎn)和消費數(shù)據(jù),設(shè)計了基于深度強(qiáng)化學(xué)習(xí)的電價定價策略,以最優(yōu)化電力市場收益。其研究方向獲得了國家自然科學(xué)基金、天津市自然科學(xué)基金、香港研究資助局基金、澳大利亞教育部獎學(xué)金等項目資助支持。其在電子商務(wù)自動談判領(lǐng)域的研究成果:《AbiNes:一種自適應(yīng)雙邊談判算法》曾獲得2012年度國際頂級自動談判比賽冠軍;其研究的“Mercury算法”曾獲得2015年度亞軍。目前其團(tuán)隊還同網(wǎng)易游戲開發(fā)部門合作,針對其游戲產(chǎn)品,通過深度強(qiáng)化學(xué)習(xí)算法共同研發(fā)高效游戲智能體,提升用戶游戲體驗。比如,在對戰(zhàn)游戲中,人工智能體能根據(jù)不同游戲玩家的水平展現(xiàn)不同的技能水平,并隨著用戶游戲水平的提升相應(yīng)提升自己的技能。

隨著“互聯(lián)網(wǎng)+”時代的到來,網(wǎng)絡(luò)空間安全防御變得尤為重要。天津大學(xué)軟件學(xué)院副教授郝建業(yè)團(tuán)隊的“大數(shù)據(jù)環(huán)境下移動互聯(lián)網(wǎng)網(wǎng)絡(luò)攻擊在線檢測技術(shù)”項目通過提出安全博弈論模型,結(jié)合多智能體強(qiáng)化學(xué)習(xí)技術(shù),研究設(shè)計應(yīng)對不同類型網(wǎng)絡(luò)攻擊的最優(yōu)防御策略。

中間人攻擊是一種常見的網(wǎng)絡(luò)攻擊方法,是指攻擊者通過使用某種技術(shù)手段與原本正常通訊的雙方分別建立獨立的連接,這樣就可以作為中間人監(jiān)聽整個通訊過程,在通信雙方毫不知情的情況下,竊取用戶的敏感信息。由于現(xiàn)有的中間人攻擊防御技術(shù)無法完全消除該攻擊的存在,之前的防御策略都是通過切換端口或加密的方式進(jìn)行防御。郝建業(yè)團(tuán)隊則從一個全新的角度來研究中間人攻擊防御問題:通過對用戶信息進(jìn)行等級區(qū)分,誘導(dǎo)攻擊者攻擊相對次要的信息,通過迷惑攻擊者,降低其獲取用戶敏感核心信息的概率。其相關(guān)研究成果《重復(fù)博弈下中間人攻擊的防御》《針對中間人攻擊的最優(yōu)個性化防御策略》分別在人工智能大會頂級會議——第26屆和31屆人工智能大會上發(fā)表。

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點贊 0
取消 0