2018年全球AI突破性技術(shù)TOP10

時(shí)間:2018-08-06

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:2018年人工智能技術(shù)已在多方面實(shí)現(xiàn)突破進(jìn)展,國內(nèi)外的科技公司都在不斷嘗試將人工智能應(yīng)用于更多領(lǐng)域,不論科技巨頭還是初創(chuàng)企業(yè),都在致力于不斷創(chuàng)新,推動(dòng)技術(shù)進(jìn)步,接下來我們就來看看十項(xiàng)中外人工智能領(lǐng)域富有突破性的技術(shù)。

【2018年全球AI突破性技術(shù)TOP10】2018年,人工智能技術(shù)已在多方面實(shí)現(xiàn)突破進(jìn)展,接下來我們就來看看十項(xiàng)中外人工智能領(lǐng)域富有突破性的技術(shù)。

人工智能是個(gè)高科技、寬領(lǐng)域、多維度、跨學(xué)科的集大成者,從立足大數(shù)據(jù)、圍繞互聯(lián)網(wǎng)的純計(jì)算機(jī)應(yīng)用,逐步衍生到人們?nèi)粘Ia(chǎn)生活的方方面面,在細(xì)微之處改善和改變著我們。目前,不少新技術(shù)、新模式已經(jīng)逐步投入到現(xiàn)實(shí)運(yùn)用,但是多數(shù)領(lǐng)域仍然處在推廣、試驗(yàn)、研究階段,如何把握推廣人工智能技術(shù)的重大機(jī)遇,讓更廣大的老百姓像普及手機(jī)一樣,用上人工智能,這是我們這一代人必須面對(duì)的時(shí)代發(fā)展“必答題”。

2018年人工智能技術(shù)已在多方面實(shí)現(xiàn)突破進(jìn)展,國內(nèi)外的科技公司都在不斷嘗試將人工智能應(yīng)用于更多領(lǐng)域,不論科技巨頭還是初創(chuàng)企業(yè),都在致力于不斷創(chuàng)新,推動(dòng)技術(shù)進(jìn)步,接下來我們就來看看十項(xiàng)中外人工智能領(lǐng)域富有突破性的技術(shù)。

基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯

入選理由:翻譯是“自然語言處理”的最重要分支,也是比較難的一支。早年間,機(jī)器翻譯還被視作“低級(jí)翻譯”被嘲諷,如今神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯準(zhǔn)確性大大提高,堪比專業(yè)人工翻譯。我們熟知的谷歌翻譯、微軟語音翻譯以及搜狗語音識(shí)別等都是基于此項(xiàng)技術(shù)。

技術(shù)突破:機(jī)器翻譯是科研人員攻堅(jiān)了數(shù)十年的研究領(lǐng)域,其技術(shù)核心是一個(gè)擁有海量結(jié)點(diǎn)的深度神經(jīng)網(wǎng)絡(luò),可以自動(dòng)的從語料庫中學(xué)習(xí)翻譯知識(shí)。

人類大腦處理語言的過程毫無疑問是最為復(fù)雜的認(rèn)知過程之一,曾經(jīng)很多人都認(rèn)為機(jī)器翻譯根本不可能達(dá)到人類翻譯的水平。神經(jīng)網(wǎng)絡(luò)中的多層感知就試圖模擬人類大腦神經(jīng)多層傳遞處理的過程,但通常不超過三層。2006年,科學(xué)家提出了神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,使至少具有7層的神經(jīng)網(wǎng)絡(luò)訓(xùn)練成為可能。由于能夠比較好地模擬人腦神經(jīng)元多層深度傳遞的過程,它在解決一些復(fù)雜問題的時(shí)候有著非常明顯的突破性表現(xiàn)。

今年3月,微軟宣布其研發(fā)的機(jī)器翻譯系統(tǒng)首次在通用新聞的漢譯英上達(dá)到了人類專業(yè)水平,實(shí)現(xiàn)了自然語言處理的又一里程碑突破,將機(jī)器翻譯超越人類業(yè)余譯者的時(shí)間,提前了整整7年。

重大意義:基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,直接改善了之前逐詞直譯的效果,升級(jí)為以整個(gè)句子為單位進(jìn)行翻譯。

點(diǎn)評(píng):機(jī)器翻譯在手,縱橫四海不是問題。

基于多傳感器跨界融合的機(jī)器人自主導(dǎo)航

入選理由:機(jī)器人的終極目標(biāo)是為人類提供智能化的服務(wù),其中自主導(dǎo)航是近年來人類一直想要攻克的技術(shù)壁壘,臻迪(PowerVision)通過聲吶、視覺等多傳感器融合,使其水下機(jī)器人能實(shí)現(xiàn)自主導(dǎo)航及智能識(shí)別,在智能機(jī)器人領(lǐng)域內(nèi)取得了突破性進(jìn)展。

技術(shù)突破:隨著機(jī)器人的應(yīng)用場(chǎng)景及作業(yè)任務(wù)越來越復(fù)雜,單一傳感器難以滿足應(yīng)用需求。而多傳感器的信息融合對(duì)硬件資源依賴程度比較高,臻迪(PowerVision)基于自身在機(jī)器人行業(yè)深耕細(xì)作多年所積累的各類傳感器、慣性導(dǎo)航、運(yùn)動(dòng)控制、相機(jī)、視覺檢測(cè)/識(shí)別、SLAM等核心技術(shù),以及深度學(xué)習(xí)的深入研究,通過嵌入式端一體化集成平臺(tái)的系統(tǒng)架構(gòu)及優(yōu)化設(shè)計(jì),突破了移動(dòng)平臺(tái)硬件資源的限制,使水下機(jī)器人更加準(zhǔn)確、智能、全面地感知目標(biāo),并具備對(duì)水下目標(biāo)進(jìn)行鎖定、檢測(cè)、識(shí)別、跟隨的能力。

重大意義:通過導(dǎo)航控制、聲吶、視覺技術(shù)與深度學(xué)習(xí)的結(jié)合實(shí)現(xiàn)了機(jī)器人在全局環(huán)境中的定位及自主導(dǎo)航,以及智能化應(yīng)用,為人類探索更為廣闊的水下應(yīng)用提供了強(qiáng)有力的技術(shù)保障。

點(diǎn)評(píng):這也許是未來人工智能落地的最佳方式

DuerOS對(duì)話式人工智能系統(tǒng)

入選理由:DuerOS3.0能夠?yàn)橛脩魩砹藙潟r(shí)代的自然對(duì)話交互,包括情感語音播報(bào)、聲紋識(shí)別等能力在內(nèi)的自然語言交互技術(shù)的全面升級(jí)。

技術(shù)突破:DuerOS是百度度秘事業(yè)部研發(fā)的對(duì)話式AI操作系統(tǒng),擁有10大類目的250多項(xiàng)技能。DuerOS包括了從語音識(shí)別到語音播報(bào)再到屏幕顯示的一個(gè)完整交互流程,以及背后支撐交互的自然語言理解、對(duì)話狀態(tài)控制、自然語言生成、搜索等等核心技術(shù),這些技術(shù)支撐著應(yīng)用層和能力層的實(shí)現(xiàn)。

2018年7月4日,最新的DuerOS3.0正式發(fā)布,使賦能的產(chǎn)品能夠?qū)崿F(xiàn)語音多輪糾錯(cuò),進(jìn)行復(fù)雜的遞進(jìn)意圖識(shí)別與帶邏輯的條件意圖識(shí)別,從而更加準(zhǔn)確判斷用戶意圖,最終實(shí)現(xiàn)功能升維——利用擴(kuò)展特征理解用戶行為?;诖?,DuerOS3.0提供了包括有屏設(shè)備解決方案、藍(lán)牙設(shè)備解決方案和行業(yè)解決方案等在內(nèi)超過20個(gè)跨場(chǎng)景、跨設(shè)備的解決方案。

重大意義:DuerOS率先開啟AI時(shí)代商業(yè)化,將為生態(tài)合作伙伴從產(chǎn)品、內(nèi)容與推廣三大方面提供完整的應(yīng)用方案支持,加速AI設(shè)備落地。

點(diǎn)評(píng):小度小度,請(qǐng)問下一個(gè)技術(shù)我寫什么?

移動(dòng)AR技術(shù)

入選理由:未來AR與AI需要相互加持,可以將AR比喻成AI的眼睛。

技術(shù)突破:集成了眾多計(jì)算機(jī)科技和圖形圖像學(xué)技術(shù),包括實(shí)時(shí)渲染技術(shù)、空間定位追蹤、圖像識(shí)別、人機(jī)交互、顯示技術(shù)、云端存儲(chǔ)、數(shù)據(jù)傳輸、內(nèi)容開發(fā)工具等領(lǐng)域。

AR技術(shù)不僅展現(xiàn)了真實(shí)世界的信息,而且將虛擬的信息同時(shí)顯示出來,兩種信息相互補(bǔ)充、疊加。在視覺化的增強(qiáng)現(xiàn)實(shí)中,用戶利用頭戴顯示器,把真實(shí)世界與電腦圖形多重合成在一起,便可以看到真實(shí)的世界圍繞著它。增強(qiáng)現(xiàn)實(shí)技術(shù)包含了多媒體、三維建模、實(shí)時(shí)視頻顯示及控制、多傳感器融合、實(shí)時(shí)跟蹤及注冊(cè)、場(chǎng)景融合等新技術(shù)與新手段,為人類感知信息提供了新的方式。

未來移動(dòng)AR技術(shù)將向創(chuàng)意性AR應(yīng)用、基于位置的AR體驗(yàn)、多人AR體驗(yàn)發(fā)展。

重大意義:隨著蘋果ARKit、谷歌ARCore的發(fā)布,移動(dòng)AR在兩大移動(dòng)平臺(tái)上均意義重大。這也意味著,全球5億臺(tái)支持AR功能的移動(dòng)設(shè)備正在吸引所有的公司入局,這些公司正在將數(shù)據(jù)與API相結(jié)合,為用戶創(chuàng)造新的AR體驗(yàn)。

點(diǎn)評(píng):感覺自己離進(jìn)入真正的二次元世界不遠(yuǎn)了。

生物特征識(shí)別技術(shù)

入選理由:行為識(shí)別技術(shù)應(yīng)用于安防,為安全又上了一道鎖。

技術(shù)突破:店鋪安裝攝像頭已經(jīng)是一件非常普遍的行為,但普通的攝像頭只能紀(jì)錄店鋪內(nèi)人們的行為,如果發(fā)現(xiàn)盜竊需要通過觀看監(jiān)控記錄人工排查,耗時(shí)費(fèi)力。

而近日,日本電信巨頭宣布已研發(fā)出一款名為“AIGuardman”的新型人工智能安全攝像頭,這款攝像頭可以通過對(duì)人類動(dòng)作意圖的理解,在盜竊行為發(fā)生前就能準(zhǔn)確預(yù)測(cè),從而幫助商店識(shí)別偷竊行為,發(fā)現(xiàn)潛在的商店扒手。

這套人工智能系統(tǒng)采用開源技術(shù),能夠?qū)崟r(shí)對(duì)視頻流進(jìn)行掃描,并預(yù)測(cè)人們的姿勢(shì)。當(dāng)遇到監(jiān)控中出現(xiàn)可以行為時(shí),系統(tǒng)會(huì)嘗試將姿勢(shì)數(shù)據(jù)與預(yù)定義的“可疑”行為匹配,一旦發(fā)現(xiàn)就會(huì)通過相關(guān)手機(jī)App來通知店主。據(jù)相關(guān)媒體報(bào)道,這款產(chǎn)品使得商店減少了約四成的盜竊行為。

重大意義:通過行為識(shí)別技術(shù),能夠第一時(shí)間發(fā)現(xiàn)犯罪分子,預(yù)測(cè)犯罪行為,有效保護(hù)店鋪安全。

點(diǎn)評(píng):去日本的商店買東西一定要果斷,被誤會(huì)成小偷就不好啦。

機(jī)器人流程自動(dòng)化

入選理由:機(jī)器人流程自動(dòng)化能夠幫助甚至代替人類負(fù)擔(dān)大量簡(jiǎn)單且單一、重復(fù)而繁重的工作,并且效率更高、零失誤。

技術(shù)突破:機(jī)器人流程自動(dòng)化(RPA)是通過使用高性能認(rèn)知技術(shù)實(shí)現(xiàn)業(yè)務(wù)的自動(dòng)化和工作的效率。人類只需在操作界面上編寫需要人工完成的工作流程,即可處理各種業(yè)務(wù),如瀏覽器,云,以及各種軟件。

Gartner數(shù)據(jù)顯示,在過去的一年中,全球范圍中大型商業(yè)巨頭里有300家陸陸續(xù)續(xù)開展了RPA工程,將原先手工化的流程進(jìn)行自動(dòng)化改革。隨著科技的進(jìn)步RPA將融入更多人工智能技術(shù),即智能流程自動(dòng)化(IntelligentProcessAutomation)。相當(dāng)于在基于規(guī)則的自動(dòng)化基礎(chǔ)(RPA)之上增加基于深度學(xué)習(xí)和認(rèn)知技術(shù)的推理、判斷、決策能力。

重大意義:機(jī)器人流程自動(dòng)化能夠大幅提升企業(yè)的工作效率,減少人員投入,幫助企業(yè)降低成本,讓人類釋放生產(chǎn)力,騰出雙手去做價(jià)值更高的事情。

點(diǎn)評(píng):小白領(lǐng)被嚇的瑟瑟發(fā)抖,請(qǐng)老板別炒我。

像素級(jí)聲源定位系統(tǒng)PixelPlayer

入選理由:從視覺和聽覺信號(hào)角度實(shí)現(xiàn)聲源分離,開辟研究新途徑。

技術(shù)突破:在進(jìn)行音樂編輯時(shí),一般是利用均衡器將音樂中的低音部分調(diào)出來,而麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室的研究人員發(fā)現(xiàn)了更好的解決方案。他們所研發(fā)的新系統(tǒng)PixelPlayer。

PixelPlayer能夠通過結(jié)合聲音和圖像信息,機(jī)器學(xué)習(xí)系統(tǒng)能以無監(jiān)督的方式從圖像或聲音中識(shí)別目標(biāo)、定位圖像中的目標(biāo),以及分離目標(biāo)產(chǎn)生的聲音。當(dāng)我們給定一個(gè)輸入視頻,PixelPlayer可以聯(lián)合地將配音分離為目標(biāo)組件以及在圖像幀上定位目標(biāo)組件。PixelPlayer允許在視頻的每個(gè)像素上定位聲源。

簡(jiǎn)單點(diǎn)說就是PixelPlayer能識(shí)別出視頻中哪個(gè)物體發(fā)出哪些聲音,并將聲音分離出來。

重大意義:PixelPlayer能夠過濾伴奏、識(shí)別音源,不僅能幫助人類處理音樂,還能夠幫助機(jī)器人更好地理解其他物體所產(chǎn)生的環(huán)境聲音。

點(diǎn)評(píng):如果老師用了這個(gè)系統(tǒng),就能立刻找出課堂交頭接耳的同學(xué)。

兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片

入選理由:這個(gè)芯片可以涵蓋了目前已知的最佳訓(xùn)練和最好推理,能夠保持所有處理器組件能夠得到數(shù)據(jù)和工作。

技術(shù)突破:該深度學(xué)習(xí)芯片是IBM正在研究的項(xiàng)目之一。IBM將這個(gè)芯片的目標(biāo)利用率定在90%。這將是一個(gè)質(zhì)的突破,為了實(shí)現(xiàn)這一突破,IBM的研發(fā)團(tuán)隊(duì)做了兩項(xiàng)創(chuàng)新。

首先,利用率低通常是因?yàn)榇嬖谟谛酒車臄?shù)據(jù)流瓶頸。為了突破這些信息障礙,該項(xiàng)目的團(tuán)隊(duì)開發(fā)了一個(gè)“定制”的數(shù)據(jù)流系統(tǒng)。該數(shù)據(jù)流系統(tǒng)是一種網(wǎng)絡(luò)方案,可以加速數(shù)據(jù)從一個(gè)處理引擎到下一個(gè)處理引擎的傳輸過程。它還針對(duì)要處理的是學(xué)習(xí)任務(wù)還是推理任務(wù)以及不同的精度進(jìn)行了優(yōu)化。

第二項(xiàng)創(chuàng)新是團(tuán)隊(duì)使用專門設(shè)計(jì)的“便箋本”形式的片上存儲(chǔ)器,而不是CPU或GPU上的傳統(tǒng)高速緩沖存儲(chǔ)器。構(gòu)建它的目標(biāo)是為了保持?jǐn)?shù)據(jù)流經(jīng)芯片的處理引擎,并確保數(shù)據(jù)在恰當(dāng)?shù)臅r(shí)間處于正確的位置。為了獲得90%的利用率,IBM必須使設(shè)計(jì)出的便箋本具有巨大的讀/寫帶寬。

重大意義:該芯片可以執(zhí)行當(dāng)前所有的三種主要深度學(xué)習(xí)AI:卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多層感知器(MLP)和長(zhǎng)-短期記憶(LSTM)。這些技術(shù)共同主導(dǎo)了語言、視覺和自然語言處理。

點(diǎn)評(píng):目前深度學(xué)習(xí)技術(shù)陷入瓶頸,IBM的深度學(xué)習(xí)芯片也許能夠扭轉(zhuǎn)這一局勢(shì)。

智能代理訓(xùn)練平臺(tái)

入選理由:智能代理技術(shù)使計(jì)算機(jī)應(yīng)用趨向人性化、個(gè)性化。它能夠以主動(dòng)服務(wù)的方式完成的一組操作的機(jī)動(dòng)計(jì)算實(shí)體,不需要人的即時(shí)干預(yù)。

技術(shù)突破:智能代理技術(shù)具有解決問題所需的豐富知識(shí)、策略和相關(guān)數(shù)據(jù),能夠進(jìn)行相關(guān)的推理和智能計(jì)算,智能代理還可以在用戶沒有給出十分明確的需求時(shí)推測(cè)出用戶的意圖、興趣或愛好,并按最佳方式代為其完成任務(wù),并能自動(dòng)拒絕一些不合理或可能給用戶帶來危害的要求;智能代理還從經(jīng)驗(yàn)中不斷自我學(xué)習(xí),能夠根據(jù)環(huán)境調(diào)整自身的行為,從而提高處理問題的能力。

智能代理技術(shù)可以應(yīng)用于商業(yè)、智能搜索代理、數(shù)字圖書館、電子商務(wù)和遠(yuǎn)程教育的研究等,現(xiàn)在它也被應(yīng)用于游戲領(lǐng)域。

Unity是全球領(lǐng)先的游戲開發(fā)公司之一,去年其推出了機(jī)器學(xué)習(xí)平臺(tái)ML-Agents,讓AI開發(fā)人員和研究人員在Unity模擬和游戲環(huán)境中,使用演化策略、深度強(qiáng)化學(xué)習(xí)和其他訓(xùn)練方法來訓(xùn)練智能代理。這種模擬訓(xùn)練的方法在工業(yè)機(jī)器人、無人機(jī)、無人駕駛車輛和游戲角色設(shè)計(jì)中均有著廣泛應(yīng)用。

重大意義:Unity以使機(jī)器學(xué)習(xí)研究人員獲得最強(qiáng)大的訓(xùn)練場(chǎng)景為使命,為快速增長(zhǎng)的AI愛好者群體探索深度學(xué)習(xí)提供了一個(gè)研究平臺(tái)。

點(diǎn)評(píng):NPC越來越聰明,對(duì)于游戲手殘黨來說可能不是個(gè)好事。

入耳式人工智能

入選理由:耳機(jī)從外變成了智能穿戴設(shè)備,可以無限延續(xù)使用時(shí)間和場(chǎng)景。

技術(shù)突破:蘋果在今年即將推出的AirPods2中加入了Siri喚起、內(nèi)置芯片等等,可以收集行走步數(shù)、心率數(shù)據(jù)和體溫等等,還可以通過內(nèi)置陀螺儀捕捉用戶頭部移動(dòng)狀況甚至定位位置,當(dāng)然也可以通過麥克風(fēng)接受命令,再通過揚(yáng)聲器進(jìn)行反饋。

谷歌的實(shí)時(shí)翻譯無線耳機(jī)PixelBuds常被拿來與AirPods相比,PixelBuds對(duì)GoogleAssistant的喚起十分迅速,只要把手指放在耳機(jī)的觸控板上,幾乎同一時(shí)刻就可以和GoogleAssistant進(jìn)行對(duì)話。

AirPods與PixelBuds讓我們重新定義了耳機(jī)對(duì)人類的作用,相比手腕上的智能手表,耳機(jī)顯然可以更方便的進(jìn)行語音交互,在接收信息時(shí)更無需占用寶貴的視覺空間。還將智能音箱式的遠(yuǎn)場(chǎng)交互變成更自然也更快捷的近場(chǎng)交互。

重大意義:智能耳機(jī)讓智能助理更接近隨身隨行,蘋果、谷歌的涉足,必將帶起一波耳中AI的風(fēng)潮。

點(diǎn)評(píng):現(xiàn)在我們手機(jī)不離手,以后可能要耳機(jī)不離耳了。

我們看到這些科技公司或者科研團(tuán)隊(duì),學(xué)習(xí)翻譯、研究捕魚、開發(fā)游戲、做著音樂……看似“不務(wù)正業(yè)”,而這恰恰證明了,人工智能不單單是一種技術(shù)或一個(gè)產(chǎn)品。

從IBM、蘋果,到谷歌,百度,所有的人工智能巨頭都在嘗試軟件、硬件、應(yīng)用場(chǎng)景的聯(lián)通。聰明的科技公司都不再單一的專注于自己的傳統(tǒng)業(yè)務(wù),而是著眼于未來,不斷創(chuàng)新技術(shù),跨界融合打造一個(gè)整合的生態(tài)系統(tǒng)。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0