NVIDIA推出GPU加速平臺RAPIDS,提升機器學(xué)習(xí)效率

時間:2018-11-01

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:NVIDIA于今年10月10日的GPU技術(shù)大會上發(fā)布了一款針對數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的GPU加速平臺---RAPIDS。

【中國傳動網(wǎng) 新品新聞】 NVIDIA于今年10月10日的GPU技術(shù)大會上發(fā)布了一款針對數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的GPU加速平臺---RAPIDS。

作為科技行業(yè)的熱點,人工智能(AI)與機器學(xué)習(xí)正持續(xù)受到業(yè)界的關(guān)注。調(diào)研機構(gòu)Gartner表示人工智能和先進的機器學(xué)習(xí)技術(shù)是被廣泛關(guān)注的新興技術(shù),將在企業(yè)甚至整個行業(yè)中掀起革命浪潮。它們能夠大幅度降低勞動力成本,產(chǎn)生意想不到的新見解,從原始數(shù)據(jù)中發(fā)現(xiàn)新模式,并建立預(yù)測模型。據(jù)分析師估計,面向數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的服務(wù)器市場每年價值約為200億美元,加上科學(xué)分析和深度學(xué)習(xí)市場,高性能計算市場總價值大約為360億美元。

“數(shù)據(jù)分析和機器學(xué)習(xí)是高性能計算市場中最大的細分市場,不過目前尚未實現(xiàn)加速?!盢VIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在GPU技術(shù)大會主旨演講中表示,“全球最大的行業(yè)均在海量服務(wù)器上運行機器學(xué)習(xí)算法,目的在于了解所在市場和環(huán)境中的復(fù)雜模式,同時迅速、精準地做出將直接影響其基礎(chǔ)的預(yù)測?!?/p>

在這種趨勢下,NVIDIA于今年10月10日的GPU技術(shù)大會上發(fā)布了一款針對數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的GPU加速平臺---RAPIDS。日前,NVIDIA在京召開了媒體溝通會,系統(tǒng)講解了RAPIDS的應(yīng)用場景、平臺性能和生態(tài)策略。在NVIDIA亞太區(qū)解決方案架構(gòu)高級總監(jiān)趙立威看來,RAPIDS能夠幫助超大規(guī)模公司以前所未有的速度分析海量數(shù)據(jù)并進行精準的業(yè)務(wù)預(yù)測,顯著提升端到端預(yù)測數(shù)據(jù)分析能力。

圖NVIDIA亞太區(qū)解決方案架構(gòu)高級總監(jiān)趙立威

后摩爾時代下的GPU加速需求

眾所周知,機器學(xué)習(xí)包含了數(shù)據(jù)、特征以及算法。趙立威介紹對于數(shù)據(jù)科學(xué)家而言,一個標準的系統(tǒng)流程是數(shù)據(jù)準備、數(shù)據(jù)訓(xùn)練與可視化呈現(xiàn)三個步驟,其中數(shù)據(jù)準備主要進行數(shù)據(jù)特征的提取、數(shù)據(jù)的合并以及降維等;數(shù)據(jù)訓(xùn)練則是一個不斷循環(huán)的過程,通過參數(shù)調(diào)整、優(yōu)化使精度更高;最后進行上線展示,從而進一步運營。

圖數(shù)據(jù)科學(xué)通用流程

隨著大數(shù)據(jù)技術(shù)的快速發(fā)展,不管是在數(shù)據(jù)處理還是訓(xùn)練的過程,都需要大量的計算力,而在后摩爾時代,數(shù)據(jù)的增長量遠遠超過了計算力,基于Hadoop、SPARK的分布式節(jié)點加速會越來越困難。趙立威表示雖然市場出現(xiàn)了GPUDatabase技術(shù),但并沒有把數(shù)據(jù)的準備、操作、ETL過程和機器學(xué)習(xí)訓(xùn)練整合成一個pipeline。對于GPU加速深度學(xué)習(xí)而言,它本質(zhì)是加速了計算的應(yīng)用,而數(shù)據(jù)分析和機器學(xué)習(xí)目前是最大的HPC應(yīng)用分支,伴隨著未來高速增長,它對計算力有著巨大的需求。對此,NVIDIA推出GPU加速平臺RAPIDS,該平臺已與全球最流行的數(shù)據(jù)科學(xué)庫及工作流無縫整合,可加速機器學(xué)習(xí),如包括Anaconda、BlazingDB、Graphistry、NERSC、PyData、INRIA和UrsaLabs在內(nèi)的主要開源貢獻者,都在RAPIDS推出后立即給予了其廣泛的生態(tài)系統(tǒng)支持。

這里,趙立威展示了一個形象的例子,在過去數(shù)據(jù)工程師每天的大部分時間都在喝咖啡中度過,因為數(shù)據(jù)處理的過程中涉及到大量等待時間。應(yīng)用RAPIDS后,相較于下圖左邊的等待時間,右圖的效率得到了大大的提高,數(shù)據(jù)科學(xué)家可與更加專注與建模、測試與進行數(shù)據(jù)分析工作。RAPIDS為數(shù)據(jù)科學(xué)家提供了他們需要用來在GPU上運行整個數(shù)據(jù)科學(xué)管線的工具。最初的RAPIDS基準分析利用了XGBoost機器學(xué)習(xí)算法在NVIDIADGX-2?系統(tǒng)上進行訓(xùn)練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍。這可以幫助數(shù)據(jù)科學(xué)家將典型訓(xùn)練時間從數(shù)天減少到數(shù)小時,或者從數(shù)小時減少到數(shù)分鐘,具體取決于其數(shù)據(jù)集的規(guī)模。

圖數(shù)據(jù)科學(xué)家應(yīng)用RAPIDS的日常對比

開源生態(tài)提升數(shù)據(jù)分析能力

趙立威介紹RAPIDS構(gòu)建于ApacheArrow、pandas和scikit-learn等流行的開源項目之上,為最流行的Python數(shù)據(jù)科學(xué)工具鏈帶來了GPU提速。為了將更多的機器學(xué)習(xí)庫和功能引入RAPIDS,NVIDIA廣泛地與開源生態(tài)系統(tǒng)貢獻者展開合作,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、UrsaLabs負責(zé)人兼ApacheArrow締造者WesMcKinney以及迅速增長的Python數(shù)據(jù)科學(xué)庫pandas等等。

從硬件的角度,除了NVIDIA的DGX-2、DGX-1、DGXstation外,RAPIDS還包括一系列合作伙伴基于HGX-1、HGX-2兩種架構(gòu)提供的硬件產(chǎn)品。此外,NVIDIA也在跟下游的ODM、OEM廠商合作,進一步拓展RAPIDS的運行和使用。

目前,趙立威介紹包括HPE、IBM、Oracle、開源社區(qū)、創(chuàng)業(yè)公司等都在積極采用RAPIDS,顯著提升端到端預(yù)測數(shù)據(jù)分析能力。例如沃爾瑪已經(jīng)采用RAPIDS實現(xiàn)了復(fù)雜模式大規(guī)模地運行,同時進行更加精準的預(yù)測。最后,他總結(jié)RAPIDS包含以下特點:

無憂一體化:只需要使用最少的代碼加速Python數(shù)據(jù)科學(xué)工具鏈,不需要重新編碼或者使用新工具;

在任何GPU上擴展:從GPU工作站到多GPU服務(wù)器的無縫擴展多節(jié)點集群;

頂級模型精度:通過更快地迭代模型來提高機器學(xué)習(xí)模型的準確性,并更迅捷地實現(xiàn)部署;

減少培訓(xùn)時間:通過交互數(shù)據(jù)科學(xué)大幅提高工作效率;

開源可定制,可擴展,可互操作:這里趙立威特別強調(diào)開源一方面是指NVIDIA支持并基于ApacheArrow構(gòu)建,與PYTHON、SPARK、DASK等所有開源社區(qū)保持緊密合作;另一方面,因為RAPIDS本身的開源特性,未來也希望有跟多的開發(fā)者能夠貢獻代碼,不斷的完善平臺、豐富它的基礎(chǔ)特性、服務(wù)于更多的應(yīng)用場景。

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0