GPU三巨頭開啟競爭新時代

時間:2021-08-17

來源:中國傳動網(wǎng)

導語:隨著GPU在數(shù)據(jù)中心當中的應用越來越普及,原本用于CPU的MCM(多芯片封裝模塊)開始向GPU領域滲透,特別是在高性能計算領域,在業(yè)界受到了越來越多的關注。

      隨著GPU在數(shù)據(jù)中心當中的應用越來越普及,原本用于CPU的MCM(多芯片封裝模塊)開始向GPU領域滲透,特別是在高性能計算領域,在業(yè)界受到了越來越多的關注。

  近日,在AMD第二季度財報中,該公司確認了其具有第二代 CDNA 架構的下一代 Instinct MI200加速器的初始出貨量。據(jù)悉,MI200配置了Aldebaran GPU,這是一個雙芯片處理器,采用了MCM封裝。該GPU開始出貨,標志著AMD成為第一家向客戶交付采用MCM技術的GPU公司,領先于競爭對手英特爾和英偉達(NVIDIA)。

  何為MCM?

  MCM是由同一器件中的多個Die(兩個或更多)組成的電子封裝系統(tǒng)。它安裝在基板上,襯底上的管芯由導線連接。

  與傳統(tǒng)架構(如用于GPU的SLI和CrossFire)相比,MCM可提供更高的性能,并減小組件的尺寸。通過MCM封裝系統(tǒng),器件或模塊可以克服重量和尺寸限制,并提供超過30%的效率。

  MCM的優(yōu)點可以概括如下:更高的可靠性;更靈活地集成不同的半導體技術;通過減少陣列之間互連的長度來提高性能;尺寸更小;產(chǎn)品可快速上市;降低了復雜性并簡化了設計。

  通常,MCM模塊有3種類型,具體取決于基板技術:MCM層壓 ( MCM-L )、沉積 ( MCM-D ) 和陶瓷 ( MCM-C )。

  以前,MCM主要用于CPU,最近逐步進入GPU領域。

  MCM用于GPU的優(yōu)勢和挑戰(zhàn)

  MCM GPU與傳統(tǒng)帶有多個GPU的顯卡之間的最大區(qū)別在于,前者是一個單獨的封裝,后者是一個PCB板卡,前者的板載橋接器取代了兩個獨立顯卡之間的Crossfire或SLI橋接器。

  傳統(tǒng)的SLI 和 CrossFire需要 PCIe 總線來交換數(shù)據(jù)、紋理、同步等。由于GPU之間的渲染時間會產(chǎn)生同步問題,因此在許多情況下,傳統(tǒng)的雙GPU顯卡,即單個PCB上的兩個芯片由它互連,每個芯片都有自己的VRAM。SLI或CrossFire的能耗很大,冷卻也是一個挑戰(zhàn),這些在很長一段時間內(nèi)都困擾著工程師。

  MCM GPU就是為了解決以上問題而出現(xiàn)的。不過,MCM GPU并不完美,它同樣面對著諸多技術挑戰(zhàn)和難題。

  在進行MCM GPU設計之前,需要解決封裝和互連方面的軟件問題,因為兩個或更多GPU,無論多么緊密地連接在一起,要想在一起協(xié)同工作,并不是一件容易的事。MCM作為能夠用于并行處理的組件,其GPU之間使用不同的內(nèi)存訪問,設計的復雜性會成倍增加。這需要開發(fā)人員在軟件方面進行大量“修補”。在消費級的PC應用方面,很少有游戲玩家實際運行多GPU設置,因為其回報很少,因此沒有人愿意做這么多的軟件工作。不過,如果應用于數(shù)據(jù)中心和云計算,情況就不同了,這樣的高性能計算應用對GPU提出了更高的要求。雖然多芯片GPU系統(tǒng)還是新生事物,許多圖形工作負載不能很好地擴展(有些甚至根本不能擴展),但每臺服務器有多個GPU,由于具有超級計算和數(shù)據(jù)中心的并行化性質(zhì),這就可以很好地擴展工作量。

  而如果能解決MCM GPU的瓶頸問題,回報將是誘人的。這也正是MCM GPU首先出現(xiàn)在數(shù)據(jù)中心應用領域的主要原因,今后,隨著技術的不斷成熟,以及PC應用性能的提升,其在消費電子領域的應用也將會出現(xiàn)。

  三強爭霸

  在企業(yè)界,最早應用MCM技術的是IBM,那是在上世紀70年代和80年代之間,主要用于該公司的POWER架構CPU。而將MCM發(fā)揚光大的是英特爾,自然也是用于CPU。2013年,該公司的22nm制程處理器Haswell就用到了該技術。2014年,14nm制程的Broadwell 架構問世,這是一個SoC平臺,它使用了“堆疊”基板架構,也就是MCM,將多個陣列垂直堆疊在了一起。

  最近幾年,英特爾開始研發(fā)獨立的GPU,也就是其Xe架構產(chǎn)品,為了順應技術發(fā)展和應用需求,該公司開始將MCM應用于其最新的GPU產(chǎn)品,據(jù)悉是基于Xe HPC架構的Ponte Vecchio加速器,但具體問世時間還未確定。

  AMD則快人一步。2020年,該公司把游戲卡與專業(yè)卡的GPU架構分家了,游戲卡的架構是RDNA,而專業(yè)卡的架構叫做CDNA,首款產(chǎn)品是Instinct MI100系列。今年6月,AMD首席執(zhí)行官蘇姿豐博士提到了CDNA 2架構及其產(chǎn)品,表示會在年內(nèi)推出,不久前發(fā)布的Q2財報則確認CDNA 2 GPU已經(jīng)向客戶發(fā)貨了。CDNA 2基于CDNA架構,是專為數(shù)據(jù)中心設計的。

  近日,AMD更新了CDNA 2的說明,其GPU核心代號是Aldebaran,它會成為AMD第一款采用MCM多芯片封裝的產(chǎn)品,也就是Instinct MI200。Aldebaran是AMD的第一款MCM GPU,但它是為數(shù)據(jù)中心準備的。在PC方面,2022年引入下一代RDNA 3架構后,基于MCM的消費級Radeon GPU也會出現(xiàn)。

  

AMD更新了CDNA 2的說明.jpg

  據(jù)悉,采用MCM封裝的CDNA 2內(nèi)部將整合兩個Die,每個芯片上有128組CU單元,如果每組CU還是128個流處理器的話,預計會擁有16384個流處理器,預計還會搭載128GB的HBM2e顯存,而目前的Instinct MI100只有7680個流處理器,搭載32GB的HBM2顯存。

  制造多芯片計算 GPU 類似于制造多核 MCM CPU,例如Ryzen 5000或Threadripper處理器。首先,將芯片靠得更近可以提高計算效率。AMD 的 Infinity 架構確保了高性能互連,有望使兩個芯片的效率接近一個的。其次,使用先進的工藝技術批量生產(chǎn)多個小芯片比大芯片更容易,因為小芯片通常缺陷較少,因此比大芯片的產(chǎn)量更好。

  AMD 的合作伙伴HPE證實,即將推出的 Frontier 超級計算機將使用 AMD 代號為 Trento CPU(最有可能是具有額外緩存或其他增強功能的 Milan 版本)和 Instinct MI200 加速器,成為世界上最快的超級計算機,峰值性能為 1.5 ExaFLOPS。

  除了AMD和英特爾,另一大GPU廠商英偉達也在摩拳擦掌,很可能緊隨AMD之后推出其首款MCM GPU產(chǎn)品Hopper。

  據(jù)悉,Hopper GPU架構是為數(shù)據(jù)中心應用專門設計的,與英偉達的Ampere架構產(chǎn)品不同,后者同時服務于 GPGPU(數(shù)據(jù)中心/工作站)和游戲市場。

 Hopper GPU架構.png

  早期的爆料稱,Hopper由兩個稱為GPM 的GPU 模組構成,每個模組有144 個SM 單元,同時Hopper 由于是專為運算所規(guī)劃的架構,相較Ampere 應該會取消用于光線追蹤加速的RT Core ,并強化包括FP64 、 FP16 與Tensor Core 等運算與AI 技術會使用到的單元。

  據(jù)悉,Hopper GPU 將采用臺積電的5nm制程工藝,性能比 Ampere 提高 3 倍。這是一個很大的提升,具體情況如何,還要看今后爆出的更多關于Hopper的信息。

  有報道稱,Hopper GPU很快就會流片。

  據(jù)悉,推出Hopper GPU之后,英偉達還將推出Ampere Next 和 Ampere Next Next,它們將采用MCM封裝。Ampere Next GPU 預計在 2022 年推出,而 Ampere Next Next 將在 2024 年推出。

  結語

  MCM的自身特點使其在高性能計算領域如魚得水,不只是是CPU,如今在GPU領域也得到了拓展,而隨著數(shù)據(jù)中心、邊緣云、物聯(lián)網(wǎng)的發(fā)展,以及CPU、GPU、DPU等產(chǎn)品形態(tài)的日益增多和復雜,留給MCM的發(fā)展空間可能會越來越大。

  新技術產(chǎn)品和應用的發(fā)展給以MCM為代表的芯片封裝、整合技術提供了更多的想象空間。


中傳動網(wǎng)版權與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅(qū)與傳動公眾號獲取更多資訊

關注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0