人工智能芯片產(chǎn)業(yè)百家爭(zhēng)鳴,誰(shuí)能成功彈起?

時(shí)間:2018-06-08

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):2018年更是被稱(chēng)為人工智能技術(shù)規(guī)模應(yīng)用的拐點(diǎn)。而作為人工智能技術(shù)的核心,人工智能芯片也備受關(guān)注,引得國(guó)內(nèi)外科技巨頭紛紛布局。谷歌、蘋(píng)果、微軟、Facebook、英特爾、高通、英偉達(dá)、AMD、阿里巴巴等巨頭紛紛開(kāi)始自主研發(fā)人工智能芯片。

【人工智能芯片產(chǎn)業(yè)百家爭(zhēng)鳴,誰(shuí)能成功彈起?】1492年哥倫布從西班牙巴羅斯港出發(fā),一路西行發(fā)現(xiàn)了美洲。葡萄牙人達(dá)伽馬南下非洲,繞過(guò)好望角到達(dá)了印度。不久之后,麥哲倫用了整整三年時(shí)間,完成了人類(lèi)史上第一次環(huán)球航行,開(kāi)啟了人類(lèi)歷史上的大航海時(shí)代。大航海時(shí)代的到來(lái),拉近了人類(lèi)社會(huì)各文明之間的距離,對(duì)人類(lèi)社會(huì)產(chǎn)生了深遠(yuǎn)的影響。

人工智能進(jìn)入“大航海時(shí)代”

從深藍(lán)到AlphaGo,人工智能逐漸走進(jìn)人們的生活。人工智能也從一場(chǎng)技術(shù)革命,逐漸走向了產(chǎn)業(yè)落地。智能手機(jī)、智能家居設(shè)備、智能音箱……等設(shè)備,已經(jīng)完全進(jìn)入到人們的生活中。指紋識(shí)別、人臉識(shí)別、畫(huà)面增強(qiáng)等實(shí)用人工智能的技術(shù),也成為了人們?nèi)粘J褂秒娮釉O(shè)備必不可少的技術(shù)。

基于面部識(shí)別的emoji表情

這些在我們?nèi)粘I钪小耙?jiàn)怪不怪”的人工智能技術(shù)越來(lái)越普遍,代表了人工智能產(chǎn)業(yè)在近年來(lái)的爆炸式發(fā)展,2018年更是被稱(chēng)為人工智能技術(shù)規(guī)模應(yīng)用的拐點(diǎn)。而作為人工智能技術(shù)的核心,人工智能芯片也備受關(guān)注,引得國(guó)內(nèi)外科技巨頭紛紛布局。谷歌、蘋(píng)果、微軟、Facebook、英特爾、高通、英偉達(dá)、AMD、阿里巴巴等巨頭紛紛開(kāi)始自主研發(fā)人工智能芯片。

國(guó)產(chǎn)寒武紀(jì)片芯

并且人工智能芯片的應(yīng)用場(chǎng)景細(xì)分市場(chǎng)越來(lái)越多,專(zhuān)門(mén)為某些人工智能應(yīng)用場(chǎng)景定制的芯片適用性明顯高于通用芯片。這樣的形勢(shì),給一些人工智能芯片的初創(chuàng)公司帶來(lái)了機(jī)會(huì)。寒武紀(jì)芯片和地平線的人工智能視覺(jué)芯片、自動(dòng)駕駛芯片等,就是初創(chuàng)公司在人工智能芯片領(lǐng)域取得成功的代表。

人工智能芯片大火的同時(shí),已經(jīng)呈現(xiàn)出三分天下的態(tài)勢(shì)。FPGA、GPU和TPU芯片,已經(jīng)在人工智能領(lǐng)域大規(guī)模應(yīng)用。這三種人工智能芯片有何不同?人工智能企業(yè)又是怎樣看待這三種芯片的?下文將為您詳述。

FPGA并不是新鮮的事物,而因?yàn)锳I的火熱的應(yīng)用需求不斷增強(qiáng),F(xiàn)PGA正是作為一種AI芯片呈現(xiàn)在人們的面前。準(zhǔn)確的說(shuō),不僅僅是芯片,因?yàn)樗軌蛲ㄟ^(guò)軟件的方式定義,所以,更像是AI芯片領(lǐng)域的變形金剛。

FPGA是現(xiàn)場(chǎng)可編程邏輯陣列的首字母縮寫(xiě),即Field-ProgrammableGateArray。過(guò)去曾與可編程邏輯器件CPLD進(jìn)行過(guò)較量,如今已經(jīng)在PAL、GAL、CPLD等可程式邏輯裝置的基礎(chǔ)上進(jìn)一步發(fā)展,成為英特爾進(jìn)軍AI市場(chǎng)的一個(gè)重要法寶。

全球FPGA市場(chǎng)的年均增長(zhǎng)率會(huì)達(dá)到7%

為了更好地了解FPGA和其對(duì)AI芯片的未來(lái)看法,ZOL企業(yè)站對(duì)英特爾可編程解決方案事業(yè)部亞太區(qū)市場(chǎng)拓展經(jīng)理劉斌(RobinLiu)進(jìn)行了書(shū)面采訪。面對(duì)目前市場(chǎng)上出現(xiàn)的,CPU、GPU、FPGA、TPU等多種技術(shù)處理方式,英特爾又有哪些判斷。

FPGA三大特點(diǎn)

劉斌表示:“實(shí)際上今天絕大多數(shù)人工智能系統(tǒng)是部署在通用處理器上的,原因是在很多應(yīng)用領(lǐng)域中人工智能部分只是完成某個(gè)環(huán)節(jié)的系統(tǒng)任務(wù),還有大量其它任務(wù)一起構(gòu)成系統(tǒng)處理的完整單元?!痹诖嘶A(chǔ)上,出現(xiàn)了很多種選項(xiàng),比如FPGA、TPU2或者NNP等專(zhuān)用處理器。這種專(zhuān)用處理器,往往向深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)領(lǐng)域延伸,擁有更高效的存儲(chǔ)器訪問(wèn)調(diào)度結(jié)構(gòu)。

FPGA具有很強(qiáng)的靈活性

FPGA被稱(chēng)為大型數(shù)據(jù)中心和計(jì)算機(jī)群眾的“加速多面手”也有其技術(shù)生態(tài)背景。FPGA的開(kāi)發(fā)社區(qū)規(guī)模相對(duì)較小,也具有一定的門(mén)檻,但是,F(xiàn)PGA具備良好的存儲(chǔ)器訪問(wèn)能力,并且可以非常靈活高效的處理各種不同位寬的數(shù)據(jù)類(lèi)型,其有效計(jì)算力接近專(zhuān)用處理器的水平,F(xiàn)PGA還可以在線重編程成為其它非人工智能任務(wù)的硬件加速器,這也是其有別于GPU和TPU的關(guān)鍵因素。

具體而言有三大特點(diǎn):FPGA器件家族的廣泛覆蓋可以適配從云到端的應(yīng)用需求;FPGA具有處理時(shí)延小并且時(shí)延可控的特點(diǎn),更適合某些實(shí)時(shí)性要求高的業(yè)務(wù)場(chǎng)景;FPGA可以靈活處理不同的數(shù)據(jù)位寬,使得系統(tǒng)可以在計(jì)算精度、計(jì)算力、成本和功耗上進(jìn)行折衷和優(yōu)化,更適合某些制約因素非常嚴(yán)格的工程化應(yīng)用。相比于ASIC則FPGA更加靈活,可以適配的市場(chǎng)領(lǐng)域更加廣泛。

自定義功能芯片

以微軟為例,在微軟必應(yīng)搜索業(yè)務(wù)和Azure云計(jì)算服務(wù)中,均應(yīng)用了英特爾FPGA技術(shù),在其發(fā)布的“腦波項(xiàng)目”(ProjectBrainwave)中特別闡述了英特爾FPGA技術(shù)如何幫助Azure云和必應(yīng)搜索取得“實(shí)時(shí)人工智能”(real-timeAI)的效果。

英特爾FPGA支持必應(yīng)快速處理網(wǎng)頁(yè)中的數(shù)百萬(wàn)篇文章,從而為您提供基于上下文的答案。借助機(jī)器學(xué)習(xí)和閱讀理解,必應(yīng)現(xiàn)在可提供智能答案,幫助用戶更快速找到所需答案,而非手動(dòng)點(diǎn)擊各個(gè)鏈接結(jié)果。在微軟腦波計(jì)劃中,同樣選擇了英特爾現(xiàn)場(chǎng)可編程門(mén)陣列的計(jì)算晶片,以具有競(jìng)爭(zhēng)力的成本和業(yè)界最低延遲進(jìn)行人工智能計(jì)算。

如果說(shuō)在AI芯片領(lǐng)域各家有各家的拿手絕學(xué),那么身為“變形金剛”FPGA的拿手絕學(xué)就是自定義功能了。作為特殊應(yīng)用積體電路領(lǐng)域中的一種半定制電路的FPGA,既解決了全定制電路的不足,又克服了原有可編程邏輯器件門(mén)電路數(shù)有限的缺點(diǎn)。也就是說(shuō),盡管FPGA不是輻射范圍最廣的,但是一旦匹配后,輸出驚人,所以也是良好的芯片選擇。

不止FPGA

隨著人工智能的發(fā)展,芯片的設(shè)計(jì)不僅要能夠滿足人工智能對(duì)計(jì)算力的需求,還要能夠適應(yīng)不斷變化的產(chǎn)業(yè)需要。在不同的應(yīng)用領(lǐng)域和不同的位置,前端還是數(shù)據(jù)中心,甚至邊緣計(jì)算等應(yīng)用場(chǎng)景。劉斌表示:一種芯片是沒(méi)辦法解決所有問(wèn)題的。從移動(dòng)設(shè)備,到服務(wù)器,再到云服務(wù)、機(jī)器學(xué)習(xí)和人工智能的加速,需要不同種類(lèi)的技術(shù)支持,需要能夠支持從毫瓦級(jí)到千瓦級(jí)的多種架構(gòu)。

在英特爾人工智能領(lǐng)域,除了FPGA之外,還提供了ASIC方案下的NNP神經(jīng)網(wǎng)絡(luò)計(jì)算加速器、Movidius專(zhuān)注前端智能攝像頭領(lǐng)域和Mobieye加速芯片,在無(wú)人車(chē)領(lǐng)域做視覺(jué)相關(guān)的物體、道路、異常情況的監(jiān)測(cè)。

過(guò)去30多年,摩爾定律幾乎每年都會(huì)推動(dòng)微處理器的性能提升50%,而半導(dǎo)體的物理學(xué)限制卻讓其放慢了腳步。如今,CPU的性能每年只能提升10%左右。事實(shí)上,英偉達(dá)CEO黃仁勛在每年的GTC上都會(huì)提到同一件事——摩爾定律失靈了。也就是說(shuō),人們要獲得更強(qiáng)的計(jì)算力,需要花費(fèi)更多的成本。與此同時(shí),GPU的崛起速度令人咂舌,看看英偉達(dá)近兩年的股價(jià)就知道了。

微處理器趨勢(shì)圖

隨著人工智能、深度學(xué)習(xí)等技術(shù)的興起與成熟,起初為圖像渲染而生的GPU找到了新的用武之地,以GPU驅(qū)動(dòng)的計(jì)算環(huán)境隨處可見(jiàn),從HPC到AI訓(xùn)練。站在數(shù)字世界、高性能計(jì)算、人工智能的交叉口,GPU悄然成為了計(jì)算機(jī)的大腦。將性能從10倍提升至100倍,GPU的加速能力遠(yuǎn)超以X86架構(gòu)構(gòu)建的CPU系統(tǒng),將時(shí)間壓縮至分鐘級(jí)別,功耗也相對(duì)較低。

2006年,借助CUDA(ComputeUnifiedDeviceArchitecture,通用計(jì)算架構(gòu))和TeslaGPU平臺(tái),英偉達(dá)將通用型計(jì)算帶入了GPU并行處理時(shí)代,這也為其在HPC領(lǐng)域的應(yīng)用奠定了基礎(chǔ)。作為并行處理器,GPU擅長(zhǎng)處理大量相似的數(shù)據(jù),可以將任務(wù)分解為數(shù)百或數(shù)千塊同時(shí)處理,而傳統(tǒng)CPU則是為串行任務(wù)所設(shè)計(jì),在X86架構(gòu)下進(jìn)行多核編程是很困難的,并且從單核到四核、再到16核有時(shí)會(huì)導(dǎo)致邊際性能增益。同時(shí),內(nèi)存帶寬也會(huì)成為進(jìn)一步提高性能的瓶頸。

傳統(tǒng)CPU計(jì)算架構(gòu)難以支撐快速成長(zhǎng)的HPC

與以往的通用算法相比,深度學(xué)習(xí)對(duì)計(jì)算性能的要求則到了另一個(gè)量級(jí)上。盡管在GPU中運(yùn)行并行核心時(shí)處理的應(yīng)用數(shù)量相同,但在系統(tǒng)中單個(gè)內(nèi)核的使用效率卻更高。此外,經(jīng)過(guò)重寫(xiě)的并行函數(shù)在應(yīng)用程序關(guān)鍵部分運(yùn)行時(shí),在GPU上跑的速度更快。

更重要的是,英偉達(dá)在利用GPU構(gòu)建訓(xùn)練環(huán)境時(shí)還考慮到了生態(tài)的重要性,這也是一直以來(lái)困擾人工智能發(fā)展的難題。首先,英偉達(dá)的NVIDIAGPUCloud上線了AWS、阿里云等云平臺(tái),觸及到了更多云平臺(tái)上的開(kāi)發(fā)者,預(yù)集成的高性能AI容器包括TensorFlow、PyTorch、MXNet等主流DL框架,降低了開(kāi)發(fā)門(mén)檻、確保了多平臺(tái)的兼容性。

其次,英偉達(dá)也與研究機(jī)構(gòu)、大學(xué)院校,以及向Facebook、YouTube這樣的科技巨頭合作,部署GPU服務(wù)器的數(shù)據(jù)中心。同時(shí),還為全球數(shù)千家創(chuàng)業(yè)公司推出了Inception項(xiàng)目,除了提供技術(shù)和營(yíng)銷(xiāo)的支持,還會(huì)幫助這些公司在進(jìn)入不同國(guó)家或地區(qū)的市場(chǎng)時(shí),尋找潛在的投資機(jī)會(huì)。

可以說(shuō),英偉達(dá)之于GPU領(lǐng)域的成功除了歸功于Tesla加速器、NVIDIADGX、NVIDIAHGX-2這些專(zhuān)屬的工作站或云服務(wù)器平臺(tái),更依托于構(gòu)建了完整的產(chǎn)業(yè)鏈通路,讓新技術(shù)和產(chǎn)品有的放矢,從而形成了自己的生態(tài)圈,這也是英特爾難以去打破的。

在不久前舉行的谷歌I/O2018開(kāi)發(fā)者大會(huì)上,TPU3.0正式亮相。根據(jù)官方介紹,TPU3.0的計(jì)算能力最高可達(dá)100PFlops,是TPU2.0的8倍多。TPU的英文全名是TensorProcessorUnit,它是谷歌自主研發(fā)的針對(duì)深度學(xué)習(xí)加速的專(zhuān)用人工智能芯片。TPU是專(zhuān)為谷歌深度學(xué)習(xí)框架TensorFlow設(shè)計(jì)的人工智能芯片。著名的AlphaGo使用的就是TPU2.0芯片。

谷歌TPU3.0芯片

目前大多數(shù)人工智能企業(yè)青睞于GPU芯片,而TPU相對(duì)于GPU而言,采用8位低精度計(jì)算節(jié)省晶體管,對(duì)精度影響很小但是卻可以大幅節(jié)約功耗。尤其是當(dāng)大面積集成系統(tǒng)時(shí),TPU不僅性能更強(qiáng),功耗也會(huì)大幅低于GPU集成系統(tǒng)。由于芯片能力非常強(qiáng)大,谷歌使用了液冷散熱技術(shù),可以幫助TPU更好的為數(shù)據(jù)中心服務(wù)。

谷歌TPU架構(gòu)

除了強(qiáng)大的性能外,谷歌在生態(tài)系統(tǒng)的建設(shè)上做了大量的工作。在TPU1.0和2.0的初期,谷歌并沒(méi)有大規(guī)模推進(jìn)其商業(yè)化,而是圍繞生態(tài)做文章。這就意味著要投入巨額的成本,而且冒著極大的市場(chǎng)風(fēng)險(xiǎn)。當(dāng)然,背后的潛在市場(chǎng)也是巨大的。在人工智能市場(chǎng)競(jìng)爭(zhēng)激烈的形勢(shì)下,吸引到更多的開(kāi)發(fā)者到谷歌的生態(tài)系統(tǒng)中,將會(huì)比對(duì)手有更強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。

TPU計(jì)算集群

目前谷歌正快速擴(kuò)張自己的云計(jì)算業(yè)務(wù),TPU也依托于云平臺(tái)運(yùn)行。通過(guò)更低的售價(jià)讓人工智能開(kāi)發(fā)企業(yè)拋棄GPU,轉(zhuǎn)投成本更低的TPU服務(wù),是谷歌目前正在大力發(fā)展的業(yè)務(wù)。如果TPU無(wú)法獲得巨大的市場(chǎng)份額從而降低單顆TPU的成本,那么谷歌將很難在人工智能市場(chǎng)盈利。不過(guò),TPU強(qiáng)勁的計(jì)算性能和集群計(jì)算陣列可以讓人工智能開(kāi)發(fā)企業(yè)更快的開(kāi)展業(yè)務(wù)。TPU的強(qiáng)大,讓谷歌在人工智能芯片領(lǐng)域已稱(chēng)霸一方。

上游廠商喊得再歡,落地到千人千面的行業(yè)場(chǎng)景中也要由解決方案商來(lái)幫忙,無(wú)論是GPU、FPGA還是TPU,最終還是要聽(tīng)聽(tīng)客戶的使用感受。為此,我們采訪了人工智能產(chǎn)品和行業(yè)解決方案提供商曠視科技。曠視科技利用自主研發(fā)的深度學(xué)習(xí)算法引擎Brain++,服務(wù)于金融安全、城市安防、手機(jī)AR、商業(yè)物聯(lián)、工業(yè)機(jī)器人等五大核心行業(yè)。

在曠視科技看來(lái),GPU、FPGA、TPU在通用性和能效比之間的取舍不同。其中,GPU最成熟,但也最耗資源,常用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)和服務(wù)端;FPGA最靈活,能支持應(yīng)用中出現(xiàn)的特殊操作,但要考慮靈活度和效率之間的trade-off;TPU相對(duì)最不靈活,但如果場(chǎng)景合適則能發(fā)揮出最大功用。

如果拿汽車(chē)類(lèi)比,GPU是大巴車(chē),適合多人同目標(biāo);FPGA是小轎車(chē),能到任何地方,但得自己會(huì)開(kāi);而TPU是火車(chē),只能在比公路少的多的鐵軌上開(kāi),但開(kāi)的飛快。人工智能還在快速發(fā)展,還處于在各個(gè)行業(yè)落地的過(guò)程中。這個(gè)階段對(duì)GPU,F(xiàn)PGA和TPU都有需求。

目前,曠視科技選擇的是T型技術(shù)方案,即在維持一定廣度的同時(shí),深耕某些應(yīng)用場(chǎng)景,因此在算法實(shí)際落地的過(guò)程中,自然而然地產(chǎn)生了從GPU/CPU到FPGA的需求。GPU主要用于訓(xùn)練,而FPGA能在端上能提供比GPU更好的性能功耗比。CPU則是無(wú)處不在的“默認(rèn)"選擇。未來(lái),不排除采用TPU的方案來(lái)進(jìn)一步提高端上的能力。

從行業(yè)來(lái)看,當(dāng)前IoT領(lǐng)域?qū)I芯片的需求最為迫切,原因是IoT領(lǐng)域要求在有限的功耗下完成相應(yīng)的AI任務(wù),最需要性能功耗比高的AI芯片。至于未來(lái)要借助AI賦能各個(gè)行業(yè),曠視科技認(rèn)為,最初階段可能都會(huì)先用GPU的AI方案,因?yàn)楹驮搭^(即神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段)銜接最好。另外對(duì)于中心化的應(yīng)用,只要GPU按現(xiàn)在的“黃定律”的速度迭代前進(jìn),基于GPU在大批量處理數(shù)據(jù)的場(chǎng)景下仍然經(jīng)常是公開(kāi)可得的最佳方案。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽(yáng)科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺(jué)
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0