阻击英雄,国产精品白嫩美女在线观看app,点燃我温暖你电视剧免费完整版

【中國傳動網(wǎng) 市場分析】人工智能應(yīng)用的蓬勃發(fā)展對算力提出了非常迫切的要求。由于摩爾定律已經(jīng)失效，定制計算將成為主流方向，因而新型的AI芯片開始層出不窮，競爭也日趨白熱。參與這一競爭的不光是傳統(tǒng)的半導(dǎo)體芯片廠商，大型的互聯(lián)網(wǎng)和終端設(shè)備企業(yè)依托于自身龐大的應(yīng)用規(guī)模，直接從自身業(yè)務(wù)需求出發(fā)，參與到AI芯片的開發(fā)行列。這其中以英偉達為代表的GPU方案已經(jīng)形成規(guī)模龐大的生態(tài)體系，谷歌的TPU則形成了互聯(lián)網(wǎng)定義AI芯片的標(biāo)桿，其余各家依托各自需求和優(yōu)勢，提出了多類解決方案。本文將簡要梳理目前各家技術(shù)進展?fàn)顟B(tài)，結(jié)合人工智能應(yīng)用的發(fā)展趨勢，對影響AI芯片未來發(fā)展趨勢的主要因素做出一個粗淺探討。

AI計算芯片現(xiàn)狀

目前AI芯片領(lǐng)域主要的供應(yīng)商仍然是英偉達，英偉達保持了極大的投入力度，快速提高GPU的核心性能，增加新型功能，保持了在AI訓(xùn)練市場的霸主地位，并積極拓展嵌入式產(chǎn)品形態(tài)，推出Xavier系列?；ヂ?lián)網(wǎng)領(lǐng)域，谷歌推出TPU3.0，峰值性能達到100pflops，保持了專用加速處理器的領(lǐng)先地位。同時華為、百度、阿里、騰訊依托其龐大應(yīng)用生態(tài)，開始正式入場，相繼發(fā)布其產(chǎn)品和路線圖。此外，F(xiàn)PGA技術(shù)，因其低延遲、計算架構(gòu)靈活可定制，正在受到越來越多的關(guān)注，微軟持續(xù)推進在其數(shù)據(jù)中心部署FPGA，Xilinx和Intel倆家不約而同把FPGA未來市場中心放到數(shù)據(jù)中心市場。Xilinx更是推出了劃時代的ACAP，第一次將其產(chǎn)品定位到超越FPGA的范疇。相較云端高性能AI芯片，面向物聯(lián)網(wǎng)的AI專用芯片門檻要低很多，因此也吸引了眾多小體量公司參與。

▌NVIDIA：Xavier

2018年1月，英偉達發(fā)布了首個自動駕駛處理器——Xavier。這款芯片具有非常復(fù)雜的結(jié)構(gòu)，內(nèi)置六種處理器，超過90億個晶體管，可以處理海量數(shù)據(jù)。Xavier的GMSL（千兆多媒體串行鏈路）高速IO將其與迄今為止最大陣列的激光雷達、雷達和攝像頭傳感器連接起來。

2018年3月，NVIDIA發(fā)布首款2-petaFLOPS系統(tǒng)——DGX-2。它整合了16個完全互聯(lián)的GPU，使深度學(xué)習(xí)性能提升10倍。有了DGX-2，模型的復(fù)雜性和規(guī)模不再受傳統(tǒng)架構(gòu)限制的約束。與傳統(tǒng)的x85架構(gòu)相比，DGX-2訓(xùn)練ResNet-50的性能相當(dāng)于300臺配備雙英特爾至強GoldCPU服務(wù)器的性能，后者的成本超過270美元。

自2016年首次發(fā)布TPU以來，Google持續(xù)推進，2017年發(fā)布TPU2.0，2018年3月GoogleI/O大會推出TPU3.0。其每個pod的機架數(shù)量是TPU2.0的兩倍；每個機架的云TPU數(shù)量是原來的兩倍。據(jù)官方數(shù)據(jù)，TPU3.0的性能可能是TPU2.0的八倍，高達100petaflops。

圖：TPU1&2&3參數(shù)對比圖

2018年10月，華為正式發(fā)布兩款A(yù)I芯片：昇騰910和昇騰310。預(yù)計下一年第二季度正式上市。華為昇騰910采用7nm工藝，達芬奇架構(gòu)，半精度（FP16）可達256TeraFLOPS，整數(shù)精度（INT8）可達512TeraOPS，自帶128通道全高清視頻解碼器H.264/265，最大功耗350W。華為昇騰310采用12nmFFC工藝，達芬奇架構(gòu)，半精度（FP16）可達8TeraFLOPS，整數(shù)精度（INT8）可達16TeraOPS，自帶16通道全高清視頻解碼器H.264/265，最大功耗8W。

2018年5月，寒武紀(jì)推出第一款智能處理板卡——MLU100。搭載了寒武紀(jì)MLU100芯片，為云端推理提供強大的運算能力支撐。等效理論計算能力高達128TOPS，支持4通道64bitECCDDR4內(nèi)存，并支持多種容量。1M是第三代機器學(xué)習(xí)專用芯片，使用TSMC7nm工藝生產(chǎn)，其8位運算效能比達5Tops/watt（每瓦5萬億次運算）。寒武紀(jì)1M處理器延續(xù)了前兩代IP產(chǎn)品（1H/1A）的完備性，可支持CNN、RNN、SOM等多種深度學(xué)習(xí)模型，此次又進一步支持了SVM、K-NN、K-Means、決策樹等經(jīng)典機器學(xué)習(xí)算法的加速。這款芯片支持幫助終端設(shè)備進行本地訓(xùn)練，可為視覺、語音、自然語言處理等任務(wù)提供高效計算平臺。

2017年12月，地平線自主設(shè)計研發(fā)了中國首款嵌入式人工智能視覺芯片——旭日1.0和征程1.0。旭日1.0是面向智能攝像頭的處理器，具備在前端實現(xiàn)大規(guī)模人臉檢測跟蹤、視頻結(jié)構(gòu)化的處理能力，可廣泛用于智能城市、智能商業(yè)等場景。征程1.0是面向自動駕駛的處理器，可同時對行人、機動車、非機動車、車道線交通標(biāo)識等多類目標(biāo)進行精準(zhǔn)的實時監(jiān)測和識別，實現(xiàn)FCW/LDW/JACC等高級別輔助駕駛功能。

2018年10月，比特大陸正式發(fā)布邊緣計算人工智能芯片BM1880，可提供1TOPS@INT8算力。推出面向深度學(xué)習(xí)領(lǐng)域的第二代張量計算處理器BM1682，峰值性能達3TFLOPSFP32。

BM1682的算豐智能服務(wù)器SA3、嵌入式AI迷你機SE3、3D人臉識別智能終端以及基于BM1880的開發(fā)板、AI模塊、算力棒等產(chǎn)品。BM1682芯片量產(chǎn)發(fā)布，峰值算力達到3TFlops，功耗為30W。

2018年7月，百度AI開發(fā)者大會上李彥宏正式宣布研發(fā)AI芯片——昆侖。這款A(yù)I芯片適合對AI、深度學(xué)習(xí)有需求的廠商、機構(gòu)等。借助著昆侖AI芯片強勁的運算性能，未來有望應(yīng)用到無人駕駛、圖像識別等場景中去。

▌阿里：研發(fā)Ali-NPU、成立平頭哥半導(dǎo)體芯片公司

2018年4月，阿里巴巴達摩院宣布正在研發(fā)的一款神經(jīng)網(wǎng)絡(luò)芯片——Ali-NPU。其主要用途是圖像視頻分析、機器學(xué)習(xí)等AI推理計算。9月，在云棲大會上，阿里巴巴正式宣布合并中天微達摩院團隊，成立平頭哥半導(dǎo)體芯片公司。

▌Xilinx：ACAP、收購深鑒科技

2018年3月，賽靈思宣布推出一款超越FPGA功能的新產(chǎn)品——ACAP（自適應(yīng)計算加速平臺）。其核心是新一代的FPGA架構(gòu)。10月，發(fā)布最新基于7nm工藝的ACAP平臺的第一款處理器——Versal。其使用多種計算加速技術(shù)，可以為任何應(yīng)用程序提供強大的異構(gòu)加速。VersalPrime系列和VersalAICore系列產(chǎn)品也將于2019年推出。

2018年7月，賽靈思宣布收購深鑒科技。

AI芯片發(fā)展面臨的矛盾、問題、挑戰(zhàn)

目前AI芯片發(fā)展面臨4大矛盾：圍繞這些矛盾，需要解決大量相關(guān)問題和挑戰(zhàn)。

▌大型云服務(wù)商與AI芯片提供商的矛盾

技術(shù)路線上，面向通用市場的英偉達持續(xù)推進GPU技術(shù)發(fā)展，但是大型云服務(wù)商也不愿陷入被動，結(jié)合自身規(guī)模龐大的應(yīng)用需求，比較容易定義一款適合的AI芯片，相應(yīng)的應(yīng)用打磨也比較好解決。同時，新的芯片平臺都會帶來生態(tài)系統(tǒng)的分裂。但是對于普通用戶，競爭會帶來價格上的好處。由于AI算力需求飛速提升，短期內(nèi)AI芯片市場還會進一步多樣化。

▌中美矛盾

中國依托于龐大市場規(guī)模，以及AI應(yīng)用技術(shù)的大力投資，非常有機會在AI相關(guān)領(lǐng)域取得突破。但是受到《瓦森那協(xié)議》以及近期中美貿(mào)易戰(zhàn)等因素影響，中美在集成電路產(chǎn)業(yè)層面展開了激烈的競爭。AI芯片有機會為中國帶來破局的機會，因此后期可以預(yù)期，國內(nèi)會有更多的資金投入到AI芯片領(lǐng)域。

▌專用與通用間的矛盾

云端市場由于各大巨頭高度壟斷，會形成多個相對封閉的AI芯片方案。而邊緣端市場由于高度分散，局部市場難以形成完整的技術(shù)生態(tài)體系，生態(tài)建設(shè)會圍繞主流核心技術(shù)拓展，包括ARM、Risc-V、NVDLA等。各大掌握核心技術(shù)的廠商，也會迎合這一趨勢，盡可能占領(lǐng)更大的生態(tài)份額，積極開放技術(shù)給中小企業(yè)開發(fā)各類AI芯片。

▌AI芯片創(chuàng)新與設(shè)計工具及生態(tài)之間的矛盾

以FPGA為例，學(xué)界和業(yè)界仍然沒有開創(chuàng)性的方法簡化FPGA的開發(fā)，這是現(xiàn)階段制約FPGA廣泛使用的最大障礙。和CPU或GPU成熟的編程模型和豐富的工具鏈相比，高性能的FPGA設(shè)計仍然大部分依靠硬件工程師編寫RTL模型實現(xiàn)。RTL語言的抽象度很低，往往是對硬件電路進行直接描述，這樣，一方面需要工程師擁有很高的硬件專業(yè)知識，另一方面在開發(fā)復(fù)雜的算法時會有更久的迭代周期。因此，F(xiàn)PGA標(biāo)榜的可編程能力與其復(fù)雜的編程模型之間，形成了鮮明的矛盾。近五到十年來，高層次綜合（HighLevelSynthesis-HLS）一直是FPGA學(xué)術(shù)界研究的熱點，其重點就是希望設(shè)計更加高層次的編程模型和工具，利用現(xiàn)有的編程語言比如C、C++等，對FPGA進行設(shè)計開發(fā)。

在工業(yè)界，兩大FPGA公司都選擇支持基于OpenCL的FPGA高層次開發(fā)，并分別發(fā)布了自己的API和SDK等開發(fā)工具。這在一定程度上降低了FPGA的開發(fā)難度，使得C語言程序員可以嘗試在FPGA平臺上進行算法開發(fā)，特別是針對人工智能的相關(guān)應(yīng)用。盡管如此，程序員仍然需要懂得基本的FPGA體系結(jié)構(gòu)和設(shè)計約束，這樣才能寫出更加高效的OpenCL/HLS模型。因此，盡管有不少嘗試OpenCL/HLS進行產(chǎn)品開發(fā)的公司，但是目前國內(nèi)實際能夠掌握這類設(shè)計方法的公司還是非常稀缺。各家專用AI芯片廠商，都需要建立自己相對獨立的應(yīng)用開發(fā)工具鏈，這個投入通常比開發(fā)芯片本身還要龐大，成熟周期也慢很多。Xilinx對深鑒的收購有效補充了其在AI應(yīng)用開發(fā)方面的工具短板。近期Intel開源了OpenVINO，也是在推動其AI及FPGA生態(tài)。也有少數(shù)在FPGA領(lǐng)域有長期積累的團隊，例如深維科技在為市場提供定制FPGA加速方案，可以對應(yīng)用生態(tài)產(chǎn)生有效促進作用。

面對不同的需求，AI計算力最終將會駛向何方？

主要云服務(wù)商以及終端提供商都會圍繞自家優(yōu)勢產(chǎn)品平臺發(fā)展AI芯片，云端AI芯片投入巨大，主流技術(shù)快速進化，國內(nèi)企業(yè)需要重視AI芯片的隱性投入：設(shè)計開發(fā)工具、可重用資源和生態(tài)伙伴。不過近期不大可能迅速形成整合的局面，競爭會進一步加劇。在端上，基于DSA/RISC-V的AI芯片更多出現(xiàn)在邊緣端AI+IoT，百花齊放。

三大類技術(shù)路線各有優(yōu)劣，長期并存。

GPU具有成熟的生態(tài)，在AI領(lǐng)域具有顯著的先發(fā)優(yōu)勢，目前保持高速增長態(tài)勢。

以GoogleTPU為代表的專用AI芯片在峰值性能上較GPU有一定優(yōu)勢。確定性是TPU另一個優(yōu)勢。CPU和GPU需要考慮各種任務(wù)上的性能優(yōu)化，因此會有越來越復(fù)雜的機制，帶來的副作用就是這些處理器的行為非常難以預(yù)測。而使用TPU能輕易預(yù)測運行一個神經(jīng)網(wǎng)絡(luò)并得出模型與推測結(jié)果需要多長時間，這樣就能讓芯片以吞吐量接近峰值的狀態(tài)運行，同時嚴(yán)格控制延遲。不過，TPU的性能優(yōu)勢使得它的靈活性較弱，這也是ASIC芯片的常見屬性。充分針對性優(yōu)化的架構(gòu)也可以得到最佳的能效比。但是開發(fā)一款高性能專用芯片的投入是非常高昂的，通常周期也需要至少15個月。

FPGA以及新一代ACAP芯片，則具備了高度的靈活性，可以根據(jù)需求定義計算架構(gòu)，開發(fā)周期遠遠小于設(shè)計一款專用芯片。但是由于可編程資源必不可少的冗余，F(xiàn)PGA的能效比以及價格通常比專用芯片要差很多。但是ACAP的出現(xiàn)，引入了AI核的優(yōu)點，勢必會進一步拉近與專用芯片的差距。隨著FPGA應(yīng)用生態(tài)的逐步成熟，F(xiàn)PGA的優(yōu)勢也會逐漸為更多用戶所了解。

總而言之，AI芯片的“戰(zhàn)國時代”大幕已經(jīng)拉開，各路“諸侯”爭相割據(jù)一方，謀求霸業(yè)，大家難以獨善其身，合縱連橫、百家爭鳴將成為常態(tài)。這也必定會是一個英雄輩出的時代。