為何軟件是人工智能加速器致勝的秘密?

時間:2019-03-25

來源:網(wǎng)絡(luò)

導(dǎo)語:隨著Arm生態(tài)系統(tǒng)的發(fā)展壯大,各種各樣的應(yīng)用場景層出不窮。為了更好地在特定場景下得到更好的性能,能耗比等指標(biāo),針對特定應(yīng)用場景的加速器市場也在蓬勃發(fā)展,近年來火熱的人工智能加速器(Artificial Intelligence Accelerator)就是一個典型例子。

隨著Arm生態(tài)系統(tǒng)的發(fā)展壯大,各種各樣的應(yīng)用場景層出不窮。為了更好地在特定場景下得到更好的性能,能耗比等指標(biāo),針對特定應(yīng)用場景的加速器市場也在蓬勃發(fā)展,近年來火熱的人工智能加速器(ArtificialIntelligenceAccelerator)就是一個典型例子。

一個高效的加速器,需要精心設(shè)計的硬件以及與之搭配的軟件,兩者缺一不可,否則用戶體驗會大打折扣,這也是為什么我們常常看到某些指標(biāo)非常驚艷的加速器,在實際使用中體驗卻不盡如人意的原因。以人工智能加速器為例,其中基本的硬件加速單元就是乘加器的組合,但如何讓這些乘加器高效地進行并行計算,涉及到上層數(shù)據(jù)的打包、調(diào)度,需要大量的驅(qū)動軟件工作,而且大部分軟件開發(fā)者都是基于某種框架進行應(yīng)用開發(fā),具體見圖1,所以驅(qū)動到框架的適配也很重要,甚至有一些框架不能滿足應(yīng)用的需求,需要專門開辟通道進行優(yōu)化。

人工智能

圖1:ArmNPU軟硬件框架

開發(fā)一款高性能加速器,需要投入大量人力物力,如果不能大規(guī)模使用,那么投入回報比會大大降低,甚至虧本。如果加速器能和不同Arm系統(tǒng)輕松組合,拓展Arm系統(tǒng)的應(yīng)用范圍,那么應(yīng)用場景將會大大增加,生命周期也會延長。讓加速器適配不同的Arm系統(tǒng),這對軟硬件接口和驅(qū)動提出了非常大的挑戰(zhàn),因為今天的Arm產(chǎn)品非常豐富,從低功耗的微處理器,主流的移動平臺,到高端的服務(wù)器,高性能計算處理器都有相應(yīng)產(chǎn)品。對于一個加速器團隊來說,針對盡可能多的Arm配置組合進行開發(fā)驗證成本將非常高昂,這里面不單單涉及IP/EDA的采購,還有系統(tǒng)的搭建維護,但如果沒有這些IP又無法將整個業(yè)務(wù)流程完整驗證,甚至影響軟硬件接口的設(shè)計優(yōu)化。

有沒有方法高效地解決加速器配套驅(qū)動,框架,應(yīng)用軟件開發(fā)的問題呢?FastModel!

人工智能

圖2:使用DS-5調(diào)試運行在FastModel中的系統(tǒng)軟件

在FastModel的例子系統(tǒng)中,Arm給出了一系列Arm核,相關(guān)IP組合的子系統(tǒng)模型,以及相應(yīng)OS,開發(fā)工具DS-5,方便客戶快速搭建軟件開發(fā)平臺,調(diào)整軟硬件接口,進行驅(qū)動以及上層軟件的開發(fā),具體參考圖3。

整個開發(fā)流程如下:

1.在FastModel的例子系統(tǒng)中找到你需要的平臺,和對應(yīng)的Bootloader,Firmware,OS軟件,并將他們順利運行

2.將FastModel的子系統(tǒng)導(dǎo)出生成SystemC的模型子系統(tǒng)模塊

3.編寫加速器的功能模型,通過AMBAPV總線和FastModel導(dǎo)出的子系統(tǒng)模塊進行連接

4.編寫驅(qū)動在目標(biāo)OS中操作加速器

5.在模型平臺上進行軟件框架,應(yīng)用匹配移植

Arm提供了絕大部分市面可見設(shè)計的類似子系統(tǒng),無論是基于Armv7/v8單核,多核,多cluster系統(tǒng),還是包含最新架構(gòu)特性的CPU系統(tǒng),加速器開發(fā)團隊都可以在FastModel的例子程序里面找對類似子系統(tǒng)范例進行適配,在設(shè)計之初就可以解決不同系統(tǒng)的適配性問題。FastModel也提供工具讓開發(fā)者對例子系統(tǒng)進行修改,生成新的子系統(tǒng)以滿足需要。在加速器設(shè)計之初,軟件硬件人員就可以一起利用豐富多樣的例子系統(tǒng)進行架構(gòu)的探索,對穩(wěn)定軟硬件接口非常有幫助,而穩(wěn)定的接口定義對長期的產(chǎn)品演進至關(guān)重要。

人工智能

圖3:基于FastModel的加速器軟件開發(fā)

至此開發(fā)者已經(jīng)完成了大部軟硬件接口,驅(qū)動以及框架軟件開發(fā)工作,但驅(qū)動中的時序問題還沒有完全解決,因為FastModel是一款功能型模型,它為了提高運行速度(50-200MHz),犧牲了時序信息。對于時序信息,開發(fā)者可以最后去仿真平臺甚至最終芯片上去調(diào)節(jié),而此時軟件測試用例和框架都已經(jīng)完成,這將大大節(jié)省占用仿真平臺(MHz)進行調(diào)試排錯的時間,從而降低成本。

聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請及時聯(lián)系我們刪除(QQ: 2737591964,不便之處,敬請諒解!

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0