人工智能 在嵌入式視覺和圖像處理中的應(yīng)用

時間:2018-08-31

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:近年來,人工智能(AI)已經(jīng)成為了一種非常流行的表達方式。上個世紀是一個富有創(chuàng)新的世紀,特別是在數(shù)學(xué)方面,為實現(xiàn)人工智能帶來了希望,可是很多技術(shù)上和概念上的差距讓各種各樣的方案都胎死腹中。

【中國傳動網(wǎng) 技術(shù)前沿】 近年來,人工智能(AI)已經(jīng)成為了一種非常流行的表達方式。上個世紀是一個富有創(chuàng)新的世紀,特別是在數(shù)學(xué)方面,為實現(xiàn)人工智能帶來了希望,可是很多技術(shù)上和概念上的差距讓各種各樣的方案都胎死腹中。然而,得益于過去20年來在計算能力、數(shù)據(jù)累積、數(shù)學(xué)工具等方面取得的巨大進步,而且所有這些都能以更低的成本實現(xiàn),今天,人工智能已經(jīng)開始融入各個行業(yè)。

為了使機器能夠理解周圍的世界,科技的發(fā)展從生物學(xué)方面獲得了啟發(fā)。通過眼睛可以獲得80%的信息,使得人類可以自我定位、并且和在他們視力范圍內(nèi)的世界進行互動。

因此,大多數(shù)人工智能方面的研究都是集中在分析來自于視覺系統(tǒng)圖像的能力上。來自于生物學(xué)方面的另一個啟發(fā)是允許機器分析這些圖像的數(shù)學(xué)結(jié)構(gòu):人工神經(jīng)網(wǎng)絡(luò)、人類大腦的微型結(jié)構(gòu)復(fù)制品。

存在多種不同的神經(jīng)網(wǎng)絡(luò),主要取決于神經(jīng)元之間的連接的拓撲,所使用的聚合函數(shù)、閾值函數(shù)和反向傳播方法。這些數(shù)學(xué)方法都是人工智能領(lǐng)域的一部分,稱為“深度學(xué)習(xí)”,通常被分為兩部分:訓(xùn)練和推理。

根據(jù)要實現(xiàn)的目標不同,絕大多數(shù)的神經(jīng)網(wǎng)絡(luò)都有著種類非常多的“訓(xùn)練”算法(有監(jiān)督的或無監(jiān)督的)。算法可根據(jù)在網(wǎng)絡(luò)輸入處呈現(xiàn)的數(shù)據(jù)集修改突觸權(quán)重。訓(xùn)練的目標是使神經(jīng)網(wǎng)絡(luò)可以從示例中“學(xué)習(xí)”。

如果正確執(zhí)行訓(xùn)練,則網(wǎng)絡(luò)將提供與訓(xùn)練數(shù)據(jù)集的輸入值非常相似的輸出響應(yīng)。推理引擎是對應(yīng)于演繹推理的模擬的軟件算法,在深度學(xué)習(xí)的情況下是神經(jīng)網(wǎng)絡(luò)。該軟件通常嵌入在設(shè)備中。

在過去10年中,深度學(xué)習(xí)在許多領(lǐng)域都取得了進展。基于圖像的技術(shù)包括面部識別、虹膜和手勢監(jiān)控、對象和自由空間檢測,以及最新的行為識別。

從市場角度來看,從汽車上可以注意到最驚人的進展,因為這些用于高級駕駛輔助系統(tǒng)(ADAS)的技術(shù)被用在了檢測障礙物、識別指示牌、信號燈、汽車、行人以及其他類似的目標上。圖像來自于布置在車身及其周圍的一系列攝像頭,而訓(xùn)練是在位于數(shù)據(jù)中心的特定的計算機上進行的。對于半自動駕駛的車輛,推理算法是內(nèi)嵌在引擎控制單元(ECU)內(nèi)的,對于機器人駕駛或全自動駕駛的車輛,推理算法是完全內(nèi)嵌在計算機內(nèi)的。

生物識別技術(shù)是深度學(xué)習(xí)被廣泛使用的另一個主要部分。我們發(fā)現(xiàn)它的算法用于個人身份驗證,例如最新的智能手機很多都采用3D面部識別。在國土安全領(lǐng)域,通過專用攝像機的使用,面部識別被用于邊境控制以及身份證明文件的制作。

基于深度學(xué)習(xí)的虹膜識別也越來越多地用于移動設(shè)備的個人身份認證。未來,我們可以在這一部分中添加行為識別,雖然目前仍處于研發(fā)階段,不過所取得的初步成果已經(jīng)令人鼓舞了。深度學(xué)習(xí)已經(jīng)可以集成在手勢識別中,但目前主要集中在娛樂、車載計算機、游戲和商用無人機控制領(lǐng)域。在過去10年中,很多公司在人工智能領(lǐng)域的投資持續(xù)增加。市場研究機構(gòu)Yole預(yù)計到2025年復(fù)合年增長率將達到50%,收入主要集中在使用深度學(xué)習(xí)的技術(shù)上。

不可否認,人工智能的發(fā)展也離不開專門的硬件開發(fā)。值得注意的是,視覺處理器的設(shè)計者和研發(fā)人員還通過嵌入式操作系統(tǒng)和軟件開發(fā)工具包(SDK)提供了軟件層。

這使得實施軟件解決方案變得非常容易,而且可以讓硬件的性能發(fā)揮到最大。市場上已經(jīng)有很多專屬于平臺的開發(fā)工具包可選,例如:ARM公司的embedOS、NVIDIA公司的Jetson、Xilinx公司的XSDK以及CEVA公司的CDNN工具包。

為嵌入式系統(tǒng)開發(fā)人工智能的企業(yè),必須在開發(fā)其解決方案時考慮這個后加的軟件層,并將其設(shè)計為與不同類型的硬件兼容。隨著其發(fā)展勢頭的繼續(xù),人工智能視覺系統(tǒng)將迎來一個光明的未來,無論是硬件層面、專用處理器市場,還是軟件層面,都將有越來越強大的算法,以期在物體、面部和手勢識別方面實現(xiàn)更高的精度。

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0