技術(shù)頻道

娓娓工業(yè)
您現(xiàn)在的位置: 中國(guó)傳動(dòng)網(wǎng) > 技術(shù)頻道 > 技術(shù)百科 > 機(jī)器視覺中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析

機(jī)器視覺中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析

時(shí)間:2018-01-08 11:20:54來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):?視覺不論對(duì)生物界還是人類,都起到了至關(guān)重要的作用。隨著人工智能浪潮的大勢(shì)來襲,包括機(jī)器視覺、計(jì)算機(jī)視覺等在內(nèi)的智能視覺也在人工智能領(lǐng)域逐步扮演著越來越重要的角色。

視覺不論對(duì)生物界還是人類,都起到了至關(guān)重要的作用。隨著人工智能浪潮的大勢(shì)來襲,包括機(jī)器視覺、計(jì)算機(jī)視覺等在內(nèi)的智能視覺也在人工智能領(lǐng)域逐步扮演著越來越重要的角色。

智能視覺涉及心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識(shí)別、神經(jīng)生物學(xué)等諸多領(lǐng)域,主要指利用計(jì)算機(jī)來模擬人或再現(xiàn)與人類有關(guān)的某些智能行為的技術(shù),客觀的來說,這是從事物的圖像中提取信息進(jìn)行處理并加以理解,從而最終用于實(shí)際的生產(chǎn)生活中去的過程。

由此可見,圖像分析是智能視覺中最為重要的一環(huán)。圖像分析與圖像處理關(guān)系密切,兩者有一定程度的交叉,但是又有所不同。

圖像分析更側(cè)重點(diǎn)在于研究圖像的內(nèi)容,包括但不局限于使用圖像處理的各種技術(shù),它更傾向于對(duì)圖像內(nèi)容的分析、解釋、和識(shí)別;而圖像處理側(cè)重于信號(hào)處理方面的研究,如圖像對(duì)比度的調(diào)節(jié)、圖像編碼、去噪以及濾波的研究。

圖像分析和計(jì)算機(jī)科學(xué)領(lǐng)域中的模式識(shí)別、計(jì)算機(jī)視覺關(guān)系更密切一些。概括地說,圖像分析一般利用數(shù)學(xué)模型并結(jié)合圖像處理的技術(shù)來分析底層特征和上層結(jié)構(gòu),從而提取具有一定智能性的信息。

圖像分析要求我們?nèi)祟惤虝?huì)計(jì)算機(jī)識(shí)別物品,我們把一類物品的大量圖片丟給計(jì)算機(jī),讓計(jì)算機(jī)去識(shí)別它,然后我們根據(jù)不同物品的不同特點(diǎn)建立簡(jiǎn)單的幾何模型,比如一些矩形、三角形、圓形等的組合,從而讓計(jì)算機(jī)更好地識(shí)別出不同物品。

然而,實(shí)際操作的結(jié)果與上述的原理出現(xiàn)了很大的偏差,因?yàn)樵诂F(xiàn)實(shí)世界中同種物品也大多有著不同的形態(tài)。比如一個(gè)杯子,它的形狀可以是圓柱狀的、立方體的、不規(guī)則形狀的等等,如果按照上述的原理進(jìn)行圖像分析的話,那我們需要為所有杯子設(shè)計(jì)出對(duì)應(yīng)的模型來教給計(jì)算機(jī)如何去識(shí)別“杯子”這一生活中簡(jiǎn)單的物品,顯然這是不可能完成的任務(wù)。

所以后來,科學(xué)家們從孩子們學(xué)習(xí)的過程中獲得了靈感。孩子的父母在教育孩子認(rèn)識(shí)“杯子”的時(shí)候并沒有告訴孩子如何去構(gòu)建一個(gè)杯子的幾何模型,孩子們學(xué)會(huì)認(rèn)識(shí)“杯子”是什么物品是依靠經(jīng)驗(yàn)來學(xué)習(xí)的。于是,科學(xué)家們用機(jī)器學(xué)習(xí)的方式來處理這個(gè)問題,而其中很重要的技術(shù)在于“卷積神經(jīng)網(wǎng)絡(luò)”。

“卷積神經(jīng)網(wǎng)絡(luò)”是一個(gè)多層的神經(jīng)網(wǎng)絡(luò),與其他深度學(xué)習(xí)網(wǎng)絡(luò)最大的區(qū)別是擁有可以與二維數(shù)據(jù)直接卷積操作的卷積層。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)是能夠直接與圖像像素進(jìn)行卷積,從圖像像素中提取圖像特征,這種處理方式更加接近人類大腦視覺系統(tǒng)的處理方式。

卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)可以分為四個(gè)部分:輸入層、卷積層、全連接層和輸出層。在利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分析的過程中,首先將圖片分解為部分重復(fù)的小區(qū)域,卷積神經(jīng)網(wǎng)絡(luò)中的小神經(jīng)元集合與輸入圖像的一個(gè)小區(qū)域相連,也就是相當(dāng)于把每一個(gè)小區(qū)域都輸入到神經(jīng)網(wǎng)絡(luò)中來識(shí)別。

這樣做的好處是集合有重疊的平鋪開來,網(wǎng)絡(luò)中的每一層都重復(fù)同樣的過程,所以網(wǎng)絡(luò)能夠容忍輸入圖像的一定程度上的變形。然后對(duì)輸入的圖像鄰域進(jìn)行卷積處理得到圖像的鄰域特征圖,再通過池化技術(shù)將小鄰域內(nèi)進(jìn)行下采樣過程從而得到新的特征。

如此一來,我們就將一個(gè)圖片縮減成了較小的序列,最后我們?cè)賹⑦@個(gè)數(shù)列輸入到另外的一個(gè)“完全連接”神經(jīng)網(wǎng)絡(luò)中,這個(gè)網(wǎng)絡(luò)決定圖片是否匹配。所以整個(gè)過程經(jīng)過卷積化、最大池化、“完全連接”神經(jīng)網(wǎng)絡(luò),結(jié)合實(shí)際問題我們可以決定卷積、最大池化的次數(shù),卷積層增多有助于識(shí)別更加復(fù)雜的特征,調(diào)用最大池化函數(shù)有助于縮小數(shù)據(jù)大小。近年來卷積神經(jīng)網(wǎng)絡(luò)在圖像分析領(lǐng)域得到了廣闊的應(yīng)用。

隨著科技的高速發(fā)展,視覺智能領(lǐng)域的圖像分析過程也越來越充滿挑戰(zhàn)性,卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)解決了傳統(tǒng)處理方式中出現(xiàn)的問題。

伴隨著人工神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,人工智能的視覺智能在未來將更加高效、準(zhǔn)確,不斷進(jìn)步的圖像分析過程也將為人工智能的發(fā)展帶來巨大優(yōu)勢(shì),因此,我們絕對(duì)有理由相信,未來的人工智能將不斷為人類帶來驚喜。

標(biāo)簽:

點(diǎn)贊

分享到:

上一篇:機(jī)器視覺的粗糙度檢測(cè)方法有...

下一篇:為什么機(jī)器視覺技術(shù)是實(shí)現(xiàn)流...

中國(guó)傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.treenowplaneincome.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

網(wǎng)站簡(jiǎn)介|會(huì)員服務(wù)|聯(lián)系方式|幫助信息|版權(quán)信息|網(wǎng)站地圖|友情鏈接|法律支持|意見反饋|sitemap

中國(guó)傳動(dòng)網(wǎng)-工業(yè)自動(dòng)化與智能制造的全媒體“互聯(lián)網(wǎng)+”創(chuàng)新服務(wù)平臺(tái)

網(wǎng)站客服服務(wù)咨詢采購(gòu)咨詢媒體合作

Chuandong.com Copyright ?2005 - 2024 ,All Rights Reserved 版權(quán)所有 粵ICP備 14004826號(hào) | 營(yíng)業(yè)執(zhí)照證書 | 不良信息舉報(bào)中心 | 粵公網(wǎng)安備 44030402000946號(hào)