谷歌推出視頻數(shù)據(jù)庫 挑戰(zhàn)高難度機器視覺識別技術(shù)

時間:2017-10-23

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:谷歌在機器視覺學(xué)習(xí)方面積累大量的數(shù)據(jù)以及技術(shù),最近,他們推出了一個新的視頻數(shù)據(jù)庫,名稱為“原子視覺行為(AVA)“,該數(shù)據(jù)可由一個或多個標(biāo)簽組成,能夠推動計算機視覺識別影像中行為的研究。

谷歌在機器視覺學(xué)習(xí)方面積累大量的數(shù)據(jù)以及技術(shù),最近,他們推出了一個新的視頻數(shù)據(jù)庫,名稱為“原子視覺行為(AVA)“,該數(shù)據(jù)可由一個或多個標(biāo)簽組成,能夠推動計算機視覺識別影像中行為的研究。

說到圖像識別,其實谷歌的照片應(yīng)用就可以自動識別出寵物圖像,很多公司也在圖片識別上作出很多優(yōu)化嘗試,比如Shutterstock上周公布了一項全新的測試功能,用戶可以根據(jù)自己的布局來搜索股票照片。

相較于這些發(fā)生在靜態(tài)圖像領(lǐng)域的機器視覺識別技術(shù),應(yīng)用到視頻中的難度會更大,因為在視頻中,每一幀畫面的都包括各種復(fù)雜的場景,而且很多時候視頻中一個動作是由不同的人發(fā)出的。不過視頻識別方面的應(yīng)用現(xiàn)在也有一些案例,比如著名色情網(wǎng)站Pornhub,它可以自動對成人視頻進行分類,包括讓系統(tǒng)識別出特定的性姿勢。

谷歌的軟件工程師也解釋道,“讓機器去識別影像中的人類行為是發(fā)展計算機視覺的一大難題,盡管過去幾年在圖像分類和尋找物體方面取得了突破?!彼怨雀柰瞥隽诉@個AVA數(shù)據(jù)庫,AVA包括80多個被動作標(biāo)簽標(biāo)注的Youtube視頻網(wǎng)址,比如握手、接吻、喝酒、擁抱等等。

谷歌希望通過開放這個數(shù)據(jù)庫,進一步改進他們基于視頻識別的機器視覺能力。

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0