機器視覺技術 捕獲“深度”世界

時間:2013-07-17

來源:網絡轉載

導語:機器視覺最早應用于工業(yè)制造領域。通過機器視覺的自動識別功能,許多流水線上具有高度重復性的檢測工作都可以不再依靠人來完成,大大提高了檢測效率和精度。黃凱奇介紹,機器視覺系統(tǒng)最基本的特點就是提高生產的靈活性和自動化程度。

想記錄眼前美景?不用再掏出相機或手機,只需一句語音指令,佩戴的輕巧時尚的谷歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問路,只需將手機攝像頭對準街道,諾基亞“城市萬花筒”就能將眼前的商店、餐館和景點直接標注,覆蓋顯示在手機圖像上……這些以往多是在電影中看到的畫面,已成為普通人可以觸摸到的現(xiàn)實。機器視覺——這一“第三只眼”正以巨大的能量,改變著人們的生活和工作方式。

與人眼一決高低

“機器視覺就是用機器代替人眼來進行識別、測量、判斷等。機器視覺系統(tǒng)是通過攝像頭將拍攝對象轉換成圖像信號,然后再交由圖像分析系統(tǒng)進行分析、測量等。”中國科學院自動化研究所模式識別國家重點實驗室研究員黃凱奇博士介紹:“機器視覺是一項典型的跨學科任務,涉及到光學、計算機視覺、模式識別、機器學習、人工智能、統(tǒng)計學、認知心理學等等。”

機器視覺最早應用于工業(yè)制造領域。通過機器視覺的自動識別功能,許多流水線上具有高度重復性的檢測工作都可以不再依靠人來完成,大大提高了檢測效率和精度。黃凱奇介紹,機器視覺系統(tǒng)最基本的特點就是提高生產的靈活性和自動化程度。在一些不適于人工作業(yè)的危險工作環(huán)境或者人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺。同時,在大批量重復性工業(yè)生產過程中,用機器視覺檢測方法可以大大提高生產的效率和自動化程度。

機器視覺技術在工業(yè)領域的簡單應用示意圖

一個典型的機器視覺系統(tǒng)包括照明、鏡頭、相機、圖像采集卡和視覺處理器5個部分。由于采集卡能更加迅速地傳輸圖像到存儲器,且計算機速度不斷加快,所以在目前的機器視覺系統(tǒng)中,視覺處理器的應用逐漸減少。圖像采集卡在機器視覺系統(tǒng)中舉足輕重。比較典型的PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內置的多路開關,可連接多臺相機,能控制采集卡采用任意一個相機捕獲的信息。

伴隨著技術的發(fā)展,機器視覺的功能也在不斷擴展。黃凱奇說:“缺陷檢測是通過機器視覺手段來分析零部件信息,從而判斷其是否存在缺陷;測量是通過使用機器視覺來對考察對象的尺寸、形狀等信息進行度量;人機交互是利用機器視覺工具分析人或者其他機器發(fā)出的指令,從而實現(xiàn)對機器的操縱;環(huán)境建模是對機器周圍環(huán)境進行感知建模,比如移動機器人對路面環(huán)境進行感知建模等。”

“目前總的看來,機器視覺在工業(yè)電子以及半導體行業(yè)應用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領域的應用如電子眼也較為廣泛,其他行業(yè)如制藥中的藥品成分分析、互聯(lián)網中的視覺計算廣告、物流中的物品分揀等等,都有機器視覺應用的影子。”黃凱奇說。

機器視覺——這“第三只眼”已在多個領域展現(xiàn)出了比人眼更強大的功能。黃凱奇表示:“機器視覺利用好了完全可以比人做得更好,因為不同的人在觀看時,信息得不到充分和及時的交流,主觀性也很強。而機器視覺不僅計算功能強大,而且獲取的信息通過協(xié)同分析后得到的知識會具有‘極高’的價值,尤其在其更趨于智能化之后。”

捕獲“深度”世界

在現(xiàn)實生活中,我們越來越需要更多的三維模型來實現(xiàn)對物體或環(huán)境的全面掌握。“獲得三維模型有兩種基本方式,一種是利用激光掃描儀,一種是拍攝照片。但激光掃描儀的成本高,也有可能會對樣本帶來一些損害。第二種方式的成本小,而且在精度上也跟激光掃描儀相差無幾,因此成為了現(xiàn)在研究的一個熱點。”中國科學院自動化研究所模式識別國家重點實驗室副研究員高偉博士一邊展示他們的三維重建照片,一邊介紹。

高偉說,一般的圖像上是沒有長度、距離等深度信息的,而三維模型則能更加全面、精確地記錄環(huán)境,可以直觀呈現(xiàn)物體的位置、距離、姿態(tài)等。高偉所在的機器人視覺團隊研究開發(fā)的中國古代建筑全自動三維重建系統(tǒng),能夠實現(xiàn)全自動三維建模,即從底層圖像處理到生成最終的三維模型,全部自動實現(xiàn),無需人工交互。它對圖像的拍攝方式也無特殊約束和限制,只需手持自由拍攝即可。在精度上,也與激光掃描精度相當,精度小于3cm/100米,通過配備更高像素數量的相機和長焦鏡頭還可以實現(xiàn)毫米級重建。

此外,在實時定位與在線三維重建方面,機器視覺也具有極大的應用潛力。高偉介紹了通過機器視覺在手機上增強現(xiàn)實的原理,即將手機上攝像頭讀取的視頻作為輸入,通過初始化、特征點提取、動態(tài)模板特征點匹配、幾何變化計算階段后得到視頻每一幀中感興趣區(qū)域的位置。諾基亞手機的“城市萬花筒”就是一個應用實例。

高偉所在團隊在視覺信息處理上的突出創(chuàng)新能力,不斷吸引著國際大企業(yè)前來合作。“我們現(xiàn)在就正與諾基亞公司進行合作,共同研究實時定位和在線三維重建。目前,我國基于機器視覺的三維重建技術在國際上可以說處于領先地位,應用也是比較廣泛的。”高偉說:“除了以上介紹的,還能用在一些不太適合人工作業(yè)的環(huán)境監(jiān)測方面,像對露天煤礦的監(jiān)測,就是通過無人機對煤礦進行全方位拍攝,生成三維模型來實時監(jiān)測礦山的變化。此外,也能應用于城市規(guī)劃、數字媒體、三維試衣、牙模制造等多方面。”

由于單純依靠圖像信息很難實現(xiàn)快速、稠密的三維重建,高偉所在團隊也在深入研究將多種傳感器信息相互融合進行三維重建的方法。目前,他們已開發(fā)出了利用單目視覺同步定位與地圖創(chuàng)建技術以及微軟公司的Kinect設備(微軟公司開發(fā)的應用于Xbox360主機的周邊外設,集成一個彩色攝影機、一個紅外攝像機和一個紅外投影機)的全自動場景快速重建系統(tǒng)。這一系統(tǒng)對單幀視頻圖像的處理時間小于50毫秒,可重建出稠密的三維點云,能廣泛應用于多種室內場景,使用者可以隨意自由拍攝。

互動“大數據”時代

在備受關注的美國政府公布的“大數據研發(fā)計劃”(BigDataResearchandDevelopmentInitiative)中包含一個旨在為機器建立視覺智能的Mind'sEye項目。該計劃稱,傳統(tǒng)的機器視覺研究的對象選取廣泛的物體來描述一個場景的屬性名詞,而Mind'sEye旨在增加在這些場景的動作認識和推理需要的知覺認知基礎。總之,這些技術可以建立一個更完整的視覺智能效果。

由此可見,走在信息科技前沿的美國已對機器視覺與大數據時代的互動關系先知先覺。黃凱奇指出:“大數據時代最樸素也是最深刻的特點就是‘大’。統(tǒng)計學中的大數定律指出,當隨機事件或者試驗在大量重復出現(xiàn)的條件下,往往呈現(xiàn)幾乎必然的統(tǒng)計特性。確切地說,大數定律是以確切的數學形式表達了大量重復出現(xiàn)的隨機現(xiàn)象的統(tǒng)計規(guī)律性。對于依賴數據規(guī)律的機器視覺算法來講,大數據無疑為人們進一步發(fā)現(xiàn)人類的認知機理,實現(xiàn)更加魯棒[魯棒是Robust的音譯,也就是健壯、強壯、堅定、粗野的意思。魯棒性(robustness)就是系統(tǒng)的健壯性]的機器視覺算法提供了可能。另一方面,隨著機器視覺系統(tǒng)更加魯棒穩(wěn)定,更加智能,它在收集、分析、處理海量信息方面也將發(fā)揮更加重要的作用。簡言之,機器視覺一邊借大數據之利不斷發(fā)展,一邊又靠技術的完善而反哺大數據時代,形成一個良性的互動。”

然而,這種互動要想真正建立,還需要加強技術和產業(yè)的雙輪驅動。“國外在上世紀80年代就已出現(xiàn)大量的機器視覺產品,而我國機器視覺技術的應用始于90年代末。雖然在過去10年有了長足的發(fā)展,但目前絕大部分還處于追趕狀態(tài),一個是技術上的積累與創(chuàng)新跟國外相比還存在較大差距。另外一個是國內在應用創(chuàng)新上也存在不足,很多都是跟隨國外的應用案例或者通過代理相關產品來實現(xiàn)模仿應用等。”黃凱奇表示。

目前,機器視覺在交通等多個領域的應用仍相對單一,存在著多層面阻礙其進一步產業(yè)化發(fā)展的因素。黃凱奇分析說,首先在魯棒穩(wěn)定的機器視覺系統(tǒng)方面,因為機器視覺技術涉及眾多學科,需要不同學科協(xié)同創(chuàng)新才能突破目前發(fā)展的技術瓶頸。再一個就是標準方面,目前大部分廠家為了自身的短期局部利益都各自開發(fā)封閉的設備、協(xié)議、系統(tǒng),這對整個行業(yè)的發(fā)展極為不利。“如何破除這種封閉狀態(tài)的弊端,制定行業(yè)統(tǒng)一開放標準是促進機器視覺行業(yè)形成大格局、大產業(yè)的必經之路。”黃凱奇說。

“還有一點原因,就是關于機器視覺剛需的創(chuàng)造。我國是一個典型的勞動力密集國家,大部分行業(yè)依靠的是低廉的大量富余勞動力。而機器視覺與自動化息息相關,因此如何一方面有效解決就業(yè)問題,另一方面又高效推進機器視覺相關自動化產品設備的推廣使用,是政府部門、企業(yè)需要面對的問題。”黃凱奇表示。

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.treenowplaneincome.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯(lián)網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0