傳動網 > 新聞頻道 > 技術前沿 > 資訊詳情

計算機視覺與最前沿技術如何結合?

時間:2019-04-18

來源:云棲社區(qū) 虎說八道

導語:計算機視覺軟件正在改變行業(yè),使用戶的生活變得不僅更容易,而且更有趣。作為一個有潛力的領域,計算機視覺已經獲得了大量的投資。北美計算機視覺軟件市場的總投資額為1.2億美元,而中國市場則飆升至39億美元。

計算機視覺軟件正在改變行業(yè),使用戶的生活變得不僅更容易,而且更有趣。作為一個有潛力的領域,計算機視覺已經獲得了大量的投資。北美計算機視覺軟件市場的總投資額為1.2億美元,而中國市場則飆升至39億美元。

讓我們來看看一些最有前途和更有趣的技術,因為這些技術可以讓計算機視覺軟件開發(fā)市場增長的更快。

深度學習的進步

深度學習因其在提供準確結果方面而廣受歡迎。

傳統(tǒng)的機器學習算法盡管很復雜,但其核心仍然非常簡單。他們的訓練需要大量的專業(yè)領域的知識和數據(這是昂貴的),在訓練發(fā)生錯誤時需要進行人為干預,而且,他們只擅長于他們接受過訓練的任務。

另一方面,深度學習算法通過將任務映射為概念層次結構的神經元網絡了解手頭的任務。每個復雜的概念都由一系列更簡單的概念組合定義,而所有這些算法都可以自己完成。在計算機視覺的背景下,圖像分類需要首先識別亮區(qū)和暗區(qū),然后在移向全畫面識別之前對線進行分類,然后進行形狀分類。

1555468906593199.png 

當你為他們提供更多數據時,深度學習算法也會表現得更好,這是典型的機器學習算法做不到的。對于計算機視覺,深度學習是一個好的方向。它不僅允許在深度學習算法的訓練中使用更多的圖片和視頻,而且還減輕了許多與注釋和標記數據相關的工作。

零售業(yè)一直是實施計算機視覺軟件的先驅。2017年,ASOS在為他們的應用添加了一個按照照片搜索的選項,之后許多零售商都跟進了。有些人甚至更進一步,并使用計算機視覺軟件將在線和離線體驗更緊密地結合在一起。

一家名為Lolli&Pops的美食糖果零售商使用面部識別來識別經常走進商店的購物者。因此,商店的員工可以通過提供個性化的產品推薦和千人千面的折扣來個性化購物體驗。

特殊待遇可以提升品牌忠誠度,并將偶爾的購物者轉變?yōu)榻洺P再徫镎摺?/p>

邊緣計算的興起

連接到互聯(lián)網和云的機器能夠從整個網絡收集的數據中學習并相應地進行調整,從而優(yōu)化系統(tǒng)的性能。但是,并不能保證機器能夠始終連接到互聯(lián)網和云,這就是邊緣計算的用武之地。

邊緣計算是指附接到物理機器的技術,例如燃氣輪機,噴氣發(fā)動機或MRI掃描儀。它允許在收集數據的地方處理和分析數據,而不是在云中或數據中心。

邊緣計算不能取代云。它只是允許機器在需要時單獨處理新的數據。換句話說,邊緣的機器可以根據自己的經驗學習和調整,而不依賴于更大的網絡。

邊緣計算解決了網絡可訪問性和延遲的問題。在邊緣計算的發(fā)展下,設備可以放置在網絡連接不良或不存在的區(qū)域,此外,邊緣計算還可以抵消用于數據共享的云計算的使用和維護的一些成本。

對于計算機視覺軟件,這意味著可以實時更好地響應,并且只將相關數據發(fā)送到云中進行進一步分析,此功能對自動駕駛汽車特別有用。

為了安全運行,車輛將需要收集和分析與其周圍環(huán)境,方向和天氣狀況有關的大量數據,更不用說與路上的其他車輛通信,所有這些都沒有延遲。如果通過云中心化的解決方案來分析數據可能很危險,因為延遲可能導致事故。

點云(pointcloud)對象識別

最近在對象識別和對象跟蹤中更頻繁使用的技術是點云。簡而言之,點云是在三維坐標系內定義的數據點的集合。

該技術通常在空間(例如房間或容器)內使用,其中每個對象的位置和形狀由坐標列表(X,Y和Z)表示,坐標列表稱為“點云”。

 1555468924966380.png

該技術準確地表示了物體在空間中的位置,并且可以精確地跟蹤任何移動。點云的應用是無止境的。以下是一些行業(yè)的例子以及他們從這項技術中獲得的好處:

記錄:資產監(jiān)測,跟蹤施工現場,故意破壞檢測;

分類:城市規(guī)劃,審計工具,便于分析,繪制必要的公用事業(yè)工作

變更檢測:資產管理,貨物跟蹤,自然災害管理。

預測性維護:持續(xù)監(jiān)控資產和基礎設施,以預測何時需要維修。

融合現實:VR和AR增強

今天,任何VR或AR系統(tǒng)都會創(chuàng)建一個沉浸式3D環(huán)境,但它與用戶所處的真實環(huán)境幾乎沒有關系。大多數AR設備可以執(zhí)行簡單的環(huán)境掃描(例如,Google

ARCore可以檢測平面和光線條件的變化),VR系統(tǒng)可以通過頭部跟蹤,控制器等檢測用戶的運動,但他們的功能也就這樣了。

計算機視覺軟件正在推動VR和AR進入下一階段的開發(fā),有些人稱之為MergedReality(MR)。

借助外部攝像頭和傳感器映射環(huán)境,以及眼動跟蹤解決方案和陀螺儀來定位用戶,VR和AR系統(tǒng)能夠:

1、感知環(huán)境并引導用戶遠離墻壁,物品或其他用戶等障礙物。

2、檢測用戶的眼睛和身體運動并相應地采用VR環(huán)境。

3、提供室內環(huán)境,公共場所,地下等的指引。

Lowe's五金店已在他們的商店中使用它,每個購物者都可以借用AR設備來制作他們的購物清單,并獲得商店中每件商品的指示。AR設備可以實時使用樓層平面圖,庫存信息和環(huán)境映射以給出準確的指示。

我們也可以通過實時3D面部識別功能更新虛擬藝術家應用程序,讓客戶可以看到不同的化妝產品在他們的臉上和不同光線條件下的外觀。

語義實例分割

為了理解語義實例分割是什么,讓我們首先將這個概念分為兩部分:語義分割和實例分割。

實例分割在像素級別識別對象輪廓,而語義分割僅將像素分組到特定對象組。讓我們使用氣球圖像來說明與其他技術相比的兩種技術:

1555468944898366.png 

分類:此圖像中有一個氣球;

語義分割:這些都是氣球像素;

物體檢測:此圖像中有7個氣球,我們開始考慮重疊的對象;

實例分割:這些位置有7個氣球,這些是屬于每個氣球的像素;

如果放在一起,語義實例分割方法將成為一個強大的工具。該工具不僅可以檢測屬于圖片中對象的所有像素,還可以確定哪些像素屬于哪個對象以及對象所在的圖片中的位置。

語義實例分割是土地覆蓋分類的有用工具,具有各種應用。通過衛(wèi)星圖像進行的土地制圖可以用于政府機構監(jiān)測森林砍伐(特別是非法),城市化交通等。

許多建筑師事務所也將這些數據用于城市規(guī)劃和建筑開發(fā),有些人甚至更進一步將其與AR設備相結1合,以了解他們的設計在現實生活中的樣子。


中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.treenowplaneincome.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯(lián)網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯(lián)系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0