計算機視覺是以攝像頭或相機作為人的眼睛,以電腦或其他計算平臺作為人的大腦來模擬人的視覺感知與行為決策。
視覺目標跟蹤就是利用計算機視覺技術來模擬人眼的跟隨行為,比如跟隨行人、車輛、寵物等感興趣目標,從而輔助視頻監(jiān)控、行為分析等更高級別任務。
對感興趣目標的跟蹤是人類乃至動物的本能,如草叢中蟄伏的獵豹通過雙眼牢牢地鎖定著落單進食的羚羊,緊緊地跟蹤著羚羊的一舉一動,不斷地預估著羚羊的位置和動態(tài),等到時機成熟瞬間啟動開始捕獵,并不斷調(diào)整將羚羊牢牢鎖定在視野中。
生活中大人在照看孩童玩耍時,大人的目光也會一直關注在孩童身上,以防出現(xiàn)跌倒或走失的意外情況。
然而,相比人或動物的大腦,計算機處理的智能水平還處于非常初級的階段,因此視覺目標跟蹤對于計算機視覺來說是一個非常難以解決的問題。
目標外觀特征的模糊性及運動場景的復雜性給跟蹤帶來諸多挑戰(zhàn),如目標尺寸各異、運動軌跡復雜、視覺特征多樣、光照陰影變化、背景噪聲雜亂等。同時,視覺目標跟蹤在民用和軍事方面都有著非常重要的應用,如智能交通、安防監(jiān)控、視覺導航、機器人操作、虛擬現(xiàn)實、軍事制導等方面。
目前,國外的卡內(nèi)基梅隆大學、加州大學默塞德分校、天普大學、蘇黎世聯(lián)邦理工學院、林雪平大學、盧布爾雅那大學等高校及機構在視覺目標跟蹤領域處于前沿引領地位。
同時,國內(nèi)中科院自動化所、大連理工大學、商湯科技公司、微軟亞洲研究院、安徽大學等學校及機構均在頂級會議期刊以及國際權威比賽中取得了出色的成績,不斷縮小國內(nèi)外在該領域的研究差距。
無人機對地跟蹤、虛擬現(xiàn)實和增強現(xiàn)實中的手勢跟蹤、機器人第一視角跟蹤都是非常好的應用場景。比如在公安刑偵場景,無人機可以利用視覺目標跟蹤技術對嫌疑人及車輛進行空中鳥瞰視角跟蹤,輔助地面監(jiān)控平臺,實現(xiàn)對嫌疑人的追蹤和抓捕。同時,大疆公司的民用無人機可以利用視覺目標跟蹤技術來實現(xiàn)無人機跟蹤拍照,在大型活動典禮、私家聚會婚禮等場合都能夠提供新型視頻展示素材,豐富現(xiàn)代宣傳和展示的多樣性。
在虛擬現(xiàn)實和增強現(xiàn)實場景,智能眼鏡可以利用其前置攝像頭對用戶的手勢進行精確定位和跟蹤,反饋用戶的操作行為,從而實現(xiàn)虛擬感知和控制。
此外,新冠肺炎疫情的突發(fā)使得無人配送或非接觸配送應用在未來變得潛力巨大,其中視覺目標跟蹤技術將為無人機器人裝上通往現(xiàn)實的眼睛,使得機器人有可能像人類一樣具有自主跟蹤感興趣目標的能力。
視覺目標跟蹤以攝像頭或相機模擬人的眼睛,利用計算機視覺技術處理攝像頭拍攝的圖像序列,持續(xù)地跟蹤到感興趣目標,捕捉其運動軌跡。
復雜現(xiàn)實環(huán)境條件下的魯棒視覺目標跟蹤已成為計算機應用領域亟需突破和亟待解決的重要問題。從科學研究上講,視覺目標跟蹤對于機器學習模型的結(jié)構性、判決性、魯棒性及在線更新等研究方面具有重要的推動作用。從應用角度講,開展視覺目標跟蹤研究將為智能監(jiān)控、無人駕駛、軍事國防、虛擬現(xiàn)實等方面的應用提供具體的方法支撐。其中,魯棒性著重強調(diào)跟蹤模型和算法,要具有處理復雜目標和場景變化的能力,在真實復雜環(huán)境中能做到長時間的不跟丟感興趣目標。
近十年來,大連理工大學IIAU科研團隊針對跟蹤中的魯棒目標外觀建模等關鍵問題,圍繞面向視覺跟蹤問題的稀疏表示理論模型及方法、時空結(jié)構化描述理論模型及方法、深度神經(jīng)網(wǎng)絡模型及方法等方面開展了深入探索和研究,提出了一系列有效的跟蹤模型和算法。
與此同時,IIAU團隊也在多家企業(yè)開展了諸多預研工作,為企業(yè)提供原型模型和算法,供企業(yè)進行后續(xù)研發(fā)落地,幫助企業(yè)做前沿技術儲備等。未來該團隊更加著力于視覺目標跟蹤技術的應用落地,推動相關行業(yè)領域應用的發(fā)展。
【免責聲明】本文轉(zhuǎn)載自網(wǎng)絡,與科技網(wǎng)無關。科技網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。