時間:2020-09-20 19:49來源:戰(zhàn)術導彈技術 作者:中國通航
|
摘要:針對無人機偵察影像的目標檢測問題,研究一種基于候選區(qū)域的無人機偵察影像目標檢測技術。首先圍繞無人機影像特點,分析了基于候選區(qū)域的目標檢測技術的優(yōu)勢。然后介紹了該技術的關鍵步驟并歸納了各步驟的主流算法。最后總結了兩種較為成熟的候選區(qū)域目標檢測框架:基于DPM的候選區(qū)域目標檢測框架和基于卷積神經(jīng)網(wǎng)絡的候選區(qū)域目標檢測框架,通過對現(xiàn)有算法的分析,為下一步改進算法提供了思路。
相比于傳統(tǒng)戰(zhàn)場偵察方式,無人機偵察能夠在避免人員傷亡的情況下提供近實時的情報信息,逐漸成為一種主流的偵察手段。無人機獲得戰(zhàn)場偵察影像數(shù)據(jù)后,通過目標檢測技術處理偵察影像,實現(xiàn)對戰(zhàn)場典型目標的定位與分類,根據(jù)檢測信息,可以準確打擊敵方目標、掌握敵我部署、增強戰(zhàn)場判斷力、提高作戰(zhàn)效率。
目標檢測技術是一種基于目標幾何與統(tǒng)計特征的圖像識別分割技術。早期的算法有幀差法、背景差法、光流法等,主要利用幀間信息定位出運動目標的空間位置,不涉及對目標類別的智能分類,如需目標判讀還要添加目標識別模塊,過程繁瑣冗余。此外,無人機偵察影像相對于一般研究的目標檢測影像有自身的特殊性:
(1)成像環(huán)境惡劣、目標背景運動且復雜;
(2)目標相對背景過小,定位困難;
(3)目標特征不明顯,識別難度大;
(4)實際應用需求對算法實時性、魯棒性要求高。
因此,快速魯棒的進行無人機偵察影像目標檢測成為無人機信息處理的關鍵,而基于候選區(qū)域(Region Proposal)的目標檢測技術正符合以上要求:
(1)對單幅或單幀影像進行檢測,不受運動背景限制;
(2)候選區(qū)域檢測,縮小待計算窗口數(shù)量,運算速度快;
(3)特征提取降維與分類器相結合,識別定位的精度與速度高;
(4)整體框架簡單清晰如圖1所示,可以根據(jù)檢測要求對候選區(qū)域檢測、特征提取、分類器三個檢測階段進行變化,便于算法的改進與評估。
因此對基于候選區(qū)域的無人機偵察影像目標檢測技術進行研究具有重要意義,接下來將對其三個階段進行介紹和算法概述。
![]() 圖1 基于候選區(qū)域的目標檢測框架
1 候選區(qū)域檢測
候選區(qū)域檢測是利用圖像顏色、邊緣、紋理等特征,選擇性搜索目標位置的方法。由于目標可能出現(xiàn)在圖像的任何位置,大小、長寬比例不定,因此需要根據(jù)一定方法將圖像分割成各種尺寸的子圖像作為候選區(qū)域,便于目標定位與特征提取。
而高效的分割候選區(qū)域成為候選區(qū)域檢測階段的研究重點。傳統(tǒng)窮舉搜索(Exhaustive Search)算法也可以算作一種特殊的候選區(qū)域檢測方法,其利用幾種尺寸相對固定的矩形窗口,逐行列或隨機對整幅圖像截取子圖像,實現(xiàn)對圖像的遍歷。這種盲目窮舉的區(qū)域搜索方法時耗長、冗余大,嚴重影響整體目標檢測算法的運行速度與性能,更無法滿足無人機情報處理的實時性,因此為提高檢測效率需要一種檢測策略對區(qū)域搜索進行引導,避免復雜的運算。
現(xiàn)有的可用于候選區(qū)域檢測的算法有很多,Jan Hosang等將這些算法分為分組區(qū)域選擇法(Grouping proposal methods)和窗口評分區(qū)域選擇法(Window scoring proposal methods)兩大類。分組區(qū)域選擇法將圖像先分割成小塊,隨后按照某種原則組合成需要的候選區(qū)域。根據(jù)產(chǎn)生候選區(qū)域方式的不同,分組區(qū)域選擇法又細分為超像素法(Superpixels, SP)、像素分割法(Graph Cut, GC)和邊緣輪廓法(Edge Contours, EC)。窗口評分區(qū)域選擇法在圖像上截取大量的區(qū)域窗(Windows),并按照與目標關系的大小進行打分,選擇分數(shù)高的生成候選區(qū)域。圖2詳細描述了這種分類層次并列舉了主要算法。
![]() 圖2 主要候選區(qū)域檢測算法分類
上述算法中比較具有代表性的有:Seletive Search、Edge Boxes和MCG。
Seletive Search的主要思路是使用圖像分割算法將圖像分割成小區(qū)域,計算相鄰小區(qū)域的顏色、紋理等特征的相似度,并融合相似度最高的兩個區(qū)域,重復相似度計算和融合過程直到合成整張圖像,合成過程中產(chǎn)生的各種尺度區(qū)域即為候選區(qū)域。
Edge Boxes首先使用結構化快速邊緣檢測算法得到邊緣圖像(Edge Probability map),利用非極大值抑制(Non-maximum Suppression, NMS)稀疏邊緣圖像,然后將邊緣點組成邊緣組(Edge Group)并計算組間的相似度,進而得到框內(nèi)和與框邊緣重疊的兩組輪廓數(shù),最后根據(jù)輪廓數(shù)對區(qū)域框進行打分,根據(jù)分數(shù)確定候選區(qū)域。
MCG與Edge Boxes一樣先用結構化快速邊緣檢測算法得到邊緣圖像,利用分水嶺算法得到輪廓圖,隨后生成超度量輪廓映射圖(UCM),之后通過層次分割得到區(qū)域集并用隨機森立分類器根據(jù)尺度、位置和邊緣強度等特征對區(qū)域進行排序,進而選出符合要求的候選區(qū)域。
魯棒性(Robust)、實時性和召回率(Recall)是評價候選區(qū)域選擇方法的一般標準。無人機偵察環(huán)境復雜導致成像過程中可能存在各種擾動,因此良好的魯棒性和較高的召回率是保證區(qū)域選擇算法在實際應用中具備高質(zhì)量目標檢測效果的關鍵。同時提升區(qū)域選擇階段的運行速度,也會降低整體目標檢測過程的時耗。
|