時間:2020-07-08 15:30來源:無人機 作者:中國通航
|
MICA項目對多UAV協同作戰的多項關鍵技術進行研究,其研究目標是探索新的監視和控制手段(即自主協同控制方法)以使人能更好地參與到戰場管理過程中,實現相對較少的操作人員對大規模無人作戰平臺編隊的控制。其研究課題包括協同任務分配、無人機路徑規劃、多機協同跟蹤、編隊控制等多個方面,參與團隊主要來自麻省理工學院、加州伯克利大學等。WASM項目則多以UAV廣域搜索與打擊任務為背景,采用分層控制與優化的手段對多機協同控制進行研究,并在研究過程中建立一個MultiUAV協同控制仿真平臺。
從這些研究項目可以看出,多無人機系統控制涉及軟硬件機器整合等多個方面,其中一個核心課題就是多無人機協同任務規劃問題,它直接決定在各個UAV個體間進行工作任務分配和如何執行,以在多種復雜因素影響下最大化系統效率。目前國內外已經有大量多個UAV協同任務規劃問題為主題的學術論文。
在任何對多無人機協同任務規劃的研究中,首先必須明確其研究的任務背景是什么,再根據該任務背景要求進行進一步的分解和細化,形成無人機可以完成的工作,進而根據任務指標并考慮某些因素進行問題建模與求解。協同任務規劃問題以多UAV系統總體性能最大化或代價最小化為指標,其一般形式為將若干工作指派給多個UAV執行。因為現實中存在著極其多樣化的任務背景以及復雜的影響因素,目前存在的任務規劃方法無不是針對特定的任務背景進行研究。
由于多無人機協同任務規劃問題的復雜性,一般采用分層控制(Hierarchical control)的方式將其分解成為決策層、協調層、執行層等若干個子問題,再對這些子問題進行求解,從而降低解決這個復雜問題的難度。如Boskovic,J.D.等人提出將任務規劃問題分解成決策層(decision making layer)、路徑規劃層(path planning layer)、軌跡生成層(trajectory generation layer)、內環控制層(inner-loop control layer)等4個層次,其中:決策層負責多UAV系統頂層的任務決策、避障、沖突消解、任務分配和指標評估等;路徑負責任務執行中的運動規劃,生成航路點,以引導UAV規避威脅、障礙等;軌跡層則負責根據UAV的狀態、輸入和初始條件等,為UAV生成通過航路點的可飛路徑;控制層則保證UAV準確的沿著生成的軌跡飛行,并進行一定的冗余管理以降低干擾等因素的影響。Tsourdos,A.等人則從UAV協同路徑規劃的角度講任務規劃的層次結構分為機群協同任務規劃與分配層、機群協同路徑規劃層、單機控制層等三個層次。這些研究表明,這類分層控制的思路可以很好的梳理和降低多UAV協同決策與控制中的復雜性,是解決該問題的有效手段。
有了分層控制的思路之后,需要對多機系統任務規劃問題進行建模與求解。從數學角度(運籌學,Operationgs research)看,該問題屬于一類復雜的組合優化問題,需要對多UAV集群內各個成員進行任務指派和資源分配。對該優化問題進行建模與求解的方法有很多種,大致可以分為集中式和分布式兩類,兩者各有千秋。從發展的時間早晚來說,集中式的發展要早于分布式,但由于分布式相對而言在動態、不確定的場景下和實時性要求等方面的適用性更廣泛,對它的研究熱情有大漲之勢。
(1)集中式任務規劃方法(Centrilized control)
特點是在系統中存在著一個中心節點,由這個中心節點完成整個系統的任務指派和調度、協調等工作,無人機僅充當任務執行者的角色。在集中式的處理過程中,問題建模和求解這兩個方面有著較為清晰的界限。
將多UAV協同任務規劃問題抽象成組合優化問題的形式,需要借助圖論(graph theory),把問題參與者,包括無人機和任務對象(如地面目標)等,抽象成圖(graph)的節點(vertex),而一個UAV以某種狀態對一個對象執行任務的過程則抽象成圖的邊(edge),再引入二元決策變量,把這個復雜的規劃問題刻畫成一個有向圖(directed graph)的形式。實際上不管集中式還是分布式方法都存在著這樣一個問題抽象的過程。
然后,可以采用現有的方法對該問題進行建模,并使用某種合適的搜索算法(search algorithm)對這個有向圖搜索以確定最優解。
現在已經存在多種集中式任務規劃建模方法,包括多旅行商問題(Multiple Travelling Salesman problem,mTSP)、車輛路由問題(Vehicle Routing Problem,VRP)、網絡流(Network Flow Optimization,NFO)模型、混合整數線性規劃(Mixed-Integer Linear Programming,MILP)等。前兩種模型一般用于處理單一任務的多UAV協同,如協同搜索任務等,在建模過程中可以考慮問題的時間相關約束,如時間窗約束等。在處理多任務時,如確認/攻擊/毀傷評估一體化任務,設定為只對目標位置訪問一次的mTSP和VRP模型則變得不太好用。此時,NFO和MILP模型相對更適用些。
NFO模型在早期對廣域搜索彈藥(WASM)問題的研究中使用較多。該方法以無人機為網絡中的供貨商,需要執行的任務(可能是對地面目標的確認、打擊、毀傷評估等任務)為物流,而把對無人機執行某項任務的指派決策當做雪球,無人機對應決策的執行代價或收益則作為貨物在網絡中流動的成本,基于圖論建立網絡流模型。優化目標則是網絡流量總代價最小。
MILP模型應該是目前使用較廣泛的集中式任務規劃方法,在WASM、SEAD(Suppression of Enemy Air Defense,敵方防控火力壓制)等問題中均能建立較合適的模型。該方法屬于網絡流模型的自然拓展,其在建模過程中引入了兩種類型的決策變量:二元決策變量和連續決策變量。這兩類變量的使用,讓MILP方法能處理更管飯的任務規劃與調度問題,可以考慮更復雜的約束,如時間、資源等,本質上講就是使任務規劃模型與一般意義上的組合優化問題更接近了。
在NFO和MILP模型的基礎上,Shima,T.等人總結并建立了被稱為“協同多任務分配問題”(Cooperative Multiple Task Assignment Problem,CMTAP)的組合優化模型。CMTAP模型采用圖論描述方法,以多UAV系統對多個地面目標協同執行受時序優先級的約束的確認(classify)、攻擊(attack)和毀傷評估(verify)等三種任務為任務場景,考慮了時間、資源、可飛路徑馮多想約束。該模型能較好的描述多UAV協同任務規劃問題,基于它稍作改動即可適用于廣泛的應用場景。
理論上講,在建立任務規劃模型后,可以選擇很多種搜索算法進行求解,如廣度優先搜索(breadth-first search)、深度優先搜索(depth-first search)、Dijktra算法、Bellman-Ford算法等確定性的圖搜索算法,分支定界(branch and bound)、動態規劃(dynamic programming)等優化算法,以及遺傳算法(genetic algorithm,GA)、粒子群優化算法(particle swarm optimization,PSO)、禁忌搜索(tabu search)、模擬退火(Simulated Annealing)等啟發模式隨機搜索算法。
采用前兩類算法的好處是可以保證能夠找到問題的最優解,而且由于已經存在大量成熟的商業軟件如CPLEX等,可以直接使用它們而大大減少研究人員的工作量。在處理簡化問題時,它們因窮遍整個解空間而能獲得問題的最優解,但隨著問題規模的增長,解空間的尺寸也指數級膨脹,遍歷所搜的計算量迅速增大,要窮遍整個解空間可能變得不顯示。這就是多UAV協同任務規劃問題的NP-hard特性。
|