本發明公開一種基于課程學習的無人機空中博弈對抗的解決方法,包含以下步驟:(1)構建仿真模擬環境;(2)收集飛行員控制飛機的真實軌跡數據,將軌跡數據按照機動動作難度進行課程目標分類;(3)對指定課程目標下的軌跡,通過模仿學習來優化策略模型生成的軌跡和專家軌跡的相似度;(4)獲得預訓練無人機策略模型;(5)基于預訓練無人機策略模型,在模擬器中創建敵我雙方無人機智能體;(6)無人機在模擬器中獲得當前時刻的觀測;(7)無人機與模擬環境進行交互,將我方與敵方無人機對抗的任務建模為一個強化學習智能體與環境交互的問題,用強化學習算法優化無人機對抗的飛行策略;(8)獲得無人機進行空中博弈對抗的有效策略。
聲明:
“基于課程學習的無人機空中博弈對抗的解決方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)