本發明公開了一種基于多智能體強化學習的衛星觀測分布式在線規劃方法,所述方法包括:步驟1)為衛星觀測網絡中的每個衛星建立星上執行網絡;步驟2)建立集中訓練網絡,通過多次地面仿真對所有星上執行網絡進行集中訓練;步驟3)通過星地通信將訓練好的星上執行網絡分別上傳到對應的衛星,或者在發射前將訓練好的星上執行網絡注入對應的衛星;步驟4)當地面或者在軌衛星發現機遇觀測目標時,向衛星觀測網絡廣播觀測任務;步驟5)各衛星分別使用星上決策模型對是否接受該觀測任務進行決策;根據各自的決策結果,控制衛星實施觀測任務。本發明提出了考慮時間覆蓋度的自注意力網絡決策方法,提升了衛星間的決策協同性和訓練時策略梯度傳遞效率。
聲明:
“基于多智能體強化學習的衛星觀測分布式在線規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)