本申請提供一種基于深度強化學習的認知無線網絡動態頻譜接入方法,包括:對預先提出的動態頻譜接入問題進行建模和分析;預先構建雙深度強化學習網絡模型;根據第一深度強化學習網絡模型,獲取系統模型中次用戶基于動態頻譜接入策略的所有動態頻譜接入動作的Q值;各個次用戶選擇Q值最優狀態下次用戶的動態頻譜接入動作;根據選擇的次用戶的動態頻譜接入動作選擇第二深度強化學習網絡模型的目標Q值;計算損失函數,通過最小化損失函數訓練雙深度強化學習網絡模型,并更新雙深度強化學習網絡模型的權重。本申請滿足多用戶多信道認知無線網絡中大狀態動作空間的高計算需求,利用過去觀測來預測現實狀態,加快收斂速度并提高預測精度。
聲明:
“基于深度強化學習的認知無線網絡動態頻譜接入方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)