本發明提供一種基于DRL的四足機器人路徑規劃方法,首先通過四足機器人自帶的RGB?D相機對環境進行預掃描,基于柵格法對運動環境進行建模得到環境地圖,進而分解為一系列具有二值信息的柵格單元,得到初始狀態,將其作為深度卷積神經網絡的輸入,引入注意力機制優化網絡結構以解決深度強化學習DQN算法未能很好利用關鍵局部信息的問題;通過端對端訓練,結合四足機器人的運動特點設置獎勵函數,利用置信區間上界探索策略對神經網絡進行訓練,得到四足機器人所能夠執行的八個動作的Q值;最后運用人工勢場算法不斷探測環境中的動態障礙物并進行實時避礙,實現有效的四足機器人路徑規劃。
聲明:
“基于DRL的四足機器人路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)