本發明公開了基于深度強化學習的服務機器人人群感知導航方法及系統,包括:獲取智能體的可觀測狀態和不可觀測狀態;所述智能體,包括服務機器人和行人;根據智能體的可觀測狀態和不可觀測狀態,找到服務機器人在每個時間步的最優導航策略,以實現機器人在n個行人之間導航,并在沒有任何碰撞的情況下到達目標所在地;最優導航策略以滿足最大化期望累積獎賞為目標;所述最優導航策略包括服務機器人在每個時間步的動作指令,即在每個時間步服務機器人需實現的速度。本發明能夠有效預測行人的未來運動軌跡,進而提升機器人決策水平,實現機器人在人群環境中的可靠導航。
聲明:
“基于深度強化學習的服務機器人人群感知導航方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)