本發明提供了一種自動駕駛決策方法,包括:獲取車輛周圍的環境感知信息;根據環境感知信息和預設的地圖文件,進行決策,生成多個決策節點;通過第一模型計算每個決策節點的輸出,生成第一決策結果;通過第二模型計算每個決策節點的輸出,生成第二決策結果;根據環境預測信息,分別計算第一決策結果的第一收益和第二決策結果的第二收益;比較第一收益和第二收益,并將收益值高的對應的決策結果作為目標決策結果。由此,避免產生“維度爆炸”現象,并且可以直觀反映各個階段的決策結果,充分結合了規則方法和強化學習方法各自的優勢,在某個場景的決策結果不一致時能夠快速定位問題,實現兩個模型的相互促進和共同提升。
聲明:
“自動駕駛決策方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)