本發明提出了一種基于深度強化學習的軟件智能升級方法及裝置。所述方法包括:采集軟件運行參數以及用戶操作參數,并確定所述軟件運行參數以及用戶操作參數下軟件的基準升級時間點;根據所述軟件運行參數以及用戶操作參數,利用策略網絡給出預測的升級時間點,將預測的升級時間點和所述基準升級時間點的差值作為強化學習的獎勵,并將獎勵作為策略網絡的標簽值,通過訓練得到訓練好的軟件智能升級模型;獲取軟件實時運行參數和用戶操作參數,傳入訓練好的軟件智能升級模型,得到當前升級時間點的可信值,并根據可信值判斷是否進行升級。本發明基于強化學習和深度學習,實現軟件系統的智能升級時機預測,極大地提高軟件升級效率。
聲明:
“基于深度強化學習的軟件智能升級方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)