本發明公開了一種通過強化學習訓練書法機器人的方法。該方法包括:獲取目標書法作品圖片,并輸入到卷積神經網絡進行特征提取,獲得圖像預處理結果;構建深度強化學習模型,該深度強化學習模型的智能體輸出用于控制機器人書寫的指令,環境的狀態觀測量是圖像預處理結果;智能體根據輸入的狀態觀測量和獎賞,通過隨機梯度下降進行訓練,其中獎賞反映機器人書法作品和目標書法作品之間的匹配程度,并且訓練過程中,機器人書寫的書法作品也作為環境的狀態觀測量。利用本發明訓練的書法機器人不需要人類預先設置書寫動作,就能自動學習書法作品與書寫動作之間聯系,書寫出與目標書法作品匹配度更高的作品。
聲明:
“通過強化學習訓練書法機器人的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)