本發明公開了一種基于SHAP值構建可解釋的XGBoost回歸模型加速發現高PCE的N?P類有機敏化劑的QSPR方法及系統,建立數據集樣本;切分分子片段;Chem3D優化分子;生成描述符;隨機劃分訓練集和測試集;利用SHAP嵌套XGBoost篩選變量,選出XGBoost建模的最優變量子集;用XGBoost回歸建立N?P類有機敏化劑的快速預報模型;根據建立的模型,快速預報測試集染料分子的PCE。根據SHAP反饋的對目標特征的影響和參考文獻解釋描述符,對應分子片段的結構,構建QSPR模型;python生成大量虛擬樣本,利用建好的XGBoost模型進行預報。本發明基于可靠的文獻真實值和建模方法,所建的N?P類有機敏化劑的XGBoost預報模型具有方便快捷,無化學污染的優點。
聲明:
“基于SHAP值構建可解釋的XGBoost回歸模型預測PCE的QSPR方法及其系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)