本發明公開了一種基于自然語言處理的地質表頭歸并方法及裝置,所述方法包括獲取地質表頭文本原始數據,對地質表頭文本原始數據進行預處理;將所述預處理過的地質表頭文本原始數據轉化為包括詞編號和詞的詞表,再利用所述詞表將地質表頭文本原始數據轉化為詞編號序列;將所述詞編號序列輸入預先建立的基于長短期記憶神經網絡的表頭歸并模型,經過所述表頭歸并模型的嵌入層、LSTM層后輸出特征向量;使用softmax對所述特征向量計算,得出地質表頭文本所屬標簽類別的概率,輸出表頭文本的類別預測結果,本發明能夠統籌地質表頭文本數據集的局部和全局文本特征,具備良好的準確性和穩定性,有效提升地質表頭文本類別預測的效果。
聲明:
“基于自然語言處理的地質表頭歸并方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)