技術名稱 | 神農GPT:具高可擴充性之農業知識檢索與問答系統 | ||
---|---|---|---|
計畫單位 | 國立中興大學 | ||
計畫主持人 | 吳俊霖 | ||
技術簡介 | 神農GPT是由中興大學開發的知識問答系統,專為農業問題設計,結合文件檢索、萃取式閱讀理解和生成式語言模型實現精確查詢。此模型避免了現有生成模型的Hallucinations問題,確保生成的回答都基於真實文獻,大幅降低不正確資訊的生成。神農GPT使用基於農業文獻訓練的問句生成模型強化其閱讀理解能力;同時,它還採用Inverse Cloze Task和Pseudo Question Learning機制訓練其文獻檢索功能。不同於傳統的生成模型,神農GPT先進行文獻檢索和閱讀理解取得答案,再利用生成模型進行答案的統整,既降低了運作成本,也提高了查詢效率,且提供答案的來源和解釋。 |
||
科學突破性 | 神農GPT主要基於萃取式閱讀模型,能從文本中找出問句的答案。由於現有模型對農業文獻的處理有侷限,我們針對此進行了優化:透過自製的問句生成技術增加資料,並由農業專家標注答案片段,專門訓練農業文獻的閱讀模型。同時,我們引入干擾選項生成技術強化閱讀理解能力。這些技術在EMNLP Finding 2023和ACL Finding 2023兩大研討會上有所發表。 |
||
產業應用性 | 神農GPT是一易用的農業知識查詢系統,適合農民和農業專家。神農GPT架構具有高度可擴充性,只要加入新的農業文獻,無需重新訓練檢索模型就能強化知識庫。目前已存有13,000多篇文獻,已有初步效果顯著。隨文獻的增加,知識的廣度和深度也將提升。這套構建問答系統的方法也可應用於其他知識領域,如生醫或人文領域。 |