技術名稱 基於深度學習語言模型之閱讀測驗自動化生成研究
計畫單位 國立中興大學
計畫主持人 范耀中
技術簡介
本技術為一個基於深度學習之自然語言生成(Natural Language Generation)模型,其可於閱讀檢測應用中按任意指定情境產生語法流暢之自然語句。此技術之完成可大幅遞減低出版業或行銷業務於閱讀檢測中之編輯人力成本。目前模型產生之問句品質已達人工產生問句品質。具體而言我們的自然語言生成模型以一篇短文(Context Passage) C與一短語(Phrase) A為輸入,進行問題語句自動生成(Question Sentence)輸出問句Q。目前所提出的學習架構已應用於中文與英文語句之生成,皆具良好之效果。目前模型可於http://140.120.13.249:3000進行實測(可即時輸入當日新聞文章生成即時問題題組)。

本技術著手商業化與落地試驗於以下兩情境:
1. 結合 Querator AI語言生成、OCR(圖像文字辨識)、NER(命名實體識別)技術,推出自動生成題目之隨需訂閱制服務。服務可依據文本自動產生符合需求的題目,以解決當前企業與教育單位的出題人力成本問題。同時題目可建檔管理、利用模板編輯成考卷匯出,亦可依照相同的考卷內容,自動產生出不同難易度的考卷,達到客製化、快速自動出題的效果,以增加出題之執行效率,更解決對不同難易度的需求。目前與戴爾美語洽談合作開發中。

2. 使用 Querator AI 自動語言生成技術搭配協同過濾(Collaborative Filtering)演算法,推出一套 AI 個人化的英語學習平台。透過英業達集團Dr. Eye 所提供的歷史用戶英語能力數據,以利對用戶進行初步的英語等級分析計算,並收集用戶學習行為之反饋訊息,推測出用戶感興趣文章領域與陌生之詞彙,透過這三種資料(英語等級、興趣文章、陌生詞彙)挑選出符合用戶之文章內容與詞彙進行個人化題組生成,產生更為細緻的個人化學習,達到提升學習意願與效率的目標。目前系統的Prototype可於https://youtu.be/vl_5HdcuS8Q 觀看
科學突破性
目前模型產生之問句品質已達人工產生問句品質。於實驗驗證中我們使用SQUAD2.0閱讀理解資料集。我們生成模型之品質為目前相關研究中最佳之研究結果。也基於此一技術,我們進一步衍生不同類型之問題類型研究:諸如多選題錯誤選項之生成,多選題摘要類型答案選項等相關生成技術。
產業應用性
目標市場:教育產業與出版產業,並形塑教育科技(EdTech)產業之發展
現行機制:現有閱讀檢測模式,主要仰賴人工方式產生問句與試題或題庫方式具有速度慢、成本高的缺點
重塑機制:自動化出題技術可輔助教師或編輯提升效率與教學品質,並且輔助相關產業達成客製化教學
關鍵字 自然語言生成技術 個人化學習 教材自動化生成 外語學習 多益考題生成 協同式過濾 教育科技 自然語言處理 編輯自動化 深度學習應用
  • 聯絡人
  • 范耀中
其他人也看了