技術名稱 新冠病毒的前期擴散預測
計畫單位 國立中山大學
計畫主持人 彭昭暐
技術簡介
這項研究提出基於區域的模型來預測流行病的嚴重程度。經緯度數據處理方法可以保留更多資訊,經緯度壓縮特徵可以在很大程度上保留氣候信息。在對數據進行預處理後,通過本研究提出的深度學習架構對傳染性進行預測,該架構是包括Convolutional Neural Networks (CNN),Long Short-Term (LSTM)和Autoencoder的混合架構,該架構的名稱是AL-CNN。結果表明,AL-CNN可以有效預測COVID-19的擴散模式和生長模式。過去,許多研究僅預測感染個體的總數,而關於預測每個區域感染個體數量的研究則相對較少。本研究中使用的數據由約翰霍普金斯大學系統科學與工程中心(JHU CSSE)收集。這些數據得到了ESRI Living Atlas團隊和約翰霍普金斯大學應用物理實驗室(JHU APL)的支持。此數據記錄確診的COVID-19病例數,死亡人數和康復次數。在這項研究中,我們需要處理的數據是美國大陸確診的COVID-19病例數。在這項研究中,根據COVID-19確診數將各地區分為六個級別。級別1為0表示0確診,級別1表示確診病例≥1和<100,級別2表示確認病例≥100和<1000,級別3表示確診病例≥1000和<5000,級別4表示確診病例≥5000和<10,000,級別5表示確診病例≥10,000確診病例。本研究中考慮的區域是美國大陸。因此,本研究考慮的區域是北緯25度至49度,西經70度至130度。在預處理過程中,整個區域沿經度分為256個相等的網格,沿緯度分為128個相等的網格,如圖1所示。AL-CNN是本研究評估的主要深度學習架構。AL-CNN的結構如圖2所示。在AL-CNN中獲得的PSNR和SSIM訓練平均值大於在Convolutional Autoencoder (CAE)中獲得的相應值。儘管AL-CNN具有更複雜的神經網絡,但與CAE相比,它顯示出的過擬合程度較小。在表1中,所有指標的平均值表明AL-CNN具有比CAE更好的預測能力。本研究中使用的AI在預測流行等級方面顯示出很高的準確性。因此,這一預測可以幫助調整防疫政策。該模型可以提供更多信息來觀察區域擴散反應。
科學突破性
流行病學的房室模型(SIR)模型在流行病學和醫學領域是一種公認的預測方法。但使用SIR模型來預測COVID-19的傳染性,存在手動干預的問題。手動調參是數據科學所不樂見的。我們通過使用CNN,LSTM和Autoencoder的混合架構預測美國大陸的COVID-19流行等級。
產業應用性
本研究中使用的模型結構在預測流行水平方面顯示出很高的準確性。在本次的疫情期間,有許多國家面臨無法下達防疫政策的困境。以往的疫情預測皆是大範圍(周、月、年),而非以日計的方法進行預測。我們認為以天數的方法進行預測是比較精準且可以即時進行政策調整。以日為單位的疫情預測是本研究的一大突破。
關鍵字 自動編碼器 卷積神經網絡 嚴重急性呼吸系統綜合症冠狀病毒2 冠狀病毒病 深度學習 長短期神經網路 機器學習 預測 傳播 流行病學
  • 聯絡人
  • 高奕昕
其他人也看了