Mon Jan 27 2025 23:53:00 GMT+0000 (Coordinated Universal Time)

港大學者帶領國際研究團隊 利用大數據準確預測新冠肺炎傳播規律

港大帶領的國際研究團隊提出一種嶄新方法,採用人口流動數據,準確預測新冠肺炎傳播的規律,並建立風險評估模型,可於早期識別出傳播新冠肺炎的高風險地區,有助公共衛生專家及各國政府盡早實施傳染病防控措施。

由香港大學(港大)帶領的國際研究團隊提出一種嶄新方法,採用人口流動數據,準確預測新型冠狀病毒肺炎(新冠肺炎)傳播的規律,並建立風險評估模型,可於早期識別出傳播新冠肺炎的高風險地區,有助公共衛生專家及各國政府盡早實施傳染病防控措施。研究結果4月29日於國際權威學術期刊《自然》刊登。

研究論文的第一作者、港大經濟及工商管理學院市場營銷學副教授賈軾博士及其研究團隊,使用由內地一家主要流動電訊商提供的全國人口流動數據,追蹤在2020年1月1日至24日,即内地農曆新年春運大規模人口流動至武漢封城期間,總共超過1100萬人次從武漢或經由武漢轉往至內地31個省和區的296個地級市的人口流動情況。

利用實時數據分析人口流動

有別於一般傳統依賴歷史數據或假設性的流行病學模型,研究團隊使用的是人口實際流動的實時數據,分析整體人口流動,而不是追蹤個人活動。流動人口數據包括在研究期間於武漢停留2小時或以上的所有手機用戶。由於研究僅使用大數據,並沒有使用任何個人數據,因此不存在隱私問題。

賈博士的研究團隊將人口流動數據與截至2020年2月19日在內地的新冠肺炎確診病例的數量作比較,發現疫症爆發中心(武漢)流出的人口數量跟全國各地區新冠肺炎病例數目和地理分布有直接相連關係。研究人員發現,該模型可以從統計學上解釋了新冠肺炎在全國分布96%的情況。

基於以上分析,研究團隊構建了新的風險檢測模型。利用人口流動數據,研究人員根據從疫症爆發中心轉往其他地方的人數,建立了疫情的「預期增長模式」。團隊透過將病例的預期增長與內地每個城市的確診病例的實際數量進行對比,從而建立了一種疫情社區傳播風險指數。

圖1.隨時間變化的預期病例與實際確診數目(版權: 《自然》學術期刊) 我們的模型包含了2020年1月1日至24日從武漢流出的人口數量,為新冠肺炎的傳播提供參考增長模式(即流動曲線)。在確診病例中預測和實際確診增長的差異較大者可能意味着有較嚴重的社區傳播。
圖1.隨時間變化的預期病例與實際確診數目(版權: 《自然》學術期刊) 我們的模型包含了2020年1月1日至24日從武漢流出的人口數量,為新冠肺炎的傳播提供參考增長模式(即流動曲線)。在確診病例中預測和實際確診增長的差異較大者可能意味着有較嚴重的社區傳播。

「如果確診病例比預期多,則顯示社區傳播的風險較高。如果確診病例比預期少,則意味着該市的預防措施特別有效,但也有可能該市數據有欠準確,需要進一步關注或調查跟進。」賈博士解釋說。

「我們創新之處在於使用了預測和實際的差異來識別那些地區有高社區傳播風險。我們建立的模型,在獲得武漢流出人口資料的情況下,可以準確地預測這批人所轉到的地區應有多少預期病例。只要將這一點與已確認的案例進行對比,就可以推算出該地的社區傳播情況,這也是我們建立的風險模型的邏輯。」他補充說。

這方法的優點是我們僅需要人口流動及分布的資訊,便可作出推算,毋需依賴任何關於病毒如何傳播的假設或知識,也不用擔心數據報告不準確。任何政府和有關部門掌握了上述數據,便可使用來進行快速、準確的風險評估,在新疫症擴散之前計劃怎樣更有效地分配有限的資源。

圖2.使用模型分析新冠肺炎社區傳播風險的說明示例 (版權:《自然》學術期刊) 我們的模型使用人口流動來預測預期病例。 SARS-CoV-2病毒的預測傳播可以用作基準,以識別哪些區域是「異常值」,哪些區域比預期的多或少(根據移動數據)。圖表說明了我們的模型在1月29日所顯示的情況。虛線左側的城市是異常個案,其確診病例明顯多於預期,即無法解釋或社區傳播率較高。我們的模型在2020年1月29日確定溫州為社區傳播風險最嚴重的地區。政府在2020年2月2日宣布對該地份進行全面檢封。
圖2.使用模型分析新冠肺炎社區傳播風險的說明示例 (版權:《自然》學術期刊) 我們的模型使用人口流動來預測預期病例。 SARS-CoV-2病毒的預測傳播可以用作基準,以識別哪些區域是「異常值」,哪些區域比預期的多或少(根據移動數據)。圖表說明了我們的模型在1月29日所顯示的情況。虛線左側的城市是異常個案,其確診病例明顯多於預期,即無法解釋或社區傳播率較高。我們的模型在2020年1月29日確定溫州為社區傳播風險最嚴重的地區。政府在2020年2月2日宣布對該地份進行全面檢封。

「我們的研究證明,人口流量相對其他指標,如人口規模、財富或與疫症中心的距離等,能更準確地預測疫症的嚴重程度。」賈博士說。

賈博士目前正與研究人員探討將該模型應用於其他國家或地區的可行性,以及進一步研究,把模型擴展應用到存在多個疫情爆發中心的情況。團隊繼續尋求其他國際團隊及國家機構,例如國家電訊營運商及其他數據合作夥伴,作進一步研究。

今次研究項目的共同作者包括賈建民(香港中文大學(深圳)、深圳市人工智能與機器人研究院)、Nicholas A. Christakis (耶魯大學)、呂欣(國防科學技術大學)、袁韻 (西南交通大學)及徐戈(湖南工商大學)。