
美國一些計算機科學研究人員表示,此前已開始對Twitter用戶所發(fā)布同流感有關(guān)的信息加以匯總分析,然后據(jù)推斷出哪些地區(qū)有可能爆發(fā)流感,以便政府部門及醫(yī)療機構(gòu)能夠拿出應對措施。早在2008年,谷歌曾推出了其著名的流感趨勢網(wǎng)站。
Twitter流感信息來源分布示意圖(騰訊科技配圖)
該網(wǎng)站假定的前提是:如果用戶患上了流感,則他們會搜索更多同流感相關(guān)的信息。如此一來,如果對任何一個國家或地區(qū)有關(guān)流感的搜索量進行統(tǒng)計,就能較好推斷出某個國家或地區(qū)是否正爆發(fā)流感。
事實上,谷歌的這項統(tǒng)計數(shù)據(jù)被證實很有效。谷歌的相應數(shù)據(jù),同美國疾病控制與預防中心(CDC)等政府機構(gòu)所統(tǒng)計的數(shù)據(jù)非常接近。在某些情況下,谷歌甚至能夠比CDC提前一周預測出哪些地區(qū)將爆發(fā)流感。這種預測的重要意義不言而喻:如果能夠提前預測可能出現(xiàn)的流行疾病,政府部門就能及時向公眾發(fā)出提醒以及采取其他應對措施。
由此人們也就提出了另外一個很有意思的問題:其他網(wǎng)絡(luò)服務尤其是社交媒體,是否也能像谷歌搜索那樣預測流感甚至預測效果更好?今天我們已經(jīng)獲得了相應答案:美國卡內(nèi)基梅隆大學研究人員李繼偉(音譯:Jiwei Li)以及康奈爾大學研究人員克萊爾·卡迪(Claire Cardie)通過對相應Twitter信息加以匯總和分析,就能成功推斷哪些地區(qū)出現(xiàn)了流感爆發(fā)的初期癥狀。
李繼偉和卡迪的數(shù)據(jù)統(tǒng)計及分析方式,其實與谷歌的統(tǒng)計方法有很多類似之處。他們對Twitter數(shù)據(jù)流加以過濾,只留下與流感相關(guān)的信息,并為這些信息加上地理位置標簽。通過這種方式,這兩位研究人員就能創(chuàng)建出一幅流感爆發(fā)地區(qū)地圖,以顯示相關(guān)流感Twitter信息來自哪兒,以及這些信息在一定時間段內(nèi)的變化情況。
這兩位研究人員還為流感爆發(fā)創(chuàng)建了一個動態(tài)模式,并提供了一些很有意思的細節(jié)內(nèi)容。在這個新模式中,流感爆發(fā)可分為四個階段:尚未爆發(fā)期、感染人員數(shù)量增長期、感染人群數(shù)量穩(wěn)定期和感染人員數(shù)量下降期。
這種新型方式,還試圖提前預測出流感從一個地區(qū)轉(zhuǎn)向另一個地區(qū)的趨勢。為測試這種方法的有效性,李繼偉和卡迪共統(tǒng)計了360萬條同流感相關(guān)的Twitter信息,涉及用戶約100萬,信息發(fā)布時間在2008年6月到2010年6月之間。在得出相應分析結(jié)果后,他們將分析結(jié)果同CDC的相應數(shù)據(jù)進行了對比。李繼偉和卡迪說:“我們的研究表明,Twitter的流感信息同CDC提供的流感爆發(fā)數(shù)據(jù)之間呈高度正相關(guān)性。”
由此看來,李繼偉和卡迪的上述最新研究方式,無疑為公眾應對流感提供了另一條有效工具,它能夠使我們提前預測到某個地區(qū)流感即將到來。如果將這些預測同谷歌流感趨勢、CDC的相應預測進行對比,無疑也將是件很有意思的事情。
全球每年約10%~15%的人群會患上流感,受感染人群約5000萬人,死亡人數(shù)約50萬。這可不是個小數(shù)字。如果我們能夠盡早提前預測到流感即將爆發(fā),無疑將使全球公眾都將受益:政府和醫(yī)療機構(gòu)提前拿出應對措施,就能挽救大量生命。
推薦閱讀
科學家們在對火星東半球的高原和山地壓力數(shù)據(jù)進行研究時,發(fā)現(xiàn)了能證>>>詳細閱讀
本文標題:研究人員利用Twitter數(shù)據(jù)流來預測流感爆發(fā)
地址:http://www.xglongwei.com/a/05/20131014/290571.html