伊波拉病毒是魔鬼,會讓患者口吐內臟組織、七竅流血而死亡,死亡率更是高達70%。在西非爆發的伊波拉病毒迄今為止已經奪走了超過4000條生命。正當緊急救護小組,醫療慈善機構和非政府組織奮力於控制該病毒的時候,大數據分析能否提供幫助呢?越來越多的數據科學家給予肯定的答案。
移動地圖
在一個其他可靠資源都嚴重匱乏的地區,移動手機被證明是大量數據的可靠來源,因為即便是在非洲最貧窮的國家,移動手機也被廣泛擁有。奧林奇(Orange)電信公司在塞內加爾向弗洛明德(Flowminder, 一個瑞典的非營利組織)移交了從150,000部手機裡提取的匿名語音和短信信息,此後弗洛明德根據這些信息繪製了該區域的典型人口遷移的詳細地圖。
那麼當局就可以從中看到建立治療中心的最佳的地方在哪裡,也可以知道在哪限制旅遊是最有效的控制疫情的方式。然而這些數據的缺陷在於它們是歷史性數據,而當局需要的是能夠實時反映人口流動情況,因為人口的遷移是會根據疫情的改變而改變的。
這也是為什麼美國疾病控制和預防中心(CDC)也從移動運營商那兒收集移動通訊基站的活動數據,從中找出那些打求助熱線最多的地方。
一個地區求助熱線呼叫次數的激增將意味著疫情的爆發,同時這一信息也將提醒當局調動更多的資源前往該地。
地圖軟件公司艾思銳(Esri)正幫助美國疾病控制和預防中心(CDC)可視化這些數據,並且覆蓋現有的人口調查數據源來建立一個更豐富的可視化數據畫面。根據移動通信基站的活動程度,他們繪製的熱點地圖可以清晰地反映出人們在哪,以及更關鍵的,他們正遷移去哪兒,已經遷移了多遠。
「我們在之前從來沒有過這樣大規模的,不具名的手機數據作為一個信息種類,」西班牙電信公司的科學主任紐瑞奧利弗(Nuria Oliver)說道。 「最積極的影響是,我們可以幫助緊急救援機構和政府預測疾病可能會如何蔓延。」
「在這之前,他們不得不依靠零星的信息,如實地調查,警方和醫院的報告。」移動手機也再次被證明是傳達健康訊息的一個理想又有效的方式。
霍亂的經驗教訓
這種手機數據的分析,已經成功應用到其他衛生危機事件。
例如,在2010年,海地地震發生後,瑞典卡羅琳學院和美國哥倫比亞大學的一個聯合研究小組分析了來自加勒比運營商Digicel海地網絡的兩百萬台移動電話呼叫的數據。
這使得聯合國和其他人道主義機構在救災行動和隨後的霍亂疫情中理解和掌握人口的流動,這意味著他們可以更有效地分配資源,並找出在新的霍亂暴發中風險增加的區域。
1500萬部手機的數據分析也被用於反映和預測在肯尼亞瘧疾的傳播。
但奧利弗女士坦言:「移動數據永遠只能幫助我們了解事態的一部分。」
大數據分析能否提供有效性度量?
專家們認為,為了得到一個更全面的了解,我們需要更多的數據源,並具備快速地分析這些數據的能力。
「大數據分析是關於匯集許多不同的數據源,並挖掘數據從而找到模式。」 埃森哲健康衛生諮詢總監弗朗西斯戴爾(Frances Dare)說,「我們的數據來源於衛生診所和醫生的報告,媒體報導,社交媒體上的評論信息,公共衛生工作者在實地獲得的信息,零售商和藥房的交易數據,旅遊門票購買數據,熱線電話數據,以及地理空間的跟踪數據。」
英國BAE 系統公司智能及安全部門首席技術官彼得榮格(Peder Jungck)認為,這樣的分析也可以用來衡量遏制疫情的政策,教育宣傳和治療手段是否有效。
「例如,醫生可以通過分析高風險人群的社交媒體數據集從而得知佔多少比例的人正在採取適當的預防措施以減少疾病的傳播,以及佔多少比例的人忽略了預防提醒。對於伊波拉,研究大數據集的分析師也可以分析潛在的衛生挑戰,以及局部環境因素例如天氣是否對疾病傳播速度有影響。
跨境傳播
在這個旅行全球化的時代,病毒的跨境傳播比以往更加容易,尤其是對於伊波拉這種具有21天潛伏期的病毒。歐洲和美國都因此處於高度戒備狀態,並且在一些機場實施排查。
但是至少在數字化時代,追踪那些潛在的病毒攜帶者要比以往容易得多。 「港口,火車站和機場的數據,以及車牌識別技術,都可以幫助追踪潛在的病毒攜帶者,並且確定他們可能已經接觸過哪些人。」大數據分析公司Qlik的醫療部門主管DavidBolton這樣說到。他已經開發了一個伊波拉追踪APP。
通過社交媒體預測流行病趨勢
通過社交媒體和搜索引擎上的動態數據,分析師們預測流行病趨勢也表現的越來越好。
雖然通過人們使用的關鍵搜索詞的頻率來預測可能的感冒病毒爆發的谷歌流感趨勢已經被證明是不可靠的,但與此同時,用到了範圍更廣的數據集的其他方法則得到了更大的成功。
例如,商業諮詢公司埃森哲,大數據專業公司SAS和美國北卡羅萊納大學說他們預測的美國2012-13年度的流感季要比CDC(疾病預防控制中心)的正式警告提前三個月發布。
「通過分析社交媒體,比如博客,網絡論壇和推特,我們可以發現公共安全事件的早期預警信號。」埃森哲的Frances Dare這樣說到。
「在2013年,我們把表明流感症狀的關鍵詞的數目減少為152個,標記出哪些地方這些關鍵詞正在被使用,並且在官方數據公佈之前兩個月預言了一場流感爆發。」
尋找治療手段?
Datamonitor Healthcare首席諮詢師蒂姆甘布爾(Tim Gamble) 相信,大數據分析還可以幫助理解病毒遺傳學特性, 比如為何某些種類的病毒更為致命,為何某些人對病毒更有抵抗力。他曾任職於專注傳染性疾病研究製藥的美國製藥公司Pfizer。他說,「在很多人開始死於艾滋病之前,針對HIV逆轉錄病毒的治療並未出現。 我曾參與Pfizer的HIV產品研發工作,我們發現斯堪的納維亞的一些人比其他人對艾滋病毒有更強的抵抗力。」
「從而我們研發出了一種藥物來模擬那些人抵抗艾滋病病毒的機制。」 他相信此方法同樣適用於伊波拉病毒。
簡而言之,大數據分析已經在對抗伊波拉的戰鬥中被應用於各種層面。但正如Qlick的戴維伯頓所言,「我們還在從頭學習,我們從未有過這個級別的數據。因此評價大數據分析是否對疾病的診斷與傳播具有重大意義的影響還言之尚早,但是至少大數據分析可以幫助我們決定如何分配我們的資源。」■
Be the first to comment