疫情地圖走紅后——
揭秘約翰斯·霍普金斯大學
作者:本報記者 鄧暉
隨著新冠病毒在全球范圍蔓延,透明、真實的疫情數(shù)據(jù)備受關注。一段時間以來,在眾多實時可視化數(shù)據(jù)發(fā)布平臺中,約翰斯·霍普金斯大學的疫情數(shù)據(jù)頻頻出現(xiàn)在包括美國本土在內(nèi)的多國媒體、機構的報道和分析中。
相關數(shù)據(jù)顯示,從該疫情數(shù)據(jù)1月22日上線以來,每日平均使用量從1月底的2億次,在3月初上升到每日12億次,高峰時每日近20億次。
統(tǒng)計數(shù)據(jù)的機構和網(wǎng)站如此之多,為何約翰斯·霍普金斯的數(shù)據(jù)更受青睞?這是一所什么樣的學校?在科研、教學等方面有什么特色?它和中國大學又有哪些合作?
火爆的疫情地圖背后:
權威的大學研究實力在“背書”
作為約翰斯·霍普金斯大學疫情可視化數(shù)據(jù)圖的核心開發(fā)成員,過去很長一段時間,約翰斯·霍普金斯大學土木與系統(tǒng)工程學院博士一年級學生杜鴻儒一直在“連軸轉(zhuǎn)”。他告訴記者,這一疫情可視化數(shù)據(jù)圖由他的導師、該校系統(tǒng)科學與工程研究中心的勞倫·加德納(Lauren Gardner)副教授倡議開發(fā),最初的核心成員只有他和另外一位中國學生董恩盛。
“最開始,這一系統(tǒng)叫作‘約翰斯·霍普金斯大學系統(tǒng)科學與工程研究中心疫情可視化數(shù)據(jù)圖’。”杜鴻儒介紹,在今年1月份,新冠肺炎疫情還未在全世界范圍流行起來時,董恩盛就與導師達成一致意見,要做一個疫情數(shù)據(jù)地圖,并于1月22日完成并上線了最早一版。最早數(shù)據(jù)的收集完全靠手動整理,每天最多更新4-5次,但隨著疫情發(fā)展,這樣的工作模式難以持續(xù),2月1日,杜鴻儒開始加入。進入3月以后,數(shù)據(jù)已經(jīng)可以實現(xiàn)每20分鐘自動更新一次,并且加入了人工審核,保證數(shù)據(jù)準確性。
杜鴻儒告訴記者,他的工作主要分為兩個階段:“在手動收集的階段主要負責數(shù)據(jù)收集整理以及美國數(shù)據(jù)的更新;進入自動更新階段后,我主要負責編寫自動更新的代碼,同時負責維護Github數(shù)據(jù)庫,通過對比WHO的數(shù)據(jù),驗證數(shù)據(jù)的準確性。”此外,為了不斷完善可視化效果,研發(fā)團隊還對數(shù)據(jù)地圖進行了多次改版。
記者注意到,約翰斯·霍普金斯大學的疫情數(shù)據(jù)地圖并不是“獨此一家”。隨著疫情在全球蔓延,哈佛大學與牛津大學合作、美國CDC官方以及《紐約時報》、CNN等媒體都構建了自己的數(shù)據(jù)發(fā)布體系。“對手”眾多,約翰斯·霍普金斯大學的數(shù)據(jù)為何吸引到如此多的關注?采訪中,多位專家告訴記者,美國是聯(lián)邦制國家,各州可以根據(jù)自身情況制定不同的防疫措施,所以CDC地圖的更新速度和精度都很有限。而約翰斯·霍普金斯大學疫情數(shù)據(jù)地圖走紅的背后,既有著“最早啟動”等偶然性因素,也跟約翰斯·霍普金斯大學本身在醫(yī)學和公共衛(wèi)生領域的權威性相關。
“約翰斯·霍普金斯大學疫情數(shù)據(jù)圖的‘走紅’主要是兩方面原因,一是他們及時搜集整理了來自中國網(wǎng)站丁香園、美國和歐洲疾控中心等的疫情數(shù)據(jù),數(shù)據(jù)覆蓋全球,更新及時,完整性和時效性甚至超過了WHO網(wǎng)站;二是約翰斯·霍普金斯大學在醫(yī)學和公共衛(wèi)生方面的研究歷史悠久,實力雄厚,公眾更加愿意相信它作為學術機構的權威性和獨立性。這個數(shù)據(jù)系統(tǒng)的開發(fā)只是一項很具體的工作,社會效應是主要的,學術價值是次要的。霍普金斯大學的研究實力是他們在疫情危急時刻得到公眾和媒體認可的主要原因。”清華大學醫(yī)學院教授洪波告訴記者。
除此之外,清華大學醫(yī)院管理研究院副院長薛鐳認為,與其他數(shù)據(jù)發(fā)布平臺相比,約翰斯·霍普金斯大學疫情可視化數(shù)據(jù)發(fā)布的界面易于導航和閱讀,同時更新最頻繁,在系統(tǒng)升級后可以自動抓取數(shù)據(jù),即時性較高。“在這個過程中,值得點贊的是約翰斯·霍普金斯大學極強的學術敏感性,校方在發(fā)現(xiàn)這個疫情數(shù)據(jù)地圖‘火’了之后,迅速給予了相關團隊強有力的支持,保證了這項工作的可持續(xù)性和專業(yè)性。”薛鐳說。
但在更新過程中,這一疫情數(shù)據(jù)地圖也曾經(jīng)出現(xiàn)過大的失誤,比如北京時間4月14日上午8時曾誤報“全球確診病例200萬”。
“因為我們做的是全球疫情地圖,但每個國家的播報標準一直在變,比如西班牙會突然引入疑似病例,但我們因為語言障礙有時無法將這一變化及時反映出來。所以現(xiàn)在學校給我們配備了一個很大的團隊在做這件事情,系統(tǒng)也更名為‘約翰斯·霍普金斯大學疫情可視化數(shù)據(jù)圖’,圖書館、應用物理實驗室的很多科研人員給我們提供了很大的幫助。目前,所有數(shù)據(jù)都已經(jīng)實現(xiàn)了自動更新,只需要人工做一些異常情況的應對工作。”杜鴻儒介紹,他現(xiàn)在的工作重心已經(jīng)轉(zhuǎn)向了數(shù)學建模,即在數(shù)據(jù)展示的基礎上進行更多的分析和預測,“一是評估美國現(xiàn)有的疫情應對政策效果,二是精準到郡縣一級對疫情走勢進行預測。”
