Excel漏數據之亂 英國1萬6,000名COVID-19患者沒追蹤到

為什麼不要用Excel紀錄確診病例?這個答案或許問英國公共衛生部最知道。

文章插圖

漏了將近1萬6,000人

周一(5),在COVID-19(武漢肺炎)確診病例飆破 51萬8,000人的英國,傳出在 9月25日到10月2日這 8天內,有將近 1萬6,000起新的確診病例沒有追蹤到,這代表原本應該接受隔離治療的患者依舊在外頭,加劇疫情蔓延的風險。

將Excel當作大型資料庫

而這 1萬5,841起確診病例之所以被英國公共衛生部(Public Health England)漏掉,原因就出在英國公共衛生部將微軟推出的Excel試算軟體當作大型資料庫使用,沒有注意到Excel並不適合拿來紀錄和追蹤每天增幅調整的確診病例數據。

文章插圖

為什麼會漏數據?

如果要還原整起漏數據事件,必須先從英國公共衛生部如何記錄COVID-19(武漢肺炎)確診病例說起。

每天,英國各地的公私立檢測中心會將確診病例和檢測人數等數據以CSV檔寄給英國公共衛生部,英國公共衛生部再將收到的數據匯入在Excel建立的資料庫。

雖然CSV的檔案大小沒有限制,但英國公共衛生部使用的舊版Excel呈現的檔案格式XLS只能呈現 65,536列,這代表多出來的數據會自動被刪除,這也是為什麼確診病例數會被遺漏的原因。

如果是新版的Excel,呈現的檔案格式XLSX可以容納 1,048,576列,能夠紀錄的檢測數據量是前者的 16倍,相對來說就不容易發生數據遺漏的問題。

要存大數據  Excel不適合

不過,IT專家指出,不管是 1987年推出的Excel XLS檔案格式,還是 2007年更新的XLSX檔案格式,這些都不適合拿來存放COVID-19(武漢肺炎)的檢測數據,箇中道理連中學生都知道。

英國劍橋大學計算機實驗室通訊系統教授克羅克洛夫(Jon Crowcroft)說:「一直以來,Excel都是專門給小型公司處理數據,並且大致看看數據長相的軟體。」

「當你要做某些比較嚴肅的正事時,你會用為那些正事量身打造處理數據的方式,你有很多其他的選擇,但你不會用Excel,沒人會用這個起頭。」

文章插圖

英國公衛部:「技術問題」已解決

回到Excel漏數據事件,在發現漏了 1萬5,841起確診病例沒有追蹤後,英國公共衛生部表示他們立刻回溯追蹤,並且在 3號凌晨 1點已經大致補完,這項「技術問題」已經被解決。

衛生大臣:這起意外根本不該發生

周一,當英國衛生大臣韓考克(Matt Hancock)在下議院接受質詢時,也提到了Excel漏數據事件,他坦言整起事件肇因於英國公共衛生部使用「老舊系統」統計確診和檢測數據,兩個月前當局就已經決定要更換這套系統。

「這起意外根本不應該發生,」韓考克承諾當局除了會深入調查該意外,也會立刻升級過時的電腦系統。

比一團亂糟多了

對於這起意外,來自工黨的影子衛生大臣阿什沃斯(Jonathan Ashworth)表示,就算英國公共衛生部事後力挽狂瀾,人民的生命安全照樣因為延遲追蹤而陷於危險。

阿什沃斯說:「成千上萬的人根本不知道他們曝露在染疫的風險中,在住院人數不斷增加的情況下,這種致命的病毒很有可能散播。」

「這起事件不僅僅是一團亂,這比一團亂還要更糟。」

除了漏數據  還有很多地方做不好

蘇格蘭愛丁堡大學全球衛生治理學程主任斯里達(Devi Sridhar)說:「這起事件發生的時機不能更糟了,隨著時序準備進入冬季,我們早就知道到時病例數會增加,現在正是需要當局『檢測和追蹤系統』(test-and-trace system)好好發揮功用的時候。」

沒想到,英國公共衛生部的檢測和追蹤系統卻出了這樣的大包。斯里達繼續提到,除了漏數據一事,當局在防疫上還有許多地方做不好,像是把人送去離家好幾百公里遠的地方做檢測、實驗室的檢測效率太慢、累積大量民眾沒有檢測等等。

文章插圖

解決之道:拆成小檔案匯入Excel

面對各方撻伐,發生Excel漏數據事件的英國公共衛生部表示,他們現在將檢測數據拆分成小堆匯入能容納大量數據的Excel模板內,如此一來就不會發生數據量超過上限、數據被自動刪除的情況。

然而,IT專家表示,英國公共衛生部該做的是尋找更適合的資料庫軟體來取代Excel,而不是繼續使用Excel。

其實,Excel不是萬用

根據《衛報》的報導,Excel雖然是全世界最受歡迎的商業工具,但在某些情況下並不適合使用Excel來記錄數據,過去也有不少企業使用Excel出錯,結果付出高昂代價的例子。

舉例來說,2013年,摩根大通集團(JPMorgan)使用Excel出錯,讓他們損失將近 60億美元(折台幣約 1,741億5,000萬元)。當時,Excel試算表中的單元格錯誤地除以兩種利率的總和,而不是除以利率平均值。這個錯誤也讓美國康乃狄克大學法律系教授柯克(James Kwak)警告大眾,Excel其實「非常脆弱」。

人人都能做  但不一定做得好

柯克說:「對初學者來說,Excel沒有辦法追蹤你的數據從哪裡來,Excel也沒有審計追蹤的功能,所以你有可能不小心重複打了某些數字,但你自己不知道。此外,Excel也沒有簡單的方式可以測試試算表。」

「Excel最大的問題在人人都能生出Excel試算表,但可能做得並不好,因為Excel的操作太簡單,人們在製作重要試算表時並沒有侷限於一定要給了解程式設計的人去做。在製作時,也沒有以系統性、能夠追蹤製作紀錄的方式製作。」

文章插圖

我們為您在DQ飛行船預留了VIP位子,期待您登船贊助DQ