科技前瞻

方便好用的Excel反而增加遺傳學家的挑戰

Excel會自動重新格式化數據

Microsoft Excel居然是遺傳學家的一大難題!人類基因有 23 對染色體,包含約 30 億個 DNA 鹼基對,部分鹼基對組成了大約20000 到 25000 個基因。在科學研究中,學者需要為每個基因起一個特定的名稱以便快速定位,這些名稱一般由字母加數字的形式組成。

不過因為Microsoft Excel該程序會自動重新格式化數據,並完全打亂數據內容,相信各位都有使用過微軟推出的文書軟件Office,而Microsoft Excel是所有文書軟體當中最多人使用的軟件之一,微軟 CEO Satya Nadella在Aspen Ideas Festival論壇上表示,微軟歷來最重要的發明,並不是 Windows、並不是 XBOX,而是 Office 中的Excel,Excel是微軟帶給世界的偉大創作,令全球企業的辦公效率大幅提升,對「數字」有更深入的了解。

一年內改變了27個人類基因的名字

不過對於遺傳學家,這是一個十分令人驚訝的問題,甚至會對已發表的研究產生嚴重影響。Verge報導表示由於微軟不會專門為遺傳學家而更新它們的軟件,導致科學家們只能在大約一年的時間裡改變了27個人類基因的名字,且在近幾日發佈了新的命名指南。

Excel在自動重新格式化數據方面尤為積極,由於這些錯誤需要被進行研究的科學家修正兩次,且會在Excel自動格式化觸發那邊再修正一次,因此有些錯誤會大大地被遺漏。

[related-post url=”https://tomorrowsci.com/science/科學家利用烏賊的基因賦予人類細胞隱形的能力/”]

3597篇遺傳學論文中約有20%的Excel錯誤

根據美國科技期刊《基因生物學》(Genome Biology) 2016年的一項研究,3597篇遺傳學論文中約有20%的Excel錯誤。

Quadrams研究所的生物學家告訴the Verge「這件事是真的很麻煩,導致有許多研究都得因為命名方式來重新整理,非常討厭,且Excel是一種廣泛使用的工具,如果對計算有點笨拙的人都會使用到它,在我讀博士的時候,我也這樣做過!」

不過現在有了新的指導方針,科學家應該希望能夠避免任何可能使Excel混亂的新基因名稱,例如MARCH1現在是MARCHF1、SEPT1現在是SEPTIN1。

Excel的發明讓數學不好或是有計算障礙的人們擁有許多方便,像是試算表軟體的基本特徵是儲存格內可輸入資料、公式、函數,每一個儲存格都可以作為其他儲存格的輸入,它提供了一個友善、透明、易用的分析工具。

圖片來源:IMAGES VIA MAXPIXEL/VICTOR TANGERMANN

資料來源:DAN ROBITZSKI(2020,AUGUST 6).SCIENTISTS HAD TO RENAME GENES BECAUSE THEY CONFUSED MICROSOFT EXCEL. Futurism

更多科學與科技新聞都可以直接上 明日科學網站 www.tomorrowsci.com