十一少:AlphaGo演化成Alphafold 征服蛋白質結構破解大賽

2020-12-09
十一少
財經專欄作家
 
AAA

WhatsApp Image 2020-12-09 at 10.08.38.jpeg

DeepMind Youtube 影片截圖

李嘉誠有份投資的人工智能公司DeepMind,幾年前在圍棋大賽之中響朵,今年就最新推出的AlphaFold 在兩年一次名為「蛋白質結構預測競賽」(CASP)比賽中,贏到開巷,被外國科學期刊形容為「格局的變革者」(a game changer),能讓人工智能在解決蛋白質結構方面「取得勝利」。

生物中有超過 2 億種蛋白質,但科學界只掌握當中約 17 萬種的結構。要了解這些形狀,研究人員才能了解細胞成分,幫助開發有效藥物,應用在醫療行業和社會上。但人類一直未能完全破解DNA之謎,只知道人體會藏着成千上萬種不同的蛋白質,而每種蛋白質包含數十到數百個氨基酸。這些氨基酸的排列,就會決定其三維(3D)形狀,當中「結構」和「形狀」又決定了蛋白質的功能。

而透過DeepMind的新技術Alphafold,就能夠顛覆過去的「X 射線晶體學」或「低溫電子顯微鏡」,以更快捷的實驗技術去解構蛋白質的 3D 結構無需花費數月甚至數年時間,去破解蛋白質結構。

每兩年一屆的 「蛋白質結構預測競賽」(CASP)就是一個試煉場,讓參賽隊伍推測約 100 種結構未明的蛋白質背後序列,部分小組負責計算每個序列的結構,部分小組則通過實驗確定結構,並為預測結果的準確程度評分。

這個比賽難度非常高,能在 100 分之中取得超過 90,成績已稱得上十分之高超,相當吻合實驗結果,而科技家在 2016 年,在最高難度組別只能取得約 40 分。

不過一切由DeepMind破局, 自 2018 年首次參加比賽,當時他們的算法 AlphaFold 也是基於這種比較策略,結合深度學習的計算方法,其中該軟件在龐大的數據庫,基於已知蛋白質的DNA序列和結構上進行訓練,並學習發現模式,當年已輕鬆獲勝,分數在每種結構上平均高於對手 15%,於最困難的目標贏得 GDT 最高約 60 分。

而在2020年的 CASP 比賽,AlphaFold 繼續獨領風騷,GDT 中位數得分高達 92.4,在對於最具挑戰性的蛋白質,中位數為更達 87,較次名最佳預測足足高出 25 分,一度更引起主辦者懷疑 DeepMind 可能是作弊!

蛋白質折疊成三維結構,一直堪稱是生物學上其一最大的謎團,未來依靠DeepMind,相信能夠促進人類文明,了解更多有關生命、醫學等周邊問題。可悲的是,當別人在關心這些科研議題,香港的創科局仍在停留於如何為「安心出行」跑數。

 

文章只屬作者觀點,不代表本網立場。

 
延伸閱讀