一年前,人工智能(AI)公司DeepMind等依靠其推出的AI系統(tǒng)AlphaFold預測并公布了約35萬種蛋白質的結構。這讓許多科學家大吃一驚,該進展入選《科學》2021年度十大科學突破。
一年后,AlphaFold完成又一次飛躍。據(jù)《科學》報道,7月28日,DeepMind公布了從細菌到人類的幾乎所有已知(2億多個)蛋白質的可能結構,并將其納入相關數(shù)據(jù)庫,研究人員可免費搜索蛋白質結構。
【資料圖】
這是人工智能領域的一個驚人成就,也是藥物開發(fā)和迭代研究的潛在寶庫。
“我們發(fā)布了整個蛋白質宇宙的結構。”DeepMind聯(lián)合創(chuàng)始人、首席執(zhí)行官Demis Hassabis在新聞發(fā)布會上說。
AlphaFold功能強大,它解決了從蛋白質氨基酸序列中準確推導蛋白質三維結構的長期挑戰(zhàn)——蛋白質折疊問題。大多數(shù)藥物都是利用蛋白質結構信息設計的,準確描繪結構圖譜往往是發(fā)現(xiàn)蛋白質如何工作的第一步。
通過與歐洲生物信息學研究所(EMBL-EBI)合作,AlphaFold數(shù)據(jù)庫也于一年前啟動,其中納入的35萬個蛋白質預測結構涵蓋了人類、小鼠和其他19種被廣泛研究的生物體產(chǎn)生的幾乎每種蛋白質。
AlphaFold新預測的蛋白質結構也已發(fā)布到現(xiàn)有數(shù)據(jù)庫中。Hassabis說,該數(shù)據(jù)庫“為結構生物學家提供了強大的新工具,在這里,可以像在谷歌通過關鍵詞搜索信息一樣輕松地查找蛋白質三維結構”。
據(jù)EMBL-EBI估計,在現(xiàn)有的超2.14億個預測的蛋白質結構中,大約35%是高度準確的,這意味著它們與實驗確定的結構質量一樣高;有45%的結構足以在許多應用程序中使用。
DeepMind表示,自去年發(fā)布部分蛋白質結構以來,已有超過50萬名研究人員使用了該數(shù)據(jù)庫。
Hassabis預見了一個“數(shù)字生物學新時代”,在這個時代里,藥物開發(fā)人員可以從利用AI預測醫(yī)學上很重要的蛋白質結構,轉向使用AI設計影響這些蛋白質的小分子,從而治療疾病。
其他人正在通過結構預測開發(fā)候選疫苗,探索如核孔復合體如何把分子送入細胞核或者生命最初進化時蛋白質如何進化等基本生物學問題。
在Hassabis看來,公布蛋白質結構只是一個起點,還有許多生物學和化學方面的工作有待探索。
標簽: