作為ChatGPT和谷歌Gemini等熱門工具背后的技術,基于大語言模型(LLM)的生成式AI正在徹底改變各個行業(yè),藥物發(fā)現(xiàn)領域當然也不例外。通過運用AI之力以解碼并操縱生物及化學語言,制藥企業(yè)如今可以更快、更加經(jīng)濟高效地開發(fā)新藥。在本文中,我們將一同了解生成式AI如何改變藥物發(fā)現(xiàn)、加速開發(fā)過程并降低研發(fā)成本。
生成式AI在藥物發(fā)現(xiàn)中的作用
從傳統(tǒng)角度講,生成式AI的主要作用在于生成人類語言。但除此之外,其潛力早已跨過這條連坐,涵蓋了復雜的生物和化學語言。舉例來說,人類DNA可以看作是一條由30億個字母組成的序列,這就形成了一種獨特的語言。同樣的,作為生命基石的蛋白質(zhì)也擁有自己的字母表,也就是20種氨基酸。這些化學物質(zhì)均可使用簡化分子線性輸入規(guī)范(SMILES)來定義其結(jié)構(gòu)。
生成式AI技術能夠解釋這些語言,幫助發(fā)現(xiàn)并開發(fā)出新的藥物療法。通過將大模型類型的方法應用于這些生物和化學語言,AI模型能夠發(fā)現(xiàn)以往無法觀察到的見解,加快藥物發(fā)現(xiàn)過程并顯著降低成本。鑒于新藥療法的失敗率很高——一般只有10%的藥物能夠順利通過臨床試驗——任何有助于提高效率和降低時間和成本的技術,都將為整個產(chǎn)業(yè)貢獻巨大價值。
為流程的各個階段增加價值
生成式AI可以應用于藥物發(fā)現(xiàn)的各個階段:
1.目標識別:第一階段是識別待治療的疾病或癥狀。生成式AI可以分析基因組數(shù)據(jù),從而了解導致疾病或其他潛在生物過程的基因。這將有助于確定新藥開發(fā)的確切目標。
2.線索生成:第二階段是生成潛在線索,也就是針對已識別疾病的化學物質(zhì)或蛋白質(zhì)。但由于可能的化學物質(zhì)(超過10^60種)與蛋白質(zhì)(超過10^160種)數(shù)量極多,因此導致這項任務頗為艱難。生成式AI技術能夠篩選其中的可能性,并生成具有所需特性的新型化合物,從而產(chǎn)生大量可供探索的線索。
3.優(yōu)化:在第三階段,需要對潛在候選藥物進行功效測試。生成式AI可以協(xié)助這一大規(guī)模篩選過程。例如,英偉達與Recursion Pharmaceuticals的合作就表現(xiàn)出在一周之內(nèi),對超過2.8千萬億種小分子靶標對進行篩選的能力。如果用傳統(tǒng)方法處理,這項任務需要10萬年才能完成。
生成式AI將使制藥公司以前所未有的規(guī)模、速度和準確性探索潛在新藥,大大加快臨床試驗的進展。
藥物開發(fā)中的AI案例研究
目前有多家公司在運用生成式AI進行藥物發(fā)現(xiàn)方面處于領先地位。一個著名案例就是Insilico Medicine,他們利用AI開發(fā)出一種治療特發(fā)性肺纖維化的藥物,這是一種會導致肺功能逐漸衰退的罕見疾病。傳統(tǒng)上,整個研發(fā)過程需要六年時間,耗資超過4億美元。但借助生成式AI,Insilico將成本降低至十分之一,并把研發(fā)周期縮短到了兩年半。
Insilico將AI方案應用在臨床前藥物發(fā)現(xiàn)流程中的各個階段,包括識別目標分子、生成新型候選藥物以及預測臨床試驗結(jié)果。他們還成功開發(fā)出一種對所有變體均有療效的AI生成COVID-19藥物,并啟動了30多個針對各類疾病(包括癌癥)的其他項目。
藥物開發(fā)的未來
生成式AI對藥物發(fā)現(xiàn)具有變革性的影響,有望以極低的成本快速治愈多種疾病。憑借AI解碼復雜生物與化學語言的能力,我們也許可以期待未來新藥的開發(fā)流程將更快、更高效也更成功。生成式AI代表的不只是一項技術進步,更將顛覆整個醫(yī)療保健行業(yè),在為全球患者帶來更佳診療效果的同時,為未來藥物的開發(fā)探明前所未有的道路。