банер_сторінки

новини

Цьогорічну премію Ласкера за фундаментальні медичні дослідження було присуджено Демісу Хассабісу та Джону Джамперу за їхній внесок у створення системи штучного інтелекту AlphaFold, яка передбачає тривимірну структуру білків на основі послідовності амінокислот першого порядку.

 

Їхні результати вирішують проблему, яка давно непокоїть наукову спільноту, та відкривають шлях до прискорення досліджень у біомедичній галузі. Білки відіграють ключову роль у розвитку захворювань: при хворобі Альцгеймера вони згортаються та утворюють групи; при раку їхня регуляторна функція втрачається; при вроджених метаболічних порушеннях вони порушуються; при муковісцидозі вони потрапляють у неправильне місце в клітині. Це лише деякі з багатьох механізмів, що викликають захворювання. Детальні моделі структури білків можуть забезпечити атомні конфігурації, стимулювати розробку або вибір молекул з високою спорідненістю та пришвидшити відкриття ліків.

 

Структури білків зазвичай визначаються за допомогою рентгенівської кристалографії, ядерного магнітного резонансу та кріоелектронної мікроскопії. Ці методи є дорогими та трудомісткими. В результаті існуючі бази даних 3D-структур білків містять лише близько 200 000 структурних даних, тоді як технологія секвенування ДНК створила понад 8 мільйонів послідовностей білків. У 1960-х роках Анфінсен та ін. виявили, що 1D-послідовність амінокислот може спонтанно та повторювано згортатися у функціональну тривимірну конформацію (Рисунок 1A), і що молекулярні «шаперони» можуть прискорювати та полегшувати цей процес. Ці спостереження призвели до 60-річного виклику в молекулярній біології: прогнозування 3D-структури білків з 1D-послідовності амінокислот. З успіхом Проекту «Геном людини» наша здатність отримувати 1D-послідовності амінокислот значно покращилася, і цей виклик став ще більш актуальним.

ST6GAL1-структура-білка

Передбачити структури білків складно з кількох причин. По-перше, усі можливі тривимірні положення кожного атома в кожній амінокислоті вимагають багато досліджень. По-друге, білки максимально використовують комплементарність у своїй хімічній структурі для ефективної конфігурації атомів. Оскільки білки зазвичай мають сотні «донорів» водневих зв'язків (зазвичай кисень), які повинні бути близькі до «акцептора» водневих зв'язків (зазвичай азот, зв'язаний з воднем), може бути дуже важко знайти конформації, де майже кожен донор знаходиться близько до акцептора. По-третє, існує обмежена кількість прикладів для навчання експериментальних методів, тому необхідно розуміти потенційні тривимірні взаємодії між амінокислотами на основі одновимірних послідовностей, використовуючи інформацію про еволюцію відповідних білків.

 

Фізику вперше використали для моделювання взаємодії атомів у пошуках найкращої конформації, а також було розроблено метод прогнозування структури білків. Карплус, Левітт та Варшел отримали Нобелівську премію з хімії 2013 року за свою роботу з комп'ютерного моделювання білків. Однак методи, засновані на фізиці, є обчислювально дорогими та вимагають приблизної обробки, тому неможливо передбачити точні тривимірні структури. Інший «знаннєвий» підхід полягає у використанні баз даних відомих структур і послідовностей для навчання моделей за допомогою штучного інтелекту та машинного навчання (AI-ML). Хассабіс і Джампер застосовують елементи як фізики, так і AI-ML, але інновації та стрибок у продуктивності підходу походять головним чином від AI-ML. Два дослідники творчо поєднали великі публічні бази даних з обчислювальними ресурсами промислового класу, щоб створити AlphaFold.

 

Як ми знаємо, що вони «вирішили» головоломку структурного прогнозування? У 1994 році було засновано конкурс критичної оцінки прогнозування структури (CASP), який проводиться кожні два роки для відстеження прогресу структурного прогнозування. Дослідники діляться 1D-послідовністю білка, структуру якого вони нещодавно розгадали, але результати якого ще не опубліковані. Предиктор прогнозує тривимірну структуру, використовуючи цю 1D-послідовність, а оцінювач незалежно оцінює якість прогнозованих результатів, порівнюючи їх із тривимірною структурою, наданою експериментатором (наданою лише оцінювачу). CASP проводить справжні сліпі огляди та фіксує періодичні скачки продуктивності, пов'язані з методологічними інноваціями. На 14-й конференції CASP у 2020 році результати прогнозування AlphaFold показали такий стрибок у продуктивності, що організатори оголосили про вирішення проблеми 3D-прогнозування структури: точність більшості прогнозів була близькою до точності експериментальних вимірювань.

 

Ширше значення полягає в тому, що робота Хассабіса та Джампера переконливо демонструє, як штучний інтелект-машинне навчання (AI-ML) може трансформувати науку. Дослідження показує, що AI-ML може будувати складні наукові гіпотези з кількох джерел даних, що механізми уваги (подібні до тих, що в ChatGPT) можуть виявляти ключові залежності та кореляції в джерелах даних, і що AI-ML може самостійно оцінювати якість своїх вихідних результатів. AI-ML, по суті, займається наукою.


Час публікації: 23 вересня 2023 р.