Группа разработки искусственного интеллекта DeepMind решила серьезную научную проблему, которая ставила исследователей в тупик на протяжении полувека.
Прорыв в биологии
Белки необходимы для жизни, поддерживая практически все функции организма. Это большие сложные молекулы, состоящие из цепочек аминокислот. Функции белка во многом зависят от его уникальной трехмерной структуры. Определение, в какую форму складываются белки, известно как «проблема сворачивания белков».
По признанию организаторов международного конкурса CASP (англ. Critical Assessment of protein Structure Prediction, критическая оценка предсказания белковых структур) последняя версия системы искусственного интеллекта AlphaFold группы DeepMind стала решением этой грандиозной задачи. Этот прорыв демонстрирует влияние ИИ на научные открытия и его большой потенциал для фундаментальных областей науки.
Форма белка тесно связана с его функцией, и способность предсказать эту структуру даст лучше понять, что он делает и как работает. Многие из величайших мировых проблем, такие как разработка методов лечения заболеваний или поиск ферментов, расщепляющих промышленные отходы, в основном связаны с белками и ролью, которую они играют.
Геймерский плацдарм
DeepMind наиболее известен своими программами, которые превзошли лучших геймеров в StarCraft II и научились играть в Quake лучше людей.
Но сверхчеловеческий геймплей никогда не был главной целью. Игры стали тренировочной площадкой для программ, которые предполагалось использовать для решения реальных проблем.
AlphaFold
Для последней версии AlphaFold DeepMind создали нейросеть, которая применяет эволюционно связанные последовательности, множественное выравнивание последовательностей (MSA) и представление пар аминокислотных остатков для уточнения графика.
Исследователи DeepMind обучали систему на общедоступных данных, которые включали информацию приблизительно о 170000 структур белков, чтобы понять, как складываются белки. AlphaFold использует вычислительные мощности эквивалентные 200 графическим процессорам, что представляет собой относительно скромный объем вычислительных мощностей в контексте большинства крупных современных моделей, используемых в машинах.
Два примера белковых мишеней в категории бесплатного моделирования.
Alphafold предсказывает структуры с высокой точностью, сравнивая их с результатами экспериментов.
По словам Демиса Хассабиса – основателя и исполнительного директора DeepMind, команда начала работу над предоставлением доступа исследователей к AlphaFold ее для использования в научных целях.
Джон Джампер, исследователь в команде DeepMind: «Мы действительно не знали, пока не увидели результаты Casp, как далеко продвинулись в этой области». Однако это не конец работы. Новые исследования будут сосредоточены на том, как белки объединяются в более крупные «комплексы», и как они взаимодействуют с другими молекулами в живых организмах.