С помощью инструмента AlphaFold компания DeepMind расшифровала структуру некоторых вирусных белков nCoV-2019. Эти белки — не самые важные в вирусном воздействии, но могут помочь учёным понять общую картину жизнедеятельности вируса.
В ответ на вспышку COVID-19 научное сообщество активизировалось — учёные стали искать ключи к «разгадке» болезни. Лаборатории, стоящие в авангарде поиска, делились расшифровками генома вируса в открытых базах данных. Это позволило другим исследователям быстро разработать тесты на присутствие этого нового патогена. Другие лаборатории делились экспериментально определёнными структурами или математическими моделями некоторых белков вируса. Третьи предоставляли общие эпидемиологические данные.
Компания DeepMind также решила внести вклад в борьбу с коронавирусом. С помощью последней версии системы AlphaFold, основанной на глубоком обучении, они спрогнозировали структуры нескольких недостаточно изученных белков этого вируса. Как выглядят белковые структуры — важно знать, чтобы понимать, как этот патоген функционирует. Эксперименты по определению вирусных структур могут длиться месяцами, и не всегда заканчиваются успехом. Поэтому математические модели предсказания возможных структур белков по аминокислотной последовательности являются неплохим подспорьем, когда эксперименты ещё не дали результатов.
В тех случаях, когда структура белка, похожего на искомый, уже была определена экспериментально, алгоритмы, основанные на «моделировании с шаблонами» (template modelling), способны обеспечить точные прогнозы. Но AlphaFold сделала шаг дальше — с её помощью можно спрогнозировать структуру белка, когда нет доступных структур схожих белков. Это называется «свободным моделированием» (free modelling), и это задача значительно более сложная, чем «моделирование с шаблонами».
Мембранный белок вируса.
Важно понимать, что предсказанные структуры пока не были проверены экспериментально, а также статья ещё не прошла процесс проверки рецензентами. Такая спешка с публикацией объясняется чрезвычайной ситуацией, связанной с эпидемией. Авторы публикации надеются, что таким образом помогут научному сообществу разобраться, как функционирует вирус, а также сформулировать гипотезы, какие терапевтические средства смогут обезвредить вирус.
Почему можно быть более-менее уверенными в верности предсказанных структур? Система предоставила точный прогноз для экспериментально определённой структуры «спайкового» белка вируса, которая хранится в открытом доступе в банке белковых данных (Protein Data Bank).
«Спайковый» белок — это белок на поверхности коронавируса, тесно связывающийся с рецепторными белками человека, находящимися на поверхности человеческих клеток. Как только шип коронавируса связывается с рецептором, вирус может заразить клетку и начать размножаться (из описания игры Coronavirus Spike Protein Binder Design).
Исследователям это дало уверенность, что модельные прогнозы и для других белков могут быть оказаться недалеки от истины. Важно, что модели от DeepMind включают вероятности достоверности для разных частей белковых данных.
Среди белков, чьи структуры предоставлены DeepMind — мембранный белок SARS-CoV-2, белки 3a, Nsp2, Nsp4, Nsp6 и папаин-подобная протеиназа. И хотя эти белки не так важны для разработки лекарств, они проливают свет на картину в целом.
Все заинтересованные могут скачать структуры по ссылке.
Источник: