Вычислительные биологи из центра клеточных и биомолекулярных исследований Университета Торонто разработали алгоритм искусственного интеллекта, который потенциально может создавать новые белковые молекулы в качестве тонко настроенных терапевтических средств.
Команда, возглавляемая Филиппом М. Кимом, профессором молекулярной генетики на медицинском факультете Университета Темерти и компьютерных наук на факультете искусств и наук, разработала ProteinSolver, графовую нейронную сеть, которая может проектировать полностью новый белок, чтобы соответствовать заданной геометрической форме.
Исследователи черпали вдохновение из японской числовой головоломки судоку, ограничения которой концептуально аналогичны ограничениям белковой молекулы. Их результаты опубликованы в журнале Cell Systems.
«Параллель с судоку становится очевидной, когда вы изображаете молекулу белка в виде сети», — говорит профессор Ким, добавляя, что изображение белков в графической форме является стандартной практикой в вычислительной биологии.
Вновь синтезированный белок представляет собой цепочку аминокислот, сшитых вместе в соответствии с инструкциями в генном коде этого белка. Затем аминокислотный полимер складывается внутри и вокруг себя в трехмерную молекулярную машину, которую можно использовать для медицины.
Белок, преобразованный в график, выглядит как сеть узлов, представляющих аминокислоты, которые соединены ребрами, которые являются расстояниями между ними внутри молекулы. Применяя принципы теории графов, затем становится возможным моделировать геометрию молекулы для конкретной цели, например, нейтрализовать вторгающийся вирус или отключить гиперактивный рецептор.
Белки делают хорошие лекарства благодаря трехмерным особенностям на их поверхности, с помощью которых они связываются с клеточными мишенями с большей точностью, чем синтетические мелкомолекулярные лекарства, которые, как правило, имеют широкий спектр и могут привести к вредным побочным эффектам.
«Чуть более трети всех лекарств, одобренных за последние несколько лет, — это белки, которые также составляют подавляющее большинство десяти лучших лекарств в мире», — говорит профессор Ким.
Инсулин, антитела и факторы роста – это лишь несколько примеров инъекционных клеточных белков, также известных как биологические препараты, которые уже используются. Однако разработка белков с нуля остается невероятно сложной задачей из-за огромного количества возможных структур на выбор.
«Главная проблема в белковом дизайне заключается в том, что у вас очень большое пространство для поиска», — говорит Ким, имея в виду множество способов, с помощью которых 20 природных аминокислот могут быть объединены в белковые структуры.
«Для белка стандартной длины, состоящего из 100 аминокислот, существует от 20 до 100 возможных молекулярных структур – это больше, чем число молекул во Вселенной», — говорит он.
Ким решил перевернуть проблему с ног на голову, начав с трехмерной структуры и разработав ее аминокислотный состав.
«Это конструкция белка, или обратная задача свертывания белка: у вас есть форма в уме, и вы хотите последовательность (аминокислот), которая будет складываться в эту форму. Решение этой проблемы в некотором смысле более полезно, чем свертывание белка, поскольку вы можете теоретически генерировать новые белки для любой цели», — говорит Ким.
Именно тогда Алексей Строкач, аспирант в лаборатории Кима, обратился к судоку, узнав о его связи с молекулярной геометрией в классе. В судоку цель состоит в том, чтобы найти недостающие значения в скудно заполненной сетке, соблюдая набор правил и существующие числовые значения.
Отдельные аминокислоты в белковой молекуле также ограничены своими соседями. Локальные электростатические силы гарантируют, что аминокислоты, несущие противоположный электрический заряд, плотно упаковываются вместе, в то время как аминокислоты с одинаковым зарядом растягиваются.
Строкач сначала построил ограничения, найденные в судоку, в алгоритм нейронной сети. Затем он обучил алгоритмы на обширной базе данных доступных белковых структур и их аминокислотных последовательностей.
Цель состояла в том, чтобы научить алгоритм, ProteinSolver, правилам – отточенным эволюцией на протяжении миллионов лет – которые управляют упаковкой аминокислот вместе в меньшие складки. Применение этих правил к инженерному процессу должно увеличить шансы на получение функционального белка в конце.
Затем исследователи протестировали ProteinSolver, предоставив ему существующие белковые складки и попросив его генерировать аминокислотные последовательности, которые могут их построить.
Затем они взяли новые вычисленные последовательности, которых не существует в природе, и изготовили соответствующие варианты белка в лаборатории. Варианты складывались в ожидаемые структуры, показывая, что подход работает.
В своей нынешней форме ProteinSolver способен вычислять новые аминокислотные последовательности для любой белковой складки, которая, как известно, геометрически стабильна. Но конечная цель состоит в том, чтобы создать новые белковые структуры с совершенно новыми биологическими функциями, как, например, новая терапия.
«Конечная цель состоит в том, чтобы кто-то мог нарисовать совершенно новый белок вручную и вычислить последовательности для этого, и это то, над чем мы сейчас работаем», — говорит Строкач.
Исследователи сделали ProteinSolver и код, лежащий в его основе, открытым исходным кодом и доступным для широкого исследовательского сообщества через удобный веб-сайт.
Это исследование получило поддержку со стороны канадских институтов медицинских исследований и Совета по естественным наукам и инженерным исследованиям Канады.
Фото — hse.ru
Свежие комментарии