МикробиологияНовые технологии

ИИ раскрывает рецепт создания искусственных белков

Белки необходимы для жизни клеток, выполняя сложные задачи и катализируя химические реакции.

Белки необходимы для жизни клеток, выполняя сложные задачи и катализируя химические реакции. Ученые и инженеры давно пытаются использовать эту силу, создавая искусственные белки, которые могут выполнять новые задачи, такие как лечение болезней, улавливание углерода или сбор энергии, но многие процессы, предназначенные для создания таких белков, медленны и сложны, с высокой частотой отказов.

Команда исследователей из Притцкеровской школы молекулярной инженерии (PME) Чикагского университета разработала процесс, основанный на искусственном интеллекте, который использует большие данные для разработки новых белков.

Разрабатывая модели машинного обучения, которые могут анализировать информацию о белках, собранную из геномных баз данных, исследователи обнаружили относительно простые правила проектирования для создания искусственных белков.

Когда они сконструировали искусственные белки в лаборатории, ученые обнаружили, что они выполняют химические функции настолько хорошо, что соперничают с теми, которые найдены в природе.

«Мы все задавались вопросом, как такой простой процесс, как эволюция, может привести к такому высокоэффективному материалу, как белок», — сказал Рама Ранганатан, профессор на кафедре биохимии и молекулярной биологии. «Мы обнаружили, что данные генома содержат огромное количество информации об основных правилах строения и функционирования белков, и теперь мы можем использовать правила природы для создания белков самостоятельно.»

Белки состоят из сотен или тысяч аминокислот, и эти аминокислотные последовательности определяют структуру и функцию белка. Но понять, как именно построить эти последовательности для создания новых белков, было непросто. Прошлые работы привели к методам, которые могут определять структуру, но функция была более неуловимой.

За последние 15 лет ученые поняли, что базы данных генома, которые растут экспоненциально, содержат огромное количество информации об основных правилах структуры и функционирования белков. Исследователи разработали математические модели, основанные на этих данных, а затем начала использовать методы машинного обучения, чтобы выявить новую информацию об основных правилах проектирования белков.

Они изучили семейство метаболических ферментов chorismate mutase, тип белка, который важен для жизни многих бактерий, грибов и растений. Используя модели машинного обучения, исследователи смогли выявить простые правила проектирования этих белков.

Модель показывает, что просто сохранение аминокислотных позиций и корреляций в эволюции пар аминокислот достаточно для предсказания новых искусственных последовательностей, которые будут обладать свойствами семейства белков.

«Мы обычно предполагаем, что для того, чтобы построить что-то, вы должны сначала глубоко понять, как это работает», — сказал Ранганатан. «Но если у вас достаточно примеров данных, вы можете использовать методы глубокого обучения, чтобы изучить правила проектирования, даже если вы понимаете, как он работает или почему он построен таким образом.»

Затем он и его коллеги создали синтетические гены для кодирования белков, клонировали их в бактерии и наблюдали, как бактерии затем создавали синтетические белки, используя свои обычные клеточные механизмы. Они обнаружили, что искусственные белки выполняют ту же каталитическую функцию, что и естественные белки chorismate mutase.

Поскольку правила проектирования относительно просты, число искусственных белков, которые исследователи потенциально могли бы создать с их помощью, чрезвычайно велико.

— Ограничения гораздо меньше, чем мы могли себе представить, — сказал Ранганатан. «В правилах проектирования природы есть простота, и мы считаем, что подобные подходы могут помочь нам найти модели для проектирования в других сложных системах в биологии, таких как экосистемы или мозг.»

Хотя искусственный интеллект раскрыл правила проектирования, Ранганатан и его сотрудники до сих пор не до конца понимают, почему модели работают. Далее они будут работать, чтобы понять, как именно модели пришли к такому выводу.  — Нам еще многое предстоит сделать, — сказал он.

В то же время ученые надеются использовать эту платформу для разработки белков, которые могут решать насущные социальные проблемы.

«Эта система дает нам платформу для рационального конструирования белковых молекул таким образом, о котором мы всегда мечтали», — сказал он. — Она не только научит нас физике работы белков и их эволюции, но и поможет найти решения таких проблем, как улавливание углерода и сбор энергии. Более того, исследования белков могут даже помочь нам понять, как на самом деле работают глубокие нейронные сети, лежащие в основе современного машинного обучения.»

Результаты исследования были опубликованы 24 июля в журнале Science.

Показать больше
Подписаться
Уведомление о
0 Комментарий
Встроенные отзывы
Посмотреть все комментарии
Back to top button