ИИ-метод для поиска упущенных конформаций молекул
Новый метод на основе искусственного интеллекта позволил находить «потерянные» геометрии молекул
Мир молекулярного моделирования — это сложная игра в трехмерные шахматы, где каждый ход, каждая конформация молекулы может изменить исход «партии». Ученые десятилетиями бьются над проблемой: как не упустить ни одной возможной пространственной формы молекулы, особенно когда от этого зависят свойства будущих лекарств или катализаторов. И вот прорыв: российские исследователи из Института органической химии им. Н.Д. Зелинского РАН и МГУ им. М.В. Ломоносова создали метод, который не просто ищет «выигрышные ходы» (глобальные минимумы энергии), но и находит «пропущенные партии» — стабильные конформации, остающиеся незамеченными даже самыми продвинутыми алгоритмами.
Суть проблемы
Молекулы — динамические структуры, способные менять форму из-за вращения атомных групп. Эти конформации определяют химическую активность, биологическую функцию и даже токсичность соединения. Современные методы конформационного поиска, такие как CREST, часто пропускают энергетически выгодные формы. Например, для амидных фрагментов (ключевых элементов белков) ошибки в предсказании геометрии могут исказить моделирование взаимодействий с мишенями в организме.
Решение: симбиоз квантовой химии и ИИ
Ученые предложили гибридный подход, объединяющий:
- Гауссовские процессы — байесовский метод машинного обучения, эффективный даже при малых данных (десятки расчетов). Модель не только предсказывает энергии конформаций, но и оценивает собственную уверенность, фокусируясь на «белых пятнах» конформационного пространства.
- Активный поиск — алгоритм целенаправленно исследует области, которые другие методы игнорируют, тратя всего 20–30 квантово-химических расчетов на молекулу. Для сравнения: традиционные методы требуют тысяч попыток для крупных молекул.
Результаты тестирования
На 60 биологически активных молекулах (пептиды, лекарственные соединения) новый метод обнаружил:
- Пропущенные конформации у 40% соединений (24 из 60).
- До 28 новых стабильных форм для одной молекулы.
- 100%-ю эффективность для амидных групп — все упущенные CREST конформации были найдены.
Разработка открывает двери для ускоренного дизайна лекарств — точное предсказание конформаций улучшает виртуальный скрининг, для создания новых катализаторов — металлоорганические комплексы часто имеют множественные геометрии, влияющие на активность, а также для автоматизации молекулярного моделирования — снижение человеческого фактора и риска ошибок.
Перспективы
Ученые продолжают развивать инструменты на стыке физики и ИИ, чтобы полностью исключить «слепые зоны» в предсказании свойств молекул. Как отмечается, это шаг к эре, когда компьютер будет надежно проектировать вещества без ручного вмешательства.
Исследование — яркий пример того, как байесовские методы и междисциплинарный подход решают фундаментальные проблемы химии. В будущем такие алгоритмы могут стать стандартом в фармацевтике и материаловедении, экономя миллионы долларов на экспериментах. Главное — они минимизируют риск «пропустить» молекулу, которая могла бы стать новым антибиотиком или противораковым препаратом.