Химия

Химический синтез с искусственным интеллектом

В 1997 году, когда компьютер выиграл матч против чемпиона мира по шахматам Гарри Каспарова, это было не что иное, как сенсация. После этого прорыва в мире шахмат настольная игра Go долгое время считалась бастионом, неприступным для комьютеров из-за его сложности. Но сегодня лучшие игроки мира не могут конкурировать с искутссвенным интеллектом AlphaGo.

Рецепт успеха этой компьютерной программы стал возможным благодаря сочетанию так называемого поиска по методу Монте-Карло и глубоких нейронных сетей на основе машинного обучения и искусственного интеллекта. Группа исследователей из Мюнстерского университета в Германии продемонстрировала, что эта комбинация очень хорошо подходит для планирования химических синтезов — так называемых ретросинтезов — с беспрецедентной эффективностью. Исследование было опубликовано в последнем выпуске журнала «Nature».

Марвин Сеглер (Marwin Segler), ведущий автор исследования, говорит: «Ретросинтез — это высшая дисциплина в органической химии. Химикам нужны годы, чтобы справиться с этим — так же, как с шахматами или Go. Помимо простой экспертизы вам также нужна хорошая доля интуиции и творчества. До сих пор все предполагали, что компьютеры не могут идти в ногу наравне с экспертами, программируя по десяткам тысяч правил вручную. Мы показали, что машина сама по себе может изучить правила и их приложения из доступных источников».

Ретросинтез является стандартным методом для проектирования производства химических соединений. Возвращаясь мысленно назад, принцип состоит в том, что соединение разбивается на все меньшие компоненты до тех пор, пока не будут получены основные компоненты. Этот анализ дает рецепт, который затем используется для работы «вперед» в лаборатории для получения молекулы-мишени, исходя из исходных материалов.

Хотя теоретически это легко, процесс на практике создает большие трудности. «Как в шахматах, на каждом шагу или в движении, у вас есть множество возможностей для выбора», — говорит Сеглер. «В химии, однако, на порядок больше возможных шагов, чем в шахматах, и поэтому проблема намного сложнее».

Именно здесь вступает в игру новый метод, связывающий глубокие нейронные сети с поиском дерева Монте-Карло — комбинация настолько многообещающая, что над ним работает большое количество исследователей из разных дисциплин. Monte Carlo Tree Search — это метод оценки ходов в игре. При каждом движении компьютер моделирует множество вариантов, например, как может закончиться игра в шахматы. Затем выбирается наиболее перспективный шаг.

Аналогичным образом компьютер теперь ищет наилучшие «ходы» для химического синтеза. Он также может учиться, используя глубокие нейронные сети. С этой целью компьютер опирается на всю опубликованную химическую литературу, в которой описано почти 12 миллионов химических реакций. Майк Преусс, специалист по информационным системам и соавтор исследования, говорит: «Глубокие нейронные сети используются для прогнозирования того, какие реакции возможны с определенной молекулой. Используя поиск дерева Монте-Карло, компьютер может проверить, действительно ли приводят предсказанные реакции к молекуле-мишени».

Идея использования компьютеров для планирования синтеза не нова. «Идеи на самом деле около 60 лет», говорит Сеглер. «Люди думали, что достаточно, как в случае с шахматами, ввести в компьютер большое количество правил, но это не сработало. Химия очень сложная, и в отличие от шахмат или Go, она не может быть понятной чисто логически, используя простые правила. Добавим к этому тот факт, что количество публикаций с новыми реакциями удваивается каждые 10 лет или около того. Ни химики, ни программисты не могут справиться с этим. Нам нужна помощь интеллектуального компьютера».

Новый метод примерно в 30 раз быстрее, чем обычные программы для планирования синтеза, и он находит потенциальные пути синтеза для вдвое большего количества молекул.

В двойном слепом тесте AB исследователи из Мюнстера обнаружили, что химики считают, что эти компьютерные пути синтеза так же хороши, как и существующие проверенные пути. «Мы надеемся, что, используя наш метод, химикам не придется тратить много времени на испытания в лаборатории, — добавляет Сеглер, — и что используя меньше ресурсов, они смогут производить соединения, которые поднимут качество жизни на более высокий уровень».


Больше информации: Marwin H. S. Segler et al, Planning chemical syntheses with deep neural networks and symbolic AI, Nature (2018). DOI: 10.1038/nature25978 

Поделиться в соцсетях
Показать больше
Подписаться
Уведомление о
guest
0 Комментарий
Встроенные отзывы
Посмотреть все комментарии
Back to top button