Экзамен для нейросетей: смогут ли алгоритмы решить нерешаемые задачи современной математики?
Математика издавна считается царицей наук и языком, на котором написана книга природы. Сегодня этот язык стал еще и основой для создания искусственного интеллекта, который, в свою очередь, все активнее вторгается в святая святых — мир чистых математических исследований. Мы привыкли к тому, что нейросети пишут тексты, генерируют изображения или находят закономерности в больших данных. Однако вопрос о том, способен ли ИИ не просто имитировать интеллектуальную деятельность, а совершать открытия, решая сложнейшие исследовательские проблемы, остается открытым.
До недавнего времени тестирование математических способностей ИИ сводилось к решению олимпиадных задач или примеров из учебников, которые так или иначе могли присутствовать в обучающих данных моделей. Но как проверить, умеет ли машина мыслить по-настоящему творчески, сталкиваясь с неизведанным? Ответ на этот вопрос попыталась дать группа математиков, организовав уникальный эксперимент, детали которого были опубликованы на сервере препринтов arXiv.
Суть эксперимента: В поисках «чистого» интеллекта
Ключевая проблема предыдущих тестирований заключалась в возможной «натасканности» нейросетей. Поскольку интернет переполнен решениями типовых задач, ИИ мог просто воспроизводить заученные алгоритмы, не демонстрируя подлинного понимания. Чтобы исключить этот фактор, исследователи пошли на беспрецедентные меры. Они предложили искусственному интеллекту задачи, которые никогда не публиковались в открытых источниках.
Каждый из участвующих математиков сформулировал уникальную проблему из области своих собственных изысканий. Более того, чтобы гарантировать чистоту эксперимента, ученые сначала самостоятельно решили эти задачи, доказав тем самым их разрешимость, а затем зашифровали ответы. Это было сделано для того, чтобы даже гипотетическая утечка данных или способность моделей индексировать информацию не позволила им найти готовое решение в Сети.
Всего было подготовлено десять задач, охватывающих широкий спектр современной математики: от стохастического анализа и спектральной теории графов до симплектической геометрии и алгебраической топологии. Такой разброс дисциплин должен был проверить не узкую специализацию, а общую способность ИИ к абстрактному мышлению и логическим построениям.
В роли подопытных выступили ведущие коммерческие системы, включая GPT-5.1 Pro и Gemini 3 Pro. Условия были максимально жесткими: каждой модели давалась только одна попытка. Никаких уточняющих вопросов, диалогов или намеков со стороны человека не допускалось. Этот эксперимент, названный «Первое доказательство», был нацелен не на весь процесс научного поиска, а на его финальную, наиболее четко формализуемую стадию, когда вопрос уже ясен, и требуются лишь корректные логические выкладки для его решения.
Результаты и значение для будущего науки
Итоги испытания оказались весьма показательными и, вероятно, способны умерить пыл тех, кто пророчит скорую замену ученых-математиков алгоритмами. Исследователи пришли к выводу, что современные ИИ-модели действительно превосходно справляются с задачами, напоминающими конкурсные или олимпиадные, то есть с теми, где есть четкий алгоритм решения или похожий пример в базе знаний.
Однако перед лицом по-настоящему новых, исследовательских проблем, требующих не просто комбинаторики известных фактов, а творческой глубины и интуиции, машины пасуют. Ни одна из представленных систем не смогла с ходу решить предложенные задачи, что подчеркивает сохраняющийся разрыв между вычислительной мощностью и креативным мышлением, присущим человеку.
Неудача в этом раунде, однако, не означает прекращение попыток. Напротив, исследовательская группа рассматривает свой эксперимент как отправную точку. Они планируют превратить «Первое доказательство» в постоянно действующий и развивающийся бенчмарк — эталон для проверки подлинных математических способностей ИИ.
В следующем этапе будут опубликованы зашифрованные решения первого набора задач, и начнется работа над новыми проблемами. Таким образом, математики не просто констатируют текущее положение дел, но и закладывают основу для будущих сравнений, надеясь со временем увидеть, как искусственный интеллект сможет преодолеть барьер между решением задач и настоящим научным открытием.
