ChatGPT получил серьезное обновление и учится рассуждать над сложными проблемами

o1 может создать длинную внутреннюю цепочку мыслей, прежде чем ответить пользователю.

Алла Конака14.09.2024

0 925 3 минут(ы) на чтение

ChatGPT получил серьезное обновление и учится рассуждать над сложными проблемами

Вышел последний революционный релиз ИИ от OpenAI. Новая модель o1 теперь «думает», прежде чем ответить, и она начинает превосходить как предыдущие модели, так и людей с докторской степенью в решении проблем экспертного уровня.

Было много предположений о том, как может выглядеть GPT-5, когда он будет запущен и достигнет ли он некоего определения общего искусственного интеллекта (AGI), но вчера OpenAI пошла в другом направлении, отделив новую модель от линейки GPT.

Новая модель называется o1. Она уже включена в 100% учетных записей пользователей ChatGPT как опция, которую вы можете вызвать. И хотя GPT-4o (omni) остается универсальной рабочей лошадкой, наиболее подходящей для большинства задач, o1 является своего рода мыслителем.

Его специализация — сложные рассуждения. И способность, которая отделяет его от моделей GPT, заключается в том, что он останавливается и «думает» вместо того, чтобы сразу же начать отвечать.

«OpenAI o1 показывает 89-й процентиль по вопросам соревновательного программирования (Codeforces), входит в число 500 лучших студентов США в отборочном туре на математическую олимпиаду США (AIME) и превосходит точность уровня доктора наука в тесте задач по физике, биологии и химии (GPQA). Хотя работа, необходимая для того, чтобы сделать эту новую модель такой же простой в использовании, как и текущие модели, все еще продолжается, мы выпускаем раннюю версию этой модели, OpenAI o1-preview, для немедленного использования в ChatGPT и для доверенных пользователей API».

Часто возникает соблазн антропоморфизировать такие языковые модели; они не являются людьми, но поскольку они обучены на таком большом количестве человеческих знаний, часто возникают некоторые параллели. В этом случае o1 достигает гораздо более высокой производительности при выполнении сложных задач, чем предыдущие модели, по сути, набрасывая все, с чем ему предстоит работать, разбивая большую работу на более мелкие задачи, рекурсивно проверяя свою работу и подвергая сомнению собственные предположения — все это за кулисами и до того, как он начнет давать ответ.

В то время как GPT-4o обычно сразу приступает к написанию ответа, o1 может обдумывать вопрос некоторое время, планируя свой ответ. Это длится не долго – может быть, 10-20 секунд – но, кажется, это имеет решающее значение, когда дело доходит до тех сложных проблем, с которыми обычно сталкивались эти LLM (большие языковые модели).

<strong>o1</strong> значительно превосходит <strong>GPT-4o</strong> в сложных тестах рассуждений. — o1 значительно превосходит **GPT-4o** в сложных тестах рассуждений.

Выходит, чем дольше он думает, тем лучше становится его ответ, и хотя выпущенные сегодня продукты будут размышлять над чем-то в течение нескольких секунд, OpenAI утверждает, что, вероятно, имеет смысл выпускать будущие версии, которые будут тратить часы, дни или даже недели на тщательное решение масштабных, сложных проблем, создавая множество решений, сравнивая их друг с другом и, наконец, давая ответ.

Что все это означает? Проще говоря, ChatGPT стал намного более способным выполнять более крупные, сложные и комплексные задачи. Логические рассуждения и планирование являются важнейшими строительными блоками на пути к большой цели: модели ИИ, которая может взять идею и просто воплотить ее в жизнь, потратив столько времени, сколько потребуется, тщательно проверяя свою работу по мере ее выполнения, а также собирая и развертывая все необходимые ресурсы по ходу дела.

«o1 значительно продвигает передовые разработки в области рассуждений ИИ. Мы планируем выпустить улучшенные версии этой модели по мере продолжения итераций. Мы ожидаем, что эти новые возможности рассуждений улучшат нашу способность согласовывать модели с человеческими ценностями и принципами. Мы считаем, что o1 и его последователи откроют множество новых вариантов использования ИИ в науке, кодировании, математике и смежных областях. Мы рады, что пользователи и разработчики API узнают, как это может улучшить их повседневную работу» — говорит команда OpenAI в своем заявлении.