DeepMind создает универсального агента искусственного интеллекта для 3D-виртуальных сред
Google DeepMind заявляет, что создала «многомировой» ИИ-агент, который может следовать инструкциям на естественном языке и выполнять ряд задач в различных виртуальных трехмерных средах. То есть он может пройти за вас самые сложные моменты видеоигр.
Это возвращение к истокам DeepMind. Компания начала разработку искусственного интеллекта, научив его играть в старые аркадные игры, такие как Pong и Breakout, после чего быстро разобралась с такими играми, как го, шахматы, Stratego, Shogi, StarCraft II и тд.
После этого, объединившись с Google Brain, DeepMind в последние годы занималась другими делами, уделяя особое внимание таким вещам, как предсказание структуры белка — AlphaFold и технология обнаружения кристаллических материалов — GNoME.
Но теперь, благодаря проекту SIMA, ИИ DeepMind получают шанс снова поиграть в видеоигры.
Новая модель была обучена и протестирована в девяти 3D-играх с открытым миром, включая No Man’s Sky, Teardown и Goat Simulator, но идея здесь состоит в том, чтобы создать обобщенный ИИ-агент, который сможет взять на себя управление практически в любой 3D-игре и выполнять действия в ответ на голосовые команды.
В процессе обучения SIMA просто наблюдала за видео- и аудиовыходами игры, а также за командами клавиатуры и мыши пользователя-человека, одновременно слушая, как этот пользователь выполняет приказы от другого человека.
Она была обучена примерно по 600 базовым навыкам и в настоящее время может выполнять короткие одноэтапные задачи продолжительностью около десяти секунд, хотя DeepMind говорит, что вскоре она будет расширена для решения более крупных задач, которые включают «стратегическое планирование высокого уровня и множество подзадач».
Конечно, есть и более глобальная цель — модели ИИ учатся ориентироваться в физическом мире и выполнять полезную работу, воплощаясь во всевозможных роботах, гуманоидах или иных девайсах.
Эти машины «видят» мир через видеокамеры и сигналы датчиков, и хотя их схемы управления намного сложнее, чем обычная клавиатура плюс джойстик, есть еще одно огромное сходство: им будут говорить устно, что делать, и они должны будут разработать общий план, собрать ресурсы и выполнить все шаг за шагом.
Таким образом, в этом смысле агент видеоигр SIMA может стать строительным блоком для реального роботизированного решения сложных, скучных задач, которые люди не хотят выполнять.