Ученые создают ИИ для научных открытий, используя технологию ChatGPT
Международная группа ученых запустила новое исследовательское сотрудничество, которое будет использовать ту же технологию, что и ChatGPT, для создания инструмента на базе искусственного интеллекта для научных открытий.
Пока ChatGPT обрабатывает слова и предложения, ИИ команды будет учиться на числовых данных и физическом моделировании из разных научных областей, чтобы помочь ученым в моделировании всего: от звезд-сверхгигантов до климата Земли.
Ранее на этой неделе команда запустила инициативу под названием Polymathic AI, одновременно с публикацией серии связанных статей в arXiv.
«Это полностью изменит то, как люди используют искусственный интеллект и машинное обучение в науке», — сказала главный исследователь Polymathic AI Ширли Хо, руководитель группы в Центре вычислительной астрофизики Института Флэтайрон в Нью-Йорке.
Идея Polymathic AI «похожа на то, что легче выучить новый язык, если вы уже знаете пять языков», — сказал Ширли Хо.
Начать с большой предварительно обученной модели, известной как базовая модель, может быть быстрее и точнее, чем создавать научную модель с нуля. Это может быть правдой, даже если данные обучения не имеют очевидного отношения к рассматриваемой проблеме.
«Полиматический ИИ может показать нам общие черты и связи между различными областями, которые могли быть упущены», — говорят ученые.
«В предыдущие столетия некоторые из самых влиятельных ученых были эрудитами с широким пониманием различных областей. Это позволяло им видеть связи, которые помогали черпать вдохновение для своей работы. Поскольку каждая научная область становится все более специализированной, оставаться в авангарде в нескольких областях становится все сложнее. ИИ может помочь нам, объединяя информацию из многих дисциплин».
В команду Polymathic AI входят исследователи из Фонда Саймонса и его Института Флэтайрон, Нью-Йоркского университета, Кембриджского университета, Принстонского университета и Национальной лаборатории Лоуренса Беркли. В команду входят эксперты в области физики, астрофизики, математики, искусственного интеллекта и нейробиологии.
Ученые и раньше использовали инструменты искусственного интеллекта, но в основном они создавались специально и обучались с использованием соответствующих данных.
«Несмотря на быстрый прогресс машинного обучения в последние годы в различных научных областях, почти во всех случаях решения машинного обучения разрабатываются для конкретных случаев использования и обучаются на очень конкретных данных», — сказал соавтор исследования Франсуа Ланусс из CNRS, Франция.
«Это создает границы как внутри, так и между дисциплинами, а это означает, что ученые, использующие ИИ для своих исследований, не получают выгоды от информации, которая может существовать, но в другом формате или совершенно в другой области».
Проект Polymathic AI будет учиться, используя данные из различных источников в области физики и астрофизики (и, в конечном счете, в таких областях, как химия и геномика, говорят его создатели), и применять этот междисциплинарный опыт к широкому кругу научных проблем.
Проект «соединит многие, казалось бы, несопоставимые подобласти в нечто большее, чем просто сумма их частей», — сказала участница проекта Мариэль Петти, научный сотрудник Национальной лаборатории Лоуренса в Беркли.
«Неясно, как далеко мы сможем зайти в этих прыжках между дисциплинами», — сказал Ширли Хо. «То, что мы хотим сделать — попытаться воплотить проект в жизнь».
ChatGPT имеет хорошо известные ограничения, когда дело касается точности (например, чат-бот говорит, что 2023 умножить на 1234 — это 2497582, а правильный ответ — 2496382).
По словам ученых, проект Polymathic AI позволит избежать многих из этих ошибок, рассматривая числа как реальные числа, а не просто символы того же уровня, что и буквы и знаки препинания. В обучающих данных также будут использоваться реальные научные наборы данных, отражающие физику, лежащую в основе космоса.
Прозрачность и открытость являются важной частью проекта, сказал Ширли Хо. «Мы хотим, чтобы все стало достоянием общественности. Мы хотим демократизировать искусственный интеллект для науки таким образом, чтобы через несколько лет мы могли предложить сообществу предварительно подготовленную модель, которая поможет улучшить научный анализ по широкому спектру проблем и областей».