Нейронная сеть изучает кварк-глюонную плазму в Большом адронном коллайдере
Компьютеры могут обыгрывать чемпионов в шахматы, имитировать звездные взрывы и прогнозировать глобальный климат. Мы учим их быть непогрешимыми решателями проблем и способными учениками.
И теперь физики из Лаборатории Лоуренса Беркли (Berkeley Lab) продемонстрировали, что компьютеры готовы решать величайшие тайны Вселенной. Команда подготовила тысячи изображений из симулированных столкновений частиц высоких энергий для обучения компьютерных сетей, чтобы выявить важные особенности таких столкновений.
Исследователи запрограммировали мощные массивы, известные как нейронные сети, чтобы служить своего рода цифровым мозгом в анализе и интерпретации изображений смоделированных частиц, оставшихся от столкновений. Во время этого теста исследователи обнаружили, что нейронные сети достигли 95-процентного успеха в распознавании важных характеристик в выборке из примерно 18 000 изображений.
Исследование было опубликовано в журнале Nature Communications.
Следующим шагом будет применить тот же процесс машинного обучения к фактическим экспериментальным данным.
Мощные алгоритмы машинного обучения позволяют этим сетям улучшать свой анализ при обработке большего количества изображений. Основная технология используется для распознавания лиц и других типов приложений распознавания объектов на основе изображений.
Изображения, использованные в этом исследовании, относящиеся к экспериментам по ядерной физике частиц в релятивистском ионном коллайдере Брукхейвенской национальной лаборатории и Большом адронном коллайдере CERN — воссоздают условия «супа» субатомных частиц, который представляет собой состояние суперхолодной жидкости, известное как кварк-глюонная плазма, которая существовала лишь через миллионные доли секунды после рождения Вселенной. Физики Berkeley Lab участвуют в экспериментах на обоих этих коллайдерах.
«Мы пытаемся узнать о самых важных свойствах кварк-глюонной плазмы», — сказал Синь-Нянь Ван, физик-ядерщик в Отделе ядерных исследований лаборатории Беркли, который является членом команды ученых. Некоторые из этих свойств настолько недолговечны и происходят в таких крошечных масштабах, что они до сих пор остаются в тайне.
В экспериментах ядерные физики используют коллайдеры частиц, чтобы разбить тяжелые ядра, такие как атомы золота или свинца. Считается, что эти столкновения освобождают частицы внутри ядер атомов, образуя мимолетный огненный шар в субатомном масштабе, который разрушает даже протоны и нейтроны в свободно плавающие формы их обычно связанных структурных блоков: кварков и глюонов.
Исследователи надеются, что, изучив точные условия, в которых образуется эта кварк-глюонная плазма, например, сколько энергии необходимо, а также ее температура и давление при переходе в жидкое состояние, они получат новые сведения о своих компонентных частицах материи и их свойства, а также о этапах формирования Вселенной.
Но измерения этих свойств — так называемое «уравнение состояния», участвующее в изменении материи от одной фазы к другой в этих столкновениях, оказались сложными. Исходные условия в экспериментах могут влиять на результат, поэтому сложно вывести измерения состояния, которые не зависят от этих условий.
«В сообществе ядерной физики это «святой Грааль» — увидеть фазовые переходы в этих высокоэнергетических взаимодействиях, а затем определить уравнение состояния из экспериментальных данных», — сказал Ванг. «Это самое важное свойство кварк-глюонной плазмы, которую нам еще предстоит извлечь из экспериментов».
Исследователи также ищут представление о фундаментальных силах, которые регулируют взаимодействия между кварками и глюонами, что физики называют квантовой хромодинамикой.
Long-Gang Pang, ведущий автор последнего исследования и научный сотрудник Berkeley из Калифорнийского университета в Беркли, сказал, что в 2016 году, будучи докторантом в Франкфуртском институте перспективных исследований, он заинтересовался потенциалом искусственного интеллекта (AI), чтобы помочь решить сложные научные проблемы.
Он видел, что одна из форм ИИ, известная как глубокая сверхточная нейронная сеть — с архитектурой, вдохновленной процессами обработки изображений в мозгу животных, оказалась очень хороша для анализа образов, связанных с научными экспериментами.
«Эти сети могут распознавать шаблоны и оценивать позиции на досках и отдельные движения в игре Go», — сказал Панг. «Мы думали: «Если у нас есть визуальные научные данные, возможно, мы сможем получить от этого абстрактную концепцию или ценную физическую информацию».
Он добавил: «При таком способе машинного обучения мы пытаемся идентифицировать определенную структуру или корреляцию шаблонов, которая является уникальной сигнатурой уравнения состояния». Поэтому после обучения сеть может точно определить части и корреляции в изображении, если они существуют, которые наиболее важны для той проблемы, которую пытаются решить ученые.
Накопление данных, необходимых для анализа, может быть очень интенсивным с точки зрения вычислительной мощности, говорит Панг, и в некоторых случаях для создания всего одного изображения потребовался целый день вычислительного времени. Когда исследователи использовали массив графических процессоров, которые работают параллельно — графические процессоры представляют собой единицы обработки графики, которые были впервые созданы для улучшения эффектов видеоигр и с тех пор использовались в самых разных целях — они сократили это время примерно до 20 минут на изображение.
В своих исследованиях они использовали вычислительные ресурсы в исследовательском научно-вычислительном центре Berkeley Lab (NERSC), большинство из которых были сосредоточены на кластерах GPU в GSI в Германии и в Центральном Китайском педагогическом университете в Китае.
Исследователи отметили, что преимущество использования сложных нейронных сетей заключается в том, что они могут идентифицировать функции, которые исследователи даже не искали в первоначальном эксперименте — это например как, найти иголку в стоге сена, когда вы ее даже не планировали искать. И они могут извлекать полезные детали даже из нечетких изображений.
«Даже если вы имеете низкое разрешение, вы все равно можете получить важную информацию», — сказал Панг.
Уже ведется обсуждение применения инструментов машинного обучения к данным реальных экспериментов по столкновению тяжелых ионов, и имитируемые результаты должны быть полезны в обучении нейронных сетей для интерпретации реальных данных.
Больше информации: Long-Gang Pang et al, An equation-of-state-meter of quantum chromodynamics transition from deep learning, Nature Communications (2018). DOI: 10.1038/s41467-017-02726-3