Нейробиология

Нейробиологи раскрыли механизм коктейльной вечеринки

Секрет избирательного слуха: модель MIT доказала роль усиления нейронов в распознавании речи

Нейробиологи из Массачусетского технологического института (MIT) выяснили, каким образом мозгу удается избирательно фокусироваться на одном голосе среди множества других, что позволяет пролить свет на механизм решения так называемой «проблемы коктейльной вечеринки». Используя вычислительную модель слуховой системы, исследователи обнаружили, что ключевую роль в этом процессе играет усиление активности нейронов, настроенных на определенные характеристики звука, такие как высота голоса. Результаты этой работы были опубликованы в журнале Nature Human Behavior.

Суть феномена, давно известного нейробиологам как «проблема коктейльной вечеринки», знакома каждому: находясь в шумном помещении, где одновременно звучит множество голосов, человек способен без особых усилий следить за разговором с конкретным собеседником. До сих пор оставалось загадкой, какие именно нейронные механизмы лежат в основе этой способности. Предыдущие исследования на людях и животных показали, что при фокусировке внимания на определенном звуке нейроны слуховой коры, отвечающие за характеристики этого звука, повышают свою активность. Однако было неясно, достаточно ли этого усиления для объяснения сложного поведения человека в реальной акустической среде.

Команда под руководством профессора Джоша Макдермотта из MIT подошла к решению этой задачи, создав вычислительную модель, имитирующую работу слуховой системы. Исследователи модифицировали существующую нейросетевую модель слуха, добавив в нее возможность «мультипликативного усиления» — механизма, при котором активность определенных обрабатывающих единиц в модели увеличивается или уменьшается в зависимости от того, на какой признак звука нужно обратить внимание.

В ходе эксперимента модели сначала давали прослушать «сигнал» — образец голоса, на который следовало настроиться. Активации, вызванные этим сигналом, задавали коэффициенты усиления для последующего анализа смеси голосов. Например, если целевой голос был низким, единицы модели, чувствительные к низким частотам, усиливались, а чувствительные к высоким ослаблялись.

Результаты оказались поразительными: модель не только успешно справлялась с задачей выделения нужного голоса, но и демонстрировала паттерны поведения и ошибки, свойственные человеку. В частности, модель, как и люди, чаще ошибалась, когда нужно было различить два голоса одного пола, так как их высота тона слишком близка.

Как объясняет ведущий автор исследования Иэн Гриффит: «Реакции нейронов, настроенных на признаки, находящиеся в объекте внимания, усиливаются. Эти эффекты известны очень давно, но оставалось неясным, достаточно ли этого эффекта, чтобы объяснить, что происходит, когда вы пытаетесь обратить внимание на голос или избирательно сосредоточиться на одном объекте». Данное исследование впервые убедительно доказало, что одного лишь механизма усиления достаточно.

Кроме того, модель позволила ученым сделать новые открытия, касающиеся роли пространственного слуха. Оказалось, что модель лучше всего справлялась с задачей, когда целевой голос и голоса-помехи были разделены в горизонтальной плоскости. Разделение же в вертикальной плоскости практически не давало преимуществ. Последующий эксперимент с участием людей полностью подтвердил это, что демонстрирует мощь вычислительного подхода для генерации и проверки гипотез.

В итоге исследователям из Массачусетского технологического института удалось не только создать работающую модель избирательного слухового внимания, но и экспериментально подтвердить, что ключевым механизмом, решающим «проблему коктейльной вечеринки», является мультипликативное усиление активности нейронов, отвечающих за характеристики целевого звука. Модель точно воспроизвела широкий спектр поведенческих реакций человека и позволила выявить новые свойства пространственного слуха, что открывает перспективы для практического применения, в частности, для улучшения алгоритмов работы кохлеарных имплантов, помогая людям лучше ориентироваться в шумной обстановке.

Научная публикация:

Griffith, I.M., Hess, R.P. & McDermott, J.H. Optimized feature gains explain and predict successes and failures of human selective listening. Nat Hum Behav (2026). https://doi.org/10.1038/s41562-026-02414-7

Ваша реакция?
Источник
MIT News
Показать полностью
Подписаться
Уведомление о
guest
0 Комментарий
Первые
Последние Популярные
Встроенные отзывы
Посмотреть все комментарии
Back to top button