Для хранения языковой информации мозгу требуется примерно 1,5 мегабайта данных
Ученые предприняли задачу преобразования всех способов, которыми наш мозг мог бы хранить язык в объемах данных
Исследователи из Университета Рочестера и Калифорнийского университета, обнаружили, что объем всех данных, необходимых для хранения и использования английского языка в мозге, составляет примерно 1,5 мегабайта.
В своей статье, опубликованной в журнале Royal Society Open Science, Фрэнсис Моллика и Стивен Пиантадоси описывают применение теории информации для суммирования объема данных, необходимых для хранения различных частей английского языка.
В младенчестве люди начинают приобретать языковые навыки и говорить на языке окружающих — как это происходит, до сих пор остается загадкой, но ученые знают, что это влечет за собой гораздо больше, чем просто хранение слов наряду с определениями, как в словаре.
Например, есть ассоциативные подсказки со словами. Есть также информация, которая говорит мозгу, как произносить слово и как его можно и нельзя использовать с другими словами, а также звуки, из которых состоит слово при произношении.
Ученые предприняли задачу преобразования всех способов, которыми наш мозг мог бы хранить язык в объемах данных. Для этого они использовали информационную теорию, раздел математики, который фокусируется на том, как информация кодируется с помощью последовательностей символов.
Чтобы сделать свои расчеты, исследователи присвоили количественные оценки для различных аспектов английского языка. Они начали с присвоения фонем, звуков, которые складываются в произнесенные слова.
Ученые отметили, что люди используют приблизительно 50 фонем, и предположили, что для хранения каждой из них потребуется около 15 бит. Затем они перешли к словарю, оценивая, что средний человек знает приблизительно 40 000 слов — вместе взятые, они оценили, что это будет составлять приблизительно 400 000 бит.
Следующим в списке была семантика для этих 40000 слов, что в сумме составило примерно 12 миллионов бит. Они также отметили, что частота слов важна — и добавили еще 80000 бит, чтобы объяснить это.
Кроме этого, еще 700 бит было добавлено для хранения правил синтаксиса. Суммарно все сложилось примерно в 1,56 мегабайта — почти столько же, сколько нужно для хранения одной цифровой картинки.
Francis Mollica et al. Humans store about 1.5 megabytes of information during language acquisition, Royal Society Open Science (2019). DOI: 10.1098/rsos.181393