В книгах женщины красивы и сексуальны, мужчины рациональны и смелы
Используя новую компьютерную модель, исследователи проанализировали набор данных из 3,5 миллионов книг
Исследователь Копенгагенского университета Изабель Аугенштейн и ее коллеги проанализировали 3,5 миллиона художественных и научно-популярных книг, опубликованных на английском языке в период с 1900 по 2008 год, чтобы выяснить, есть ли разница между типами слов, используемых для описания мужчин и женщин в литературе.
«Мы ясно видим, что слова, используемые для женщин, имеют гораздо большее отношение к их внешнему виду, чем слова, используемые для описания мужчин», — говорит Изабель Аугенштейн. «Таким образом, мы смогли подтвердить широко распространенное восприятие, только теперь на статистическом уровне».
Используя новую компьютерную модель, исследователи из Университетского колледжа Лондона, Университета Джонса Хопкинса, Microsoft Research и Кембриджского университета проанализировали набор данных из 3,5 миллионов книг.
Ученые извлекли прилагательные и глаголы, связанные с существительными, относящимися к полу (например, «девушка» и «стюардесса»). Например, в таких сочетаниях, как «сексуальная стюардесса» или «симпатичная девушка».
Затем они проанализировали, имели ли слова позитивное, негативное или нейтральное отношение, а затем на какие категории можно разделить слова.
«Наш анализ показывает, что отрицательные глаголы, связанные с телом и внешним видом, используются для женщин в пять раз чаще, чем для мужчин», — сказали они.
«Анализ также показывает, что положительные и нейтральные прилагательные, относящиеся к телу и внешнему виду, встречаются примерно в два раза чаще в описании женщин, в то время как мужчины чаще всего описываются с помощью прилагательных, которые относятся к их поведению и личным качествам».
«Красивые» и «сексуальные» были двумя прилагательными, наиболее часто используемыми для описания женщин; обычно используемые дескрипторы для мужчин включают в себя «справедливые», «рациональные» и «смелые».
«Хотя многие книги были опубликованы несколько десятилетий назад, они по-прежнему играют активную роль», — говорит Изабель Аугенштейн. «Поскольку искусственный интеллект и языковые технологии становятся все более заметными в обществе, важно осознавать гендерный язык», — добавила она.
«Мы можем попытаться принять это во внимание при разработке моделей машинного обучения, используя либо менее предвзятый текст, либо заставляя модели игнорировать или противодействовать предвзятости. Все три вещи возможны».
Alexander Hoyle et al. 2019. Unsupervised Discovery of Gendered Language through Latent-Variable Modeling. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1706-1716