Российские программисты создали первый в мире ИИ, который пишет заголовки новостей точнее человека
Уникальную нейросеть, способную быстро сочинять яркие и точные заголовки к новостям и статьям, представили IT-специалисты из Владивостока.
Функция примечательна тем, что нейросеть моментально создаёт привлекательный заголовок как профессиональный журналист или писатель. Ряд опросов показал, что написанные новым ИИ заголовки невозможно отличить от придуманных человеком.
Сотни учёных со всего мира годами трудятся над созданием искусственного интеллекта, который станет помощником человека, в том числе, в написании правдивых новостных текстов. И до сих пор некоторые эксперты уверены, что обучить ИИ анализировать текстовую информацию и всегда выдавать точный результат невозможно.
PR-специалист, эксперт по ИИ-технологиям Алексей Кошляков:
«Уверен, что сервисы, которые сейчас выдают за ИИ — это по большей части подмена понятий. Это логический алгоритм, который за основу берёт лид (первый абзац) и зачастую, даже неверно строит предложение. ИИ должен найти всё самое интересное, возможно даже то, что упустил автор или журналист. В ближайшем, да и в далёком будущем, подобные сервисы точно не заменят коллег журналистов. Журналистка — творческая профессия, которая всецело зависит от человека, его опыта, мастерства, пронырливости и пытливости ума. Сегодня подобные ИИ, пока остаются игрушкой и не более»
Несмотря на сомнения многих, команда программистов, филологов и лингвистов из Владивостока сделала «невозможное», выпустив первого в мире создателя заголовков новостей с искусственным интеллектом Turbocheck, который без труда понимает невероятно сложный русский язык.
Попытки генерации текстов и заголовков предпринимались и ранее, но были менее успешны: часто терялась логика и суть, тексты получались не связными или не соответствовали реальности.
«Это первая нейросеть, которая так хорошо понимает контекст сложного русского языка. Попытки других разработчиков были менее успешны: заголовки получались не всегда логичными, точными и не соответствовали признакам привлекательности или народности выражений. Turbocheck создаёт заглавия в точности как человек, более того, как профессиональный журналист, но точно не как робот», — заявил руководитель разработки АТА Ltd (ООО «АТА») Андрей Швец.
Энтузиасты трудились над проектом два года. Сложнее всего далось решение проблемы законного сбора хороших данных для обучения. В бесплатном доступе находились датасеты некоторых известных медиа-сайтов, но они не представляли реальной пользы для обучения.
Команде удалось собрать свою базу данных из более чем миллиона новостей и информационных статей, написанных сотнями журналистов. После с помощью алгоритма GPT-3 и собственных наработок им удалось провести успешное обучение робота.
Интересно, что уникальный искусственный интеллект был обучен с помощью суперкомпьютера Кристофари от Сбербанка, 10-го по мощности в мире.
Руководитель группы разработчиков рассказал, кому и чем полезен новый сервис:
«Разработка может помочь журналистике избавиться от чрезмерных оценочных суждений в заголовках и от обмана читателей кликбейтными заголовками, которые распространились последнее время во многих медиа-изданиях».
Чтобы оценить точность работы искусственного интеллекта Turbocheck, разработчики провели опросы на улицах Владивостока, а также на специализированных форумах и в соцсетях. Участники эксперимента оценивали заголовки опытных журналистов и заглавия ИИ. Респондентам не сообщали о происхождении заголовков для чистоты эксперимента. По результатам исследования 65% участников посчитали заголовки нейросети более привлекательными. При этом почти 100% не смогли отличить заголовки ИИ от написанных человеком.
Несмотря на недавний запуск сервиса, он успел стать популярным у сотен российских журналистов, авторов и блогеров. Ведь нейросеть Turbocheck умеет не только создавать заголовки, но и проверять их на привлекательность, а ещё помогает устранять кликбейт и улучшать стилистику текста. В планах у команды создать полезного помощника журналисту, который сам будет писать профессиональный текст на основе полученных от автора данных.