В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS». Об этом 21 декабря сообщила пресс-служба ТГУ.

Задача сервиса - ускорить сбор информации, публикации новости и решить вопрос с достоверностью журналистских материалов. Проект разрабатывается и будет реализован совместно с партнером ТГУ — международной группой IT-компаний «Элекард».

Разработанная нейросеть способна создавать и проверять новости с помощью нейронных сетей и синтаксических программ, проводящих анализ данных с веб-ресурсов. Они работают на основе лингвистического преданализа особенностей текста, создания тематических словарей и формальных грамматик. Нейросеть извлекает из неструктурированных текстов факты (по модели «кто, что, где, когда») и синтезирует заголовок новости. Если на поиск и анализ у журналиста уходит минимум пять минут, то машина справляется с этим в считанные секунды. При этом ценность журналиста как творческой единицы, способной к аналитике и интерпретации, становится выше.

Аналогичные программы уже существуют, но функционал созданного молодыми учёными ТГУ сервиса гораздо шире. Например, пользователь может выбрать вариант заголовка как полностью собранного нейросетью, так и образованного при помощи формальных грамматик, что позволяет формировать и стиль новостного текста. Преимущество «WORLD2NEWS» — высокая формальная точность. Это делает сгенерированные тексты максимально похожими на журналистские. Точность определяется по показателям BLEU-score, алгоритма оценки качества текста, автоматически переведенного с одного естественного языка на другой. Качество перевода определяется правилом: «чем ближе машинный перевод к профессиональному человеческому переводу, тем лучше».

Ранее члены команды рассказывали о том, что работа начиналась как обычный студенческий проект. Уже в процессе реализации был создан сервис с набором востребованных при автоматической обработки текстовой информации функций.

Разработчики онлайн-сервиса не собираются останавливаться на достигнутом. Пока что «WORLD2NEWS» — лишь действующий прототип. В планах работа по оптимизации формальных грамматик и разработке новых решений, основанных на нейронных сетях.

URL: https://babr24.com/?ADE=208647

Bytes: 2427 / 2371

Версия для печати

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- Джем
- ВКонтакте
- Одноклассники

Связаться с редакцией Бабра в Томской области:
tomsk.babr@gmail.com