В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS». Об этом 21 декабря сообщила пресс-служба ТГУ.

Задача сервиса - ускорить сбор информации, публикации новости и решить вопрос с достоверностью журналистских материалов. Проект разрабатывается и будет реализован совместно с партнером ТГУ — международной группой IT-компаний «Элекард».

Разработанная нейросеть способна создавать и проверять новости с помощью нейронных сетей и синтаксических программ, проводящих анализ данных с веб-ресурсов. Они работают на основе лингвистического преданализа особенностей текста, создания тематических словарей и формальных грамматик. Нейросеть извлекает из неструктурированных текстов факты (по модели «кто, что, где, когда») и синтезирует заголовок новости. Если на поиск и анализ у журналиста уходит минимум пять минут, то машина справляется с этим в считанные секунды. При этом ценность журналиста как творческой единицы, способной к аналитике и интерпретации, становится выше.

Аналогичные программы уже существуют, но функционал созданного молодыми учёными ТГУ сервиса гораздо шире. Например, пользователь может выбрать вариант заголовка как полностью собранного нейросетью, так и образованного при помощи формальных грамматик, что позволяет формировать и стиль новостного текста. Преимущество «WORLD2NEWS» — высокая формальная точность. Это делает сгенерированные тексты максимально похожими на журналистские. Точность определяется по показателям BLEU-score, алгоритма оценки качества текста, автоматически переведенного с одного естественного языка на другой. Качество перевода определяется правилом: «чем ближе машинный перевод к профессиональному человеческому переводу, тем лучше».

Ранее члены команды рассказывали о том, что работа начиналась как обычный студенческий проект. Уже в процессе реализации был создан сервис с набором востребованных при автоматической обработки текстовой информации функций.

Разработчики онлайн-сервиса не собираются останавливаться на достигнутом. Пока что «WORLD2NEWS» — лишь действующий прототип. В планах работа по оптимизации формальных грамматик и разработке новых решений, основанных на нейронных сетях.

URL: http://babr24.com/tmk/?IDE=208647

bytes: 2444 / 2371

Обсудить на форуме Бабра в Telegram

Поделиться в соцсетях:

Автор текста: Пепел.

Другие статьи в рубрике "Интернет и ИТ" (Томск)

В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS».

Пепел

Интернет и ИТНаука и технологииТомск

5436

24.12.2020

Инсайд. 2020 год: тренды киберпреступлений

2020 год проходит в контексте вирусной повестки и не только в здравоохранении. Если верить аналитикам Group-IB, в киберпространстве сейчас тоже пандемия. Сегодня на конференции CyberCrimeCon2020 компания обнародовала свой ежегодный отчет Hi Tech Crime Trends о трендах киберпреступлений.

Максим Бакулев

Интернет и ИТКриминалРасследованияМир

3172

26.11.2020

Безопасность превыше всего: что делать, если ваши данные украдены, и как предотвратить атаку мошенников

Ни один человек не застрахован от кражи личных данных мошенниками, ведь злоумышленники постоянно действуют по-новому и придумывают изощрённые варианты для совершения своих действий.

Станислав Цырь

Интернет и ИТНаука и технологииМир

12620

22.11.2020

Спутниковый интернет Илона Маска приятно удивил первых пользователей

В октябре 2020 на территории США и Канады началось публичное бета-тестирование интернет-сервиса Starlink. Система тестировалась в разных погодных условиях, в том числе и экстремальных. Связь не прервалась даже в бурю. Почти все пользователи сообщили, что получают скорость загрузки выше 150 Мбит/с.

Алиса Канарис

Интернет и ИТНаука и технологииМир

4831

20.11.2020

Цифровизация оказалась благом

Все же нужно отметить, что иногда наша власть держит слово. Путинский «червонец», то есть единовременное пособие на ребенка, я получил. На его оформление не потребовалось много времени и сил, вся процедура до перечисления заняла всего девять дней, и происходила, главным образом, в интернете.

Дмитрий Верхотуров

Интернет и ИТЭкономика и бизнесНаука и техникаМир

16155

09.06.2020

Пользователей Mozilla Firefox затопило всплывающей рекламой

В 00:00 по UTC 4 мая у части пользователей браузера Firefox от Mozilla отключились все расширения. Причиной этого стало истечение действия промежуточного сертификата. Все установленные дополнения попали в список «Устаревшие расширения».

Саша Савельева

Интернет и ИТМир

9602

06.05.2019

Инсайд. YouTube 2018 — очень проблемный год главного видеохостинга Сети

13 декабря YouTube Rewind 2018 стал роликом с самым большим количеством дизлайков в истории. Видос, снятый самим Ютубом, должен был показать самые важные события, засветить топовых блогеров и подвести итоги года. В определённом смысле подвёл. 15 миллионов дизов и массовый хейт.

Василий Чайкин

Интернет и ИТМир

7297

06.01.2019

Что знает о тебе твой интернет-провайдер

Вообще с провайдерами не все так просто, они по закону должны прослушивать трафик пользователей — не нарушают ли они закон, что они там делают, они конечно не смотрят, но записывают основные данные, люди их без причины не проверяют (то есть это все записывается в автоматическом режиме).

Максим Бакулев

Интернет и ИТМир

6297

10.07.2017

Вороны оказались очень злопамятными

Строительство мусоросортировочной станции в Иркутске приостановлено Из-за участившихся жалоб жителей близлежащих домов строительство мусоросортировочного комплекса в Иркутске по улице Полярная 97 будет приостановлено.

iFox

Интернет и ИТОбществоМир

4349

07.06.2017

«Группы смерти»: миф на фоне истерии

Российский интернет буквально заполонен страшилками о так называемых «группах смерти» – неких закрытых сообществах в соцсетях, которые якобы сподвигают сотни детей кончать жизнь самоубийством.

Дмитрий Таевский

Интернет и ИТРасследованияОбществоМир

6437

20.03.2017

Роскомзапрет: война с ветряными мельницами

Роскомзапрет: война с ветряными мельницами Прошло полгода после принятия Госдумой скандального "пакета Яровой". Вполне достаточно для предварительной оценки деятельности Госдумы в сфере массовых коммуникаций и последствий многочисленных запретительных законов.

Леонид Улих, социальный эколог

Интернет и ИТРасследованияМир

9642

03.03.2017

"Робосиб-2016" пройдет в ноябре в Иркутске

En+ Group и Фонд Олега Дерипаска «Вольное Дело» организуют 24 и 25 ноября в Иркутске четвертый Главный сибирский фестиваль робототехники «РобоСиб–2016». Соревнования будут проходить по 18 направлениям. Прием заявок от команд-участниц стартует 31 октября на сайте фестиваля.

Алиса Канарис

Интернет и ИТНаука и техникаМир

5057

13.11.2016

Лица Сибири

Журавлев Игорь

Романова Яна

Тупицын Алексей

Кондратов Антон

Савин Александр

Шмидт Сергей

Гребенщиков Сергей

Гавриленко Дарья

Позников Сергей

Константинова Оксана