В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS». Об этом 21 декабря сообщила пресс-служба ТГУ.

Задача сервиса - ускорить сбор информации, публикации новости и решить вопрос с достоверностью журналистских материалов. Проект разрабатывается и будет реализован совместно с партнером ТГУ — международной группой IT-компаний «Элекард».

Разработанная нейросеть способна создавать и проверять новости с помощью нейронных сетей и синтаксических программ, проводящих анализ данных с веб-ресурсов. Они работают на основе лингвистического преданализа особенностей текста, создания тематических словарей и формальных грамматик. Нейросеть извлекает из неструктурированных текстов факты (по модели «кто, что, где, когда») и синтезирует заголовок новости. Если на поиск и анализ у журналиста уходит минимум пять минут, то машина справляется с этим в считанные секунды. При этом ценность журналиста как творческой единицы, способной к аналитике и интерпретации, становится выше.

Аналогичные программы уже существуют, но функционал созданного молодыми учёными ТГУ сервиса гораздо шире. Например, пользователь может выбрать вариант заголовка как полностью собранного нейросетью, так и образованного при помощи формальных грамматик, что позволяет формировать и стиль новостного текста. Преимущество «WORLD2NEWS» — высокая формальная точность. Это делает сгенерированные тексты максимально похожими на журналистские. Точность определяется по показателям BLEU-score, алгоритма оценки качества текста, автоматически переведенного с одного естественного языка на другой. Качество перевода определяется правилом: «чем ближе машинный перевод к профессиональному человеческому переводу, тем лучше».

Ранее члены команды рассказывали о том, что работа начиналась как обычный студенческий проект. Уже в процессе реализации был создан сервис с набором востребованных при автоматической обработки текстовой информации функций.

Разработчики онлайн-сервиса не собираются останавливаться на достигнутом. Пока что «WORLD2NEWS» — лишь действующий прототип. В планах работа по оптимизации формальных грамматик и разработке новых решений, основанных на нейронных сетях.

Новости Томской области - теперь в Вайбере. Только эксклюзив! Подписывайтесь!

URL: http://babr24.com/tmk/?IDE=208647

bytes: 2444 / 2371

Обсудить на форуме Бабра в Telegram

Поделиться в соцсетях:

Автор текста: Пепел.

Другие статьи в рубрике "Интернет и ИТ" (Томск)

Что такое NFT-токены и почему весь мир на них помешался?

Новый тренд на NFT-токены приносит создателям миллионы долларов, а покупателям даёт право на «кусочек интернета». Картинки, музыка, видео, гифки и даже посты в соцсетях теперь можно купить на аукционе. Что же такое NFT-токены: очередной тренд, новая валюта или современное искусство?

Анна Амгейзер

Интернет и ИТЭкономика и бизнесНаука и технологииМир Россия Иркутск

7431

07.04.2021

В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS».

Пепел

Интернет и ИТНаука и технологииТомск

6052

24.12.2020

Инсайд. 2020 год: тренды киберпреступлений

2020 год проходит в контексте вирусной повестки и не только в здравоохранении. Если верить аналитикам Group-IB, в киберпространстве сейчас тоже пандемия. Сегодня на конференции CyberCrimeCon2020 компания обнародовала свой ежегодный отчет Hi Tech Crime Trends о трендах киберпреступлений.

Максим Бакулев

Интернет и ИТКриминалРасследованияМир

4516

26.11.2020

Безопасность превыше всего: что делать, если ваши данные украдены, и как предотвратить атаку мошенников

Ни один человек не застрахован от кражи личных данных мошенниками, ведь злоумышленники постоянно действуют по-новому и придумывают изощрённые варианты для совершения своих действий.

Станислав Цырь

Интернет и ИТНаука и технологииМир

13432

22.11.2020

Спутниковый интернет Илона Маска приятно удивил первых пользователей

В октябре 2020 на территории США и Канады началось публичное бета-тестирование интернет-сервиса Starlink. Система тестировалась в разных погодных условиях, в том числе и экстремальных. Связь не прервалась даже в бурю. Почти все пользователи сообщили, что получают скорость загрузки выше 150 Мбит/с.

Алиса Канарис

Интернет и ИТНаука и технологииМир

5533

20.11.2020

Цифровизация оказалась благом

Все же нужно отметить, что иногда наша власть держит слово. Путинский «червонец», то есть единовременное пособие на ребенка, я получил. На его оформление не потребовалось много времени и сил, вся процедура до перечисления заняла всего девять дней, и происходила, главным образом, в интернете.

Дмитрий Верхотуров

Интернет и ИТЭкономика и бизнесНаука и техникаМир

18801

09.06.2020

Пользователей Mozilla Firefox затопило всплывающей рекламой

В 00:00 по UTC 4 мая у части пользователей браузера Firefox от Mozilla отключились все расширения. Причиной этого стало истечение действия промежуточного сертификата. Все установленные дополнения попали в список «Устаревшие расширения».

Саша Савельева

Интернет и ИТМир

10163

06.05.2019

Инсайд. YouTube 2018 — очень проблемный год главного видеохостинга Сети

13 декабря YouTube Rewind 2018 стал роликом с самым большим количеством дизлайков в истории. Видос, снятый самим Ютубом, должен был показать самые важные события, засветить топовых блогеров и подвести итоги года. В определённом смысле подвёл. 15 миллионов дизов и массовый хейт.

Василий Чайкин

Интернет и ИТМир

7867

06.01.2019

Что знает о тебе твой интернет-провайдер

Вообще с провайдерами не все так просто, они по закону должны прослушивать трафик пользователей — не нарушают ли они закон, что они там делают, они конечно не смотрят, но записывают основные данные, люди их без причины не проверяют (то есть это все записывается в автоматическом режиме).

Максим Бакулев

Интернет и ИТМир

6714

10.07.2017

Вороны оказались очень злопамятными

Строительство мусоросортировочной станции в Иркутске приостановлено Из-за участившихся жалоб жителей близлежащих домов строительство мусоросортировочного комплекса в Иркутске по улице Полярная 97 будет приостановлено.

iFox

Интернет и ИТОбществоМир

4760

07.06.2017

«Группы смерти»: миф на фоне истерии

Российский интернет буквально заполонен страшилками о так называемых «группах смерти» – неких закрытых сообществах в соцсетях, которые якобы сподвигают сотни детей кончать жизнь самоубийством.

Дмитрий Таевский

Интернет и ИТРасследованияОбществоМир

7180

20.03.2017

Роскомзапрет: война с ветряными мельницами

Роскомзапрет: война с ветряными мельницами Прошло полгода после принятия Госдумой скандального "пакета Яровой". Вполне достаточно для предварительной оценки деятельности Госдумы в сфере массовых коммуникаций и последствий многочисленных запретительных законов.

Леонид Улих, социальный эколог

Интернет и ИТРасследованияМир

10660

03.03.2017

Лица Сибири

Лыкова Мария

Душутин Николай

Соколов Алексей

Вакуленко Григорий

Демчиков Владимир

Матюха Виталий

Борзых Павел

Щапов Виктор

Коженков Сергей

Распутин Алексей