Артур Скальский

© РИА-Новости

Интернет и ИТМир

2413

19.07.2013, 13:04

РИА Новости открывает доступ к открытым данным

Семантическая платформа РИА Новости представлена на Международном саммите по семантике и оценена экспертами как одна из ведущих в мире, сообщает Digit.ru.

Специалист по семантике Боннского университета профессор Сорен Ауэр (Soeren Auer) отметил, что даже открытые данные в формате "2 звезды" или "3 звезды" (в форматах xls и csv соответственно) уже замечательное достижение сейчас. Тем приятнее ему видеть такое большое количество проектов с открытыми данными в России, включая государственные проекты, касающиеся тендеров. А данные открытые по формату "5 звезд" до сих пор редкость и в Европе. Ауэр сообщил, что открытые базы в формате "5 звезд" в Европе принадлежат обычно госструктурам. По его словам СМИ в Европе только начали перевод имеющейся информации в открытые данные по формату "5 звезд", например холдинг BBC.

Профессор Кей Сан Чой (Key-Sun Choi) из корейского университета науки и технологий KAIST согласился, что даже открытие Россией 1000 наборов открытых данных – большой успех. Для сравнения он упомянул, что в Корее за предыдущий год переведено в открытые данные только около 500 наборов. При этом в формате "5 звезд" доступно менее чем сотня наборов форматов открытых данных и опять-таки все эти наборы раскрыты государственными органами. В отличие от России, СМИ Южной Кореи также не имеют пока открытых данных, представленных в формате "5 звезд", по словам профессора Чоя. Пока они применяются для госуслуг, хотя есть и бытовые примеры: например в Сеуле можно узнать расписание всех автобусов, сообщается на правительственном сайте, посвященном открытым данным.

Оба ученых отметили, что сейчас относительно налажен процесс передачи открытия данных "сверху вниз", от государства обществу, но пока есть сложности с механизмами открытия и обмена данных гражданами и организациями. Такой обмен, по мнению профессора Чоя, очень помог бы развитию многих сфер бизнеса. Например, в туристической сфере, важной для России, он полагает возможным сбор данных о качестве еды в ресторанах и сервиса в гостиницах методом краудфандинга. А профессор Ауэр упомянул, что использование собственной семантической платформы для обработки данных и дальнейшее открытие данных такого крупного СМИ как РИА Новости – это хороший пример открытия информации "снизу".

Директор офиса W3C в России и зам. директора института информационных технологий ВШЭ Виктор Клинцов считает, что внедрение новых цифровых технологий и переход на открытые данные уже вопрос выживания, а не прибыли. По его мнению, без современных семантических технологий (например, семантических платформ, необходимых для структурирования цифровых данных) через 2-3 года компании перестанут выживать. В США большая тройка New York Times, Associated press и Reuters занимаются вопросами семантики в отношении цифровых данных". Также он предположил, что наличие наборов открытых данных у российского и американских СМИ открывает возможность проведения совместных проектов по синхронизации этих данных.

В целом, по мнению Клинцова, Российское государство достаточно быстро организовало открытие данных и в дальнейшем это может помочь экономическому росту страны. Он сослался на опыт ЕС, где считается, что вложения государства в открытие данных окупится за счет роста малого бизнеса на проектах с открытыми данными. Профессор Ауэр считает важным, что текущий саммит по семантике проходит в России, так как раньше Россия держалась несколько особняком в вопросах изучения семантической технологии, а теперь исследователи смогут обменяться опытом.

Во время саммита были приведены данные теста BSBM, по которым система управления базами данных OntoQuad показала самую высокую производительность. Именно ее РИА Новости совместно с компанией Eventos адаптировали для отечественной семантической платформы. Независимое тестирование проводилось в институте информатики Лейпцигского университетом. По его результатам OntoQuad существенно превзошла по производительности конкурирующие решения Virtuoso, Jenna TDB, BigData.

"В будущем семантическая платформа РИА Новости позволит, например, создавать для каждого читателя его личную ленту новостей, которая будет учитывать его интересы и месторасположение", — описал одно из конкретных применений базы с открытыми данными Роман Никулин, начальник отдела семантического производства объединенной редакции новостей РИА Новости. Он отметил, что семантическая платформа РИА Новости уже используется как в редакции, так и способна выдавать данные внешним клиентам. Например, редактору эта платформа автоматически предлагает теги для статьи, а также ранее вышедшие материалы по теме текущей заметки. Партнерам семантическая платформа на базе открытых данных РИА Новости помогает быстро находить все упоминания нужной информации.

База открытых данных РИА Новости содержит все выходящие материалы агентства (до 5000 материалов в день). Данные представлены в формате "5 звезд", т.е. структурированы, машиночитаемы, связаны с другими открытыми базами данных.

Международный саммит по семантике ежегодно организует компания STI International. В нем участвуют ученые по семантике и сотрудники исследовательских отделов коммерческих компаний всего мира. В этом году саммит впервые проходит в России, в Суздале. Ожидается, что за три дня в нем примут участие около 50 специалистов и ученых.

Электронный адрес публикации открытых данных РИА Новости: opendata.ria.ru.

Артур Скальский

© РИА-Новости

Интернет и ИТМир

2413

19.07.2013, 13:04

URL: https://babr24.com/baik/?ADE=116758

bytes: 5521 / 5360

Поделиться в соцсетях:

Экслюзив от Бабра в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Автор текста: Артур Скальский.

Другие статьи в рубрике "Интернет и ИТ"

Диверсификация экономики: ИТ-директор рассказал о развитии цифровых банковских технологий в Монголии

Правительство и частный сектор Монголии уже несколько лет работают над диверсификацией экономики в сторону финансов и технологий. В основном это связано с проблемами в экономике страны, вызванными колебаниями мировых цен на сырье и энергоресурсы.

Денис Большаков

Интернет и ИТЭкономика и бизнесОбществоМонголия

6198

15.03.2024

Туристический трафик на горнолыжных комплексах «Истлэнд» и «Гора Соболиная» вырос на четверть – big data Tele2

Tele2 давно работает над качеством связи не только в городах, но и за их пределами, что приносит отличные результаты. Несмотря на то, что этой зимой на горнолыжных курортах Иркутской области отдыхало на четверть больше абонентов оператора, покрытия и емкости сети хватило на всех.

Саша Савельева

Интернет и ИТИркутск

1840

13.03.2024

Новый смартфон или подписка-конструктор: идеи подарков к 8 марта

Современные леди оценят: Tele2 поделился отличными вариантами подарков на 8 марта. Новый смартфон или подписка на любимые сервисы? Зачем выбирать, если можно подарить и то, и другое – ведь у Tele2 хорошие скидки в преддверии праздника.

Саша Савельева

Интернет и ИТРоссия

2675

29.02.2024

Будущее Монголии: Starlink и перспектива IT развития

Разговоры о запуске спутникового интернета Starlink в Монголии ведутся уже на протяжении нескольких месяцев. Старт программы был анонсирован на 26 февраля. Однако пока официальной информации о том, что в стране заработал Starlink, еще нет. Но Бабру все равно есть, о чем рассказать.

Эрнест Баатырев

Интернет и ИТОбществоЭкономика и бизнесМонголия

11098

28.02.2024

Интеллект – искусственный, качество связи – настоящее

Мобильный оператор Tele2 рассказал, как развивает сеть в Приангарье и по всей стране, а также объяснил, как связаны высокое качество связи и искусственный интеллект. Спойлер: в Иркутске и области качество связи растет, а жители с каждым годом качают все больше.

Саша Савельева

Интернет и ИТИркутск

2883

27.02.2024

В Иркутске стартовал четвертый поток образовательного проекта Эн+ «Академия ИТ»

Энергохолдинг Эн+ запустил четвертый поток уникального образовательного проекта «Академия ИТ», который проводится в Технопарке Иркутского национального исследовательского технического университета.

Ярослава Грин

Интернет и ИТМолодежьОбразованиеИркутск

16994

22.02.2024

Иркутский Телеграм: новое племя. Предпочтения читателей в январе 2024

Скажи, кто твой друг, и я скажу, кто ты. Или в современном прочтении: скажи мне, чьи новости ты читаешь, а я скажу, что ты за человек.

Глеб Севостьянов

Интернет и ИТПолитикаОбществоМир Иркутск

7483

06.02.2024

Депутатский контроль. Бесхребетный «Сибкрай» пал под Антонова

Почему бесхребетный, спросите вы? А вы сначала ответьте на один простой вопрос: кто является владельцем информационного портала Сибкрай? Данную фамилию в Новосибирске не знает разве что ленивый. Вот он — великий «патриот» и псевдозащитник столицы Сибири Константин Антонов.

Адриан Орлов

Интернет и ИТЭкономика и бизнесПолитикаНовосибирск

19589

03.02.2024

Больше интернета, выше скорость

Где в Иркутской области мобильный интернет стал летать быстрее, как абоненты поздравляли друг друга в новогодние праздники и какие направления россияне выбирали для отдыха этой зимой – рассказываем в дайджесте новостей от Tele2.

Саша Савельева

Интернет и ИТИркутск

4497

31.01.2024

На что способен мобильный тариф: Tele2 напомнила клиентам о своих уникальных фишках

Многие считают, что тарифы сотовых операторов примерно одинаковы, – различие только в цене и наполнении пакета. На самом деле, это далеко не так. Точнее, не у всех.

Саша Савельева

Интернет и ИТРоссия

5075

25.01.2024

Что подарить тому, у кого есть мобильный телефон?

В преддверии главной ночи в году рассказываем об акциях и подарках, которые приготовил для своих клиентов и их близких оператор Tele2. Подъем по канатной дороге в Листвянке со скидкой 20% Если вы все еще не определились – лыжник вы или сноубордист, вот вам знак!

Ярослава Грин

Интернет и ИТИркутск

16513

28.12.2023

Связаны одной сетью: все больше иркутян получают доступ к современным технологиям

О том, где впервые появился быстрый мобильный интернет Tele2 в декабре, зачем улучшать качество связи в крупных населенных пунктах и как «заморозить» стоимость тарифа на два года – в дайджесте новостей мобильного оператора.

Ярослава Грин

Интернет и ИТИркутск

17389

27.12.2023

Лица Сибири

Баданов Юрий

Фоменко Андрей

Хрупин Сергей

Скробот Василий

Воронцов Юрий

Ермаков Иннокентий

Ставинов Андрей

Шишкин Сергей

Морс Артем

Гуробазаров Баян