Артур Скальский

© РИА-Новости

Интернет и ИТМир

2119

19.07.2013, 13:04

РИА Новости открывает доступ к открытым данным

Семантическая платформа РИА Новости представлена на Международном саммите по семантике и оценена экспертами как одна из ведущих в мире, сообщает Digit.ru.

Специалист по семантике Боннского университета профессор Сорен Ауэр (Soeren Auer) отметил, что даже открытые данные в формате "2 звезды" или "3 звезды" (в форматах xls и csv соответственно) уже замечательное достижение сейчас. Тем приятнее ему видеть такое большое количество проектов с открытыми данными в России, включая государственные проекты, касающиеся тендеров. А данные открытые по формату "5 звезд" до сих пор редкость и в Европе. Ауэр сообщил, что открытые базы в формате "5 звезд" в Европе принадлежат обычно госструктурам. По его словам СМИ в Европе только начали перевод имеющейся информации в открытые данные по формату "5 звезд", например холдинг BBC.

Профессор Кей Сан Чой (Key-Sun Choi) из корейского университета науки и технологий KAIST согласился, что даже открытие Россией 1000 наборов открытых данных – большой успех. Для сравнения он упомянул, что в Корее за предыдущий год переведено в открытые данные только около 500 наборов. При этом в формате "5 звезд" доступно менее чем сотня наборов форматов открытых данных и опять-таки все эти наборы раскрыты государственными органами. В отличие от России, СМИ Южной Кореи также не имеют пока открытых данных, представленных в формате "5 звезд", по словам профессора Чоя. Пока они применяются для госуслуг, хотя есть и бытовые примеры: например в Сеуле можно узнать расписание всех автобусов, сообщается на правительственном сайте, посвященном открытым данным.

Оба ученых отметили, что сейчас относительно налажен процесс передачи открытия данных "сверху вниз", от государства обществу, но пока есть сложности с механизмами открытия и обмена данных гражданами и организациями. Такой обмен, по мнению профессора Чоя, очень помог бы развитию многих сфер бизнеса. Например, в туристической сфере, важной для России, он полагает возможным сбор данных о качестве еды в ресторанах и сервиса в гостиницах методом краудфандинга. А профессор Ауэр упомянул, что использование собственной семантической платформы для обработки данных и дальнейшее открытие данных такого крупного СМИ как РИА Новости – это хороший пример открытия информации "снизу".

Директор офиса W3C в России и зам. директора института информационных технологий ВШЭ Виктор Клинцов считает, что внедрение новых цифровых технологий и переход на открытые данные уже вопрос выживания, а не прибыли. По его мнению, без современных семантических технологий (например, семантических платформ, необходимых для структурирования цифровых данных) через 2-3 года компании перестанут выживать. В США большая тройка New York Times, Associated press и Reuters занимаются вопросами семантики в отношении цифровых данных". Также он предположил, что наличие наборов открытых данных у российского и американских СМИ открывает возможность проведения совместных проектов по синхронизации этих данных.

В целом, по мнению Клинцова, Российское государство достаточно быстро организовало открытие данных и в дальнейшем это может помочь экономическому росту страны. Он сослался на опыт ЕС, где считается, что вложения государства в открытие данных окупится за счет роста малого бизнеса на проектах с открытыми данными. Профессор Ауэр считает важным, что текущий саммит по семантике проходит в России, так как раньше Россия держалась несколько особняком в вопросах изучения семантической технологии, а теперь исследователи смогут обменяться опытом.

Во время саммита были приведены данные теста BSBM, по которым система управления базами данных OntoQuad показала самую высокую производительность. Именно ее РИА Новости совместно с компанией Eventos адаптировали для отечественной семантической платформы. Независимое тестирование проводилось в институте информатики Лейпцигского университетом. По его результатам OntoQuad существенно превзошла по производительности конкурирующие решения Virtuoso, Jenna TDB, BigData.

"В будущем семантическая платформа РИА Новости позволит, например, создавать для каждого читателя его личную ленту новостей, которая будет учитывать его интересы и месторасположение", — описал одно из конкретных применений базы с открытыми данными Роман Никулин, начальник отдела семантического производства объединенной редакции новостей РИА Новости. Он отметил, что семантическая платформа РИА Новости уже используется как в редакции, так и способна выдавать данные внешним клиентам. Например, редактору эта платформа автоматически предлагает теги для статьи, а также ранее вышедшие материалы по теме текущей заметки. Партнерам семантическая платформа на базе открытых данных РИА Новости помогает быстро находить все упоминания нужной информации.

База открытых данных РИА Новости содержит все выходящие материалы агентства (до 5000 материалов в день). Данные представлены в формате "5 звезд", т.е. структурированы, машиночитаемы, связаны с другими открытыми базами данных.

Международный саммит по семантике ежегодно организует компания STI International. В нем участвуют ученые по семантике и сотрудники исследовательских отделов коммерческих компаний всего мира. В этом году саммит впервые проходит в России, в Суздале. Ожидается, что за три дня в нем примут участие около 50 специалистов и ученых.

Электронный адрес публикации открытых данных РИА Новости: opendata.ria.ru.

Артур Скальский

© РИА-Новости

Интернет и ИТМир

2119

19.07.2013, 13:04

URL: https://babr24.com/?ADE=116758

bytes: 5521 / 5360

Обсудить на форуме Бабра в Telegram

Поделиться в соцсетях:

Автор текста: Артур Скальский.

Другие статьи в рубрике "Интернет и ИТ"

Региональные каналы, которые заинтересовали Бабр в декабре 2021 года

Бабр мониторит все региональные политические каналы Сибири. Вот те каналы, которые нас заинтересовали в декабре 2021 года. Иркутск политический (https://t.me/Irkpolicy) - за трезвую оценку мэра Леонида Фролова в свете вероятного присоединения Иркутского района к Иркутску.

Максим Бакулев

Интернет и ИТПолитикаРасследованияРоссия

8951

05.01.2022

Конкурс "Бабросалатик" завершен, победителя ждет награда

Ура! Мы определили нашего победителя в новогоднем конкурсе "Бабросалатик"!) 🎉Обещали - делаем! 27 декабря в группе Бабра в Одноклассниках завершился наш первый вкусный конкурс - Бабросалатик. И у нас есть победитель - наша подписчица и её салат "Гнездо глухаря".

Лера Крышкина

Интернет и ИТОбществоИркутск

1955

29.12.2021

Томский сетевой тролль угрожает журналистам

За все время занятий журналистикой, особенно расследовательской журналистикой на протяжении последних 10 лет, угрозы я получал многократно, причем от самых разных лиц.

Станислав Станов

Интернет и ИТРасследованияТомск

8988

20.12.2021

Yota предложила клиентам выбрать цену тарифа

Теперь клиенты мобильного оператора Yota сами назначают сумму, которую готовы потратить на связь с помощью обновленного калькулятора. На сайте https://choice.yota.ru/ пользователи сначала определяют точную цену своего тарифа, после чего выбирают наполнение из предложенных вариантов.

Ярослава Грин

Интернет и ИТИркутск

2819

07.12.2021

Региональные каналы, которые заинтересовали Бабр в ноябре 2021 года

Бабр мониторит все региональные политические каналы Сибири. Вот те каналы, которые нас заинтересовали в ноябре 2021 года. А вы точно сибирский политолог? (https://t.me/truepolitsib) - за оценку планов продажи АО "Красноярскнефтепродукт" правительством Красноярского края.

Максим Бакулев

Интернет и ИТПолитикаРасследованияРоссия

7682

06.12.2021

Кибер-Гэсэр: бурятский героический эпос станет видеоигрой?

На российский и мировой рынок видеоигр может ворваться Гэсэр – персонаж бурятского народного эпоса. Компьютерная игра пока лишь в проекте, но создатели уверены - в перспективе она может популяризовать бурятскую культуру.

Виктор Кулагин

Интернет и ИТКультураБурятия Россия

9174

18.11.2021

Денис Вишняк обиделся, что его "творчество" по части кинематографа перестали считать искусством

Фильм "Мне теперь с этим жить", в котором в главной роли снялся участник группы "ЮДИ" Денис Вишняк (депутат думы Томска, член партии "Единая Россия"), вызвал крайнее возмущение у томских медиков.

Соня Совушкина

Интернет и ИТСкандалыОбществоТомск

1981

16.11.2021

Россия вошла топ-3 стран с самым несвободным интернетом в мире

Россия, где свобода слова закреплена на законодательном уровне, заняла третье место в антирейтинге свободы интернета. Уступила она только Китаю и Кубе. Цифровая свобода существует не для всех. А вот цензура – напротив, как бы нас не убеждали в обратном заинтересованные лица.

Анна Амгейзер

Интернет и ИТОбществоМир Россия Китай

2553

16.11.2021

Блогнот. Краткое ликбез-пособие для иркутских телеграм-блондинок

Текст этот меня сподвигла написать очередная волна обострений в обоих иркутских «серых домах», в которых по какой-то причине принято считать, что всё, что делается в иркутском сегменте Телеграм — это или Дмитрий Таевский, или Екатерина Анисимова, или крайнем случае Александр Откидач.

Дмитрий Таевский

Интернет и ИТПолитикаИркутск

14864

24.09.2021

Технологический Томск сегодня: IT, экономическая зона, инвестиции и инновации

Президент Томской торгово-промышленной палаты Максим Костарев дал большое интервью «Интерфакс».

Пепел

Интернет и ИТНаука и технологииЭкономика и бизнесТомск

8802

02.09.2021

Игорь Бычков: майнеры создают критическую нагрузку на инфраструктуру

Майнинг по своей природе относится к промышленной нагрузке: объем потребления у одной фермы – больше, чем у крупного металлургического завода. В условиях, когда износ распредсетей составляет порядка 70%, майнинг создаёт серьезную нагрузку на инфраструктуру.

Александр Макаров

Интернет и ИТЭкономика и бизнесЖКХРоссия Иркутск

31290

20.08.2021

Суд рассмотрит иск к Google об удалении видеоролика о дедовщине в Бурятии

Октябрьский районный суд Улан-Удэ вновь рассмотрит административное дело к компании Google. Ранее заместитель военного прокурора Улан-Удэнского гарнизона подавал административный иск о запрете к распространению видеоролика с фактами неуставных взаимоотношений между российскими военнослужащими.

Виктор Кулагин

Интернет и ИТПроисшествияБурятия Россия

3043

19.08.2021

Лица Сибири

Романова Яна

Зимин Максим

Кузнецов Георгий

Екимовский Олег

Яковлева Елена

Мари Алексей

Семенов Дмитрий

Тарабан Наталья

Чернышов Дмитрий

Седов Владимир