Артур Скальский

© РИА-Новости

Интернет и ИТМир

1970

19.07.2013, 13:04

РИА Новости открывает доступ к открытым данным

Семантическая платформа РИА Новости представлена на Международном саммите по семантике и оценена экспертами как одна из ведущих в мире, сообщает Digit.ru.

Специалист по семантике Боннского университета профессор Сорен Ауэр (Soeren Auer) отметил, что даже открытые данные в формате "2 звезды" или "3 звезды" (в форматах xls и csv соответственно) уже замечательное достижение сейчас. Тем приятнее ему видеть такое большое количество проектов с открытыми данными в России, включая государственные проекты, касающиеся тендеров. А данные открытые по формату "5 звезд" до сих пор редкость и в Европе. Ауэр сообщил, что открытые базы в формате "5 звезд" в Европе принадлежат обычно госструктурам. По его словам СМИ в Европе только начали перевод имеющейся информации в открытые данные по формату "5 звезд", например холдинг BBC.

Профессор Кей Сан Чой (Key-Sun Choi) из корейского университета науки и технологий KAIST согласился, что даже открытие Россией 1000 наборов открытых данных – большой успех. Для сравнения он упомянул, что в Корее за предыдущий год переведено в открытые данные только около 500 наборов. При этом в формате "5 звезд" доступно менее чем сотня наборов форматов открытых данных и опять-таки все эти наборы раскрыты государственными органами. В отличие от России, СМИ Южной Кореи также не имеют пока открытых данных, представленных в формате "5 звезд", по словам профессора Чоя. Пока они применяются для госуслуг, хотя есть и бытовые примеры: например в Сеуле можно узнать расписание всех автобусов, сообщается на правительственном сайте, посвященном открытым данным.

Оба ученых отметили, что сейчас относительно налажен процесс передачи открытия данных "сверху вниз", от государства обществу, но пока есть сложности с механизмами открытия и обмена данных гражданами и организациями. Такой обмен, по мнению профессора Чоя, очень помог бы развитию многих сфер бизнеса. Например, в туристической сфере, важной для России, он полагает возможным сбор данных о качестве еды в ресторанах и сервиса в гостиницах методом краудфандинга. А профессор Ауэр упомянул, что использование собственной семантической платформы для обработки данных и дальнейшее открытие данных такого крупного СМИ как РИА Новости – это хороший пример открытия информации "снизу".

Директор офиса W3C в России и зам. директора института информационных технологий ВШЭ Виктор Клинцов считает, что внедрение новых цифровых технологий и переход на открытые данные уже вопрос выживания, а не прибыли. По его мнению, без современных семантических технологий (например, семантических платформ, необходимых для структурирования цифровых данных) через 2-3 года компании перестанут выживать. В США большая тройка New York Times, Associated press и Reuters занимаются вопросами семантики в отношении цифровых данных". Также он предположил, что наличие наборов открытых данных у российского и американских СМИ открывает возможность проведения совместных проектов по синхронизации этих данных.

В целом, по мнению Клинцова, Российское государство достаточно быстро организовало открытие данных и в дальнейшем это может помочь экономическому росту страны. Он сослался на опыт ЕС, где считается, что вложения государства в открытие данных окупится за счет роста малого бизнеса на проектах с открытыми данными. Профессор Ауэр считает важным, что текущий саммит по семантике проходит в России, так как раньше Россия держалась несколько особняком в вопросах изучения семантической технологии, а теперь исследователи смогут обменяться опытом.

Во время саммита были приведены данные теста BSBM, по которым система управления базами данных OntoQuad показала самую высокую производительность. Именно ее РИА Новости совместно с компанией Eventos адаптировали для отечественной семантической платформы. Независимое тестирование проводилось в институте информатики Лейпцигского университетом. По его результатам OntoQuad существенно превзошла по производительности конкурирующие решения Virtuoso, Jenna TDB, BigData.

"В будущем семантическая платформа РИА Новости позволит, например, создавать для каждого читателя его личную ленту новостей, которая будет учитывать его интересы и месторасположение", — описал одно из конкретных применений базы с открытыми данными Роман Никулин, начальник отдела семантического производства объединенной редакции новостей РИА Новости. Он отметил, что семантическая платформа РИА Новости уже используется как в редакции, так и способна выдавать данные внешним клиентам. Например, редактору эта платформа автоматически предлагает теги для статьи, а также ранее вышедшие материалы по теме текущей заметки. Партнерам семантическая платформа на базе открытых данных РИА Новости помогает быстро находить все упоминания нужной информации.

База открытых данных РИА Новости содержит все выходящие материалы агентства (до 5000 материалов в день). Данные представлены в формате "5 звезд", т.е. структурированы, машиночитаемы, связаны с другими открытыми базами данных.

Международный саммит по семантике ежегодно организует компания STI International. В нем участвуют ученые по семантике и сотрудники исследовательских отделов коммерческих компаний всего мира. В этом году саммит впервые проходит в России, в Суздале. Ожидается, что за три дня в нем примут участие около 50 специалистов и ученых.

Электронный адрес публикации открытых данных РИА Новости: opendata.ria.ru.

Артур Скальский

© РИА-Новости

Интернет и ИТМир

1970

19.07.2013, 13:04

URL: http://babr24.com/?ADE=116758

bytes: 5521 / 5360

Обсудить на форуме Бабра в Telegram

Поделиться в соцсетях:

Автор текста: Артур Скальский.

Другие статьи в рубрике "Интернет и ИТ"

Yota обнулит трафик на мессенджеры 

Мобильный оператор Yota не будет считать трафик мессенджеров WhatsApp, Telegram, Viber и Skype в течение двух дней - 31 декабря и 1 января. «Все мы соскучились по близким в этом году, и по объективным причинам часть из них не можем увидеть до сих пор.

Ярослава Грин

Интернет и ИТОбществоИркутск

10670

24.12.2020

В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS».

Пепел

Интернет и ИТНаука и технологииТомск

5209

24.12.2020

Северный кабель: большой арктический распил

По официальным сообщениям в прессе, Федеральное агентство морского и речного транспорта и ФГУП «Росморпорт» приступили к реализации проекта по строительству трансарктической магистральной подводной волоконно-оптической линии связи по маршруту Мурманск - Владивосток с выходом локальных линий связи в ...

Максим Бакулев

Интернет и ИТЭкономика и бизнесРасследованияРоссия

8872

26.11.2020

Инсайд. 2020 год: тренды киберпреступлений

2020 год проходит в контексте вирусной повестки и не только в здравоохранении. Если верить аналитикам Group-IB, в киберпространстве сейчас тоже пандемия. Сегодня на конференции CyberCrimeCon2020 компания обнародовала свой ежегодный отчет Hi Tech Crime Trends о трендах киберпреступлений.

Максим Бакулев

Интернет и ИТКриминалРасследованияМир

3083

26.11.2020

«Дом по другим правилам» Tele2 знакомит со столицей Восточной Сибири

Прогулки в историческом центре, новое прочтение русской кухни и коктейль с изюминкой: Иркутск заявляет о себе в онлайн. Столица Восточной Сибири попала в число резидентов нового сезона «Дома по другим правилам» – образовательно-развлекательного портала от Tele2.

Александр Макаров

Интернет и ИТИркутск

2955

26.11.2020

Безопасность превыше всего: что делать, если ваши данные украдены, и как предотвратить атаку мошенников

Ни один человек не застрахован от кражи личных данных мошенниками, ведь злоумышленники постоянно действуют по-новому и придумывают изощрённые варианты для совершения своих действий.

Станислав Цырь

Интернет и ИТНаука и технологииМир

12530

22.11.2020

Спутниковый интернет Илона Маска приятно удивил первых пользователей

В октябре 2020 на территории США и Канады началось публичное бета-тестирование интернет-сервиса Starlink. Система тестировалась в разных погодных условиях, в том числе и экстремальных. Связь не прервалась даже в бурю. Почти все пользователи сообщили, что получают скорость загрузки выше 150 Мбит/с.

Алиса Канарис

Интернет и ИТНаука и технологииМир

4742

20.11.2020

Супергерои сервиса: как работают контактные центры Tele2

В сентябре контактные центры мобильного оператора Tele2 в Иркутске и Саранске отметили свое пятилетие.

Александр Макаров

Интернет и ИТИркутск Россия

5024

25.09.2020

Сергей Эмдин: «Люди распробовали новый цифровой образ жизни»

Генеральный директор компании Tele2 Сергей Эмдин на встрече с журналистами рассказал о том, как компания выстраивала свою работу в сложный период пандемии и как самоизоляция повлияла на цифровые привычки пользователей.

Александр Макаров

Интернет и ИТЭкономика и бизнесИркутск Россия

5551

17.09.2020

В Прибайкалье впервые открылся набор в Яндекс.Лицей

У юных программистов Иркутской области появилась возможность проявить себя и научиться новому у специалистов крупнейший IT- и интернет-компании в России. Обучение бесплатное. «Программирование – это творчество». Яндекс.

Анна Амгейзер

Интернет и ИТОбразованиеМолодежьИркутск

5928

02.09.2020

Реклама Yota посмотрит на своих зрителей

Yota запустила рекламную кампанию в поддержку максимального пакета связи для новых клиентов. Цель кампании #каждыйтретий - рассказать людям о том, что с Yota можно не переплачивать за мобильную связь.

Ярослава Грин

Интернет и ИТИркутск

16733

25.08.2020

Цифровизация оказалась благом

Все же нужно отметить, что иногда наша власть держит слово. Путинский «червонец», то есть единовременное пособие на ребенка, я получил. На его оформление не потребовалось много времени и сил, вся процедура до перечисления заняла всего девять дней, и происходила, главным образом, в интернете.

Дмитрий Верхотуров

Интернет и ИТЭкономика и бизнесНаука и техникаМир

16018

09.06.2020

Синцова Ирина

Ерахтин Евгений

Никитин Евгений

Салацкая Диана

Боровский Виктор

Наумов Николай

Лебедь Владислав

Лобанов Александр

Жвачкин Сергей

Афанасьев Александр