Артур Скальский

© Газета.Ru

Интернет и ИТМир

2786

22.10.2010, 00:32

Кликай по-научному

Популярность веб-сайтов описана математической моделью.

Создана математическая модель, описывающая динамику популярности веб-сайтов. Оказалось, что посещаемость сайта изменяется не плавно, а резкими случайными всплесками, которые и позволяют «делать кассу» рекламе. Провоцировать эти всплески сложно, однако социальные сети — самый лучший инструмент для этого.

Как веб-сайты становятся популярными? Почему одни страницы становятся популярными очень быстро, другие наращивают число посетителей постепенно, а третьи вообще остаются малоизвестными? Есть ли математическая закономерность в этих процессах?

Этими вопросами задались ученые из США (Университет Индианы) и Италии (Турин). Они проанализировали два огромных массива данных — статьи «Википедии» и интернет-пространство целой страны — Чили.

Их исследование показало, что нарастание онлайн-популярности наступает не в результате постепенного накопления числа посетителей страницы, а происходит резкими вспышками.

Такое поведение свойственно так называемым критическим системам — к ним относятся крахи фондовых рынков и ряд природных явлений. Работу математиков публикует Physical Review Letters. Они также разработали модель, которая описывает динамику онлайн-популярности.

«Популярность в интернете — непредсказуемая вещь, внимание публики резко перемещается от одного ресурса к другому. Статистически эти колебания подобны землетрясения и лавинам», — пояснил первый автор работы Джейкоб Раткевич из Университета Индианы.

Онлайн-информация, резко становящаяся популярной, оказывает огромное влияние на формирование позиции общества, культуру и политику.

Кроме того, реклама, размещенная на сайте, «ставшем звездой», становится неизмеримо прибыльней всякой иной. Конечно, каждый сайт стремится стать как можно более посещаемым и сохранить во времени своих читателей, однако практика показывает, что «гиперпосещаемость» почти никогда не удается удержать.

В первом изученном примере — посещаемости «Википедии» — ученые проанализировали два параметра: число кликов, ведущих на каждую статью, а также число ссылок на нее, опубликованных на внешних ресурсах. В более ранних работах утверждалось, что распределение популярности веб-страниц подчиняется степенной зависимости. Однако судить о динамике популярности каждой отдельной страницы было сложно, так как информации о числе посетителей и ссылок в каждый момент времени не было. Авторы работы восполнили этот пробел: они обработали информацию о трафике от миллионов страниц. Всего были обработаны три миллиона статей «Википедии» (2001—2007 годов) с временным разрешением в одну секунду, три миллиона статей «Википедии» (2008—2010 годов) с временным разрешением в один час и три миллиона интернет-страниц домена Чили (.cl) с разрешением один год (2002—2006 годов). Разрешение показывает частоту «сетки», наименьший период времени, через который производится вторичное детектирование посещаемости страницы. Для этого использовались внутренние данные «Википедии», а также информация чилийского поисковика TODOCL.

Оказалось, что почти все страницы переживали вспышку популярности в самом начале своего существования. Затем некоторые страницы действительно показывали стабильный экспоненциальный рост, однако большая часть в среднем сохраняла небольшую посещаемость, ее рост и падение происходили резкими скачками.

Распределение скачков посещаемости сайтов, как оказалось, подчиняется «закону тяжелого хвоста», также характерного для критических систем.

Такое распределение чрезвычайно неравномерно: большая часть точек характеризуется небольшими значениями (в данном случае это число посетителей в день), и лишь малая часть — очень большими. Однако именно эти всплески определяют суммарный трафик: они столь велики, что каждый из них на порядки превышает суммарную величину посещаемости «неудачных дней». Однако динамика этих «всплесков» отличается от динамики популярности «горячей» новости, подчеркивают ученые. Если внимание, обращаемое на новость, очень быстро затухает, то «всплески» популярности сайтов следуют сериями, и это в итоге влияет на повышение общей популярности страницы.

Математики разработали классификационную модель, которая качественно воспроизводит часть особенностей «всплескового» поведения популярности веб-сайтов, однако для более качественного описания «эффекта тяжелого хвоста» им пришлось добавить в модель специальный «реклассификационный механизм». Реклассификация случайным образом «вздувает» популярной той или иной страницы. Парадоксально, но именно такой механизм позволяет приблизить модель к описанию экспериментальных данных.

«Несмотря на то что модель имеет в больше степени описательный характер, мы надеемся, что более глубокое понимание процесса развития популярности веб-сайта приведет в конечном итоге к развитию методов прогнозирования возникновения популярности именно в упреждающем смысле.

Однако искусственно повысить популярность какого-то конкретного сайта с помощью нашего механизма не удастся», — подытожил Раткевич.

Однако ученые уже готовы предоставить рецепт популярности. Анализ использования социальных сетей в формировании популярности сайтов показал, что они вполне пригодны как минимум для создания временного всплеска посещаемости. «Бомбы из твиттера» взлетают в рейтингах, как ракеты, и могут легко забраться на самую верхушку результатов поиска Google», — отмечают исследователи.

Артур Скальский

© Газета.Ru

Интернет и ИТМир

2786

22.10.2010, 00:32

URL: https://babr24.com/?ADE=89173

bytes: 5391 / 5391

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Автор текста: Артур Скальский.

Другие статьи в рубрике "Интернет и ИТ"

Блогнот. Новая нормальность без конституции, демократии, рынка и здравого смысла?

На моей любимой площадке медиафорума «Енисей» про политику и политическую журналистику было много интересного и одновременно тревожного. Традиционно в зале было пусто.

Валерий Лужный

Интернет и ИТОбществоЭкономика и бизнесКрасноярск

4848

08.10.2024

Минцифры РФ и Роскомнадзор всё-таки решились наступить на грабли "больших групп"

Минцифры РФ и Роскомнадзор, несмотря на жесткую критику, подготовили правила ведения каналов в соцсетях с аудиторией более 10 тысяч человек.

Максим Бакулев

Интернет и ИТОбществоПолитикаРоссия

5028

07.10.2024

Монголия укрепляет позиции в космической программе: от запуска спутников до международного сотрудничества

Монголия стремительно развивает свою космическую программу, делая шаги к независимости в сфере спутниковых технологий. Опираясь на опыт других государств и привлекая международную помощь, страна планирует реализовать крупные проекты в области космоса.

Эрнест Баатырев

Интернет и ИТНаука и технологииЭкономика и бизнесМонголия

5453

07.10.2024

T2 ускорила интернет в трех крупных городах Иркутской области

В трёх городах Прибайкалья интернет от Т2 стал быстрее и стабильнее. Оператор завершил рефарминг – перерраспределение частот с 3G на 4G (LTE). Причем качество связи улучшилось не только на улицах в Иркутске, Усолье-Сибирском и Усть-Илимске, но и в домах и общественных пространствах.

Саша Савельева

Интернет и ИТИркутск

1966

30.09.2024

T2 обновила подписку MiXX в партнерстве с Яндекс Плюсом

Теперь у пользователей MiXX есть доступ к фильмам и сериалам на Кинопоиске, Яндекс Музыке в lossless-качестве, кешбэку баллами Плюса.

Саша Савельева

Интернет и ИТРоссия

1691

24.09.2024

Монголия на пути цифрового прогресса: рост в индексе электронного правительства

Монголия демонстрирует впечатляющий рост в сфере электронных услуг. Это наглядно выражается ее значительным скачком в глобальном рейтинге UN Global E-Government Development Index.

Эрнест Баатырев

Интернет и ИТОбществоЭкономика и бизнесМонголия

6691

23.09.2024

Развитие цифровых технологий в Монголии: новые шаги и перспективы

Монголия активно развивает свою цифровую экономику, стремясь к укреплению позиций на мировом рынке информационных технологий.

Эрнест Баатырев

Интернет и ИТНаука и технологииОбществоМонголия

2389

03.09.2024

Блогнот. Казус Дурова. Как это работает

1️⃣ Данных в мире очень много. За 15 лет физическое количество данных (data) выросло в 66 раз. Ежегодный прирост – больше, чем производилось этих самых данных 10 лет назад. И немалую часть этих данных генерируют сами пользователи, размещая контент в соцсетях или реагируя на него.

Глеб Кузнецов

Интернет и ИТРасследованияМир

7421

31.08.2024

Монголия на пути к цифровому будущему: инновации и диверсификация

При наличии огромной территории Монголия является одной из наименее населенных стран мира. Экономические центры там разделяют огромные расстояния, что создает определенные проблемы, решая которые монгольское общество приобретает уникальный социальный и экономический опыт.

Эрнест Баатырев

Интернет и ИТОбществоЭкономика и бизнесМонголия

10613

28.08.2024

Быстрый интернет и безопасность в сети. Новый дайджест Tele2

Еще в двух городах Иркутской области оператор Tele2 улучшил качество связи за счет перехода на сети нового поколения. Из нововведений – доступный абонентам сервис для отслеживания утечек персональных данных. Подробности в августовском дайджесте компании.

Саша Савельева

Интернет и ИТИркутск

3059

22.08.2024

Итоги опроса Бабра: какие политические ТГ-каналы читают красноярцы

В конце июля Бабр в своём телеграм-канале «Красноярск. Бабр. Дальше некуда» (@kras_24) проводил опрос. Пришло время подвести его итоги и узнать, какие политические телеграм-каналы предпочитает читать красноярская, и не только, аудитория. Какие красноярские политические телеграм-каналы вы читаете?

Анна Роменская

Интернет и ИТОбществоПолитикаКрасноярск

17209

16.08.2024

Инсайд. Что стоит за законом о "деанонимизации Телеграма"

Закон о "деанонимизации Телеграма", по всем признакам, в ближайшее время будет принят Госдумой. Главный "запретитель" страны, депутат Госдумы Александр Хинштейн, уже говорит об этом как о свершившемся факте. Что именно предполагается сделать. 1.

Василий Чайкин

Интернет и ИТПолитикаРасследованияРоссия

19088

31.07.2024

Лица Сибири

Кириллов Юрий

Обухов Александр

Баранов Юрий

Косолапов Марк

Пивень Виктор

Маяренков Сергей

Бобков Игорь

Кузьмин Геннадий

Говорин Борис

Пашинский Сергей