Pull to refresh
86.21
Дата-центр «Миран»
Решения для аренды и размещения ИТ-инфраструктуры

Более трети от всех существовавших в 2013 году веб-страниц уже недоступны

Reading time2 min
Views3.7K


С 2013 по 2023 год интернет потерял почти четверть всего контента, созданного за указанный период. При этом если брать более старые сайты, то эта цифра еще больше: мы потеряли доступ и контент 38% сайтов и веб-страниц, которые еще существовали на момент начала исследования, то есть в 2013 году. Если же смотреть на ситуацию на дистанцию в год, то с 2023 года стали недоступны или радикально изменились уже 8% от общего числа страниц в интернете.

Соответствующее исследование провели аналитики из Pew Research Center, чтобы наглядно продемонстрировать, насколько недолговечен контент в интернете и как человечество легко может потерять информацию, если доверит ее хранение исключительно веб-сайтам.

Исследование, проведенное экспертами Pew Research Center, показало, что весной текущего года значительная часть ссылок на государственных и новостных сайтах, а также в секции «Ссылки» на страницах Википедии, оказались недействительными. Конкретно, 23% новостных интернет-страниц и 21% страниц государственных сайтов содержали по меньшей мере одну неработающую ссылку. Сайты местных властей особенно подвержены этой проблеме. В Википедии же более половины страниц (54%) включали в себя минимум одну устаревшую ссылку.



Исследователи также отслеживали динамику доступности страниц в социальных сетях. Они проанализировали твиты, опубликованные на платформе X весной 2023 года, и выяснили, что примерно 20% постов становятся недоступными через несколько месяцев. В 60% случаев это связано с изменением статуса аккаунта на приватный, его блокировкой или удалением. В оставшихся 40% случаев твиты удаляются самими пользователями. Отдельно отмечается, что более 40% твитов на турецком и арабском языках исчезают в течение трех месяцев после публикации.

В отдельном исследовании социальной сети X, в котором участвовали 5 миллионов твитов, опубликованных с 8 марта по 27 апреля 2023 года, было выявлено, что к 15 июня 18% твитов стали недоступны. Большинство из них исчезли из-за блокировки или удаления аккаунтов их авторов. Было также отмечено, что большая часть твитов удаляется в течение месяца, причем половина из них становится недоступной в первые шесть дней после публикации, а 90% — в течение 46 дней.



При анализе веб-страниц за последнее десятилетие было обнаружено, что 25% страниц, собранных в октябре 2023 года из архивов Common Crawl, уже недоступны. Это число включает в себя 16% страниц, которые недоступны на активных сайтах, и 9% страниц, которые недоступны из-за закрытия сайтов. Страницы, собранные в 2013 году, оказались наиболее подвержены исчезновению — 38% из них уже не функционируют.

Анализ правительственных сайтов показал, что из примерно 500 тысяч страниц, содержащих 42 миллиона ссылок, 21% имели по крайней мере одну неработающую ссылку. В категории новостных порталов из 500 тысяч страниц с 14 миллионами ссылок 23% содержали хотя бы одну неработающую ссылку, и 5% всех ссылок в выборке уже не функционировали. Среди 20 самых посещаемых новостных сайтов, около 25% страниц имели неработающие ссылки.

В секции «Ссылки» на англоязычных страницах Википедии, изученных аналитиками, 82% содержали хотя бы одну неработающую внешнюю ссылку. В общей сложности, из более чем 1 миллиона ссылок, 11% были недоступны.



Tags:
Hubs:
Total votes 5: ↑5 and ↓0+9
Comments21

Other news

Information

Website
miran.ru
Registered
Founded
Employees
51–100 employees
Location
Россия