По информации Nieman Lab, региональные СМИ начали блокировать Internet Archive из-за опасений, что компании, занимающиеся искусственным интеллектом, могут использовать данные из репозиториев этой некоммерческой организации для обучения. Число таких изданий достигло 340.

«Наш новый анализ показывает, что более 340 местных новостных сайтов по всей территории Соединённых Штатов теперь ограничивают возможности Internet Archive по доступу и сохранению своих материалов. Многие сайты в нашей выборке принадлежат пяти из семи крупнейших местных новостных издательств страны: USA Today Co., McClatchy, Advance Local, MediaNews Group и Tribune Publishing. Последние два являются дочерними компаниями “хедж-фонда-стервятника” Alden Global Capital», — отмечается в отчёте.
В Nieman Lab подчёркивают, что скрытие контента местных новостей за платными подписками, а затем блокировка доступа к ним в Интернет-архиве лишает профессионалов возможности заниматься настоящей журналистикой, опирающейся на исторические данные. «Я освещаю новости в условиях обширной информационной пустыни в округах Рокленд, Салливан и Рокленд штата Нью-Йорк. Это означает, что мне приходится в значительной степени полагаться на архивные данные старых новостных статей из ныне не существующих или “зомби-изгоев” СМИ», — отметил Б. Дж. Мендельсон, редактор информационного бюллетеня The Monroe Gazette. По его словам, без Интернет-архива эта работа «была бы невероятно сложной».
В Интернет-архиве заявили, что прислушиваются к этим опасениям, а также сотрудничают с журналистскими группами для обучения сотен редакций вопросам архивирования: «В декабре Интернет-архив в партнёрстве с Институтом Пойнтера и организацией Investigative Reporters and Editors обучил группу из 33 местных и национальных новостных изданий разработке и внедрению стратегии архивирования. Инициатива, финансируемая за счёт гранта Press Forward, направлена на обучение 300 редакций вопросам цифрового сохранения и использования услуг Интернет-архива к концу 2027 года».
Ранее сообщалось, что сервис Wayback Machine, управляемый Internet Archive, оказался в кризисе из-за того, что новостные агентства всё чаще блокируют работу его веб-сканеров. Кроме того, архив больше не может закупать носители информации из-за их резкого подорожания, связанного с бумом искусственного интеллекта. По данным Originality AI, сейчас режим блокировок включили 23 крупных новостных сайта. В их число входят New York Times и USA Today.
