Pull to refresh

Comments 87

UFO just landed and posted this here

На сайте РКН они исчезают в момент, когда они получают информацию о недоступности публикации.

Эта информация не является публичной. Само наличие такого списка с гиперссылками (да даже и без них) может быть расценено как распространение незаконной информации, даже 451 код с данными об основаниях блокировки технически можно притянуть как состав. Так что публичного списка нет и не планируется. Да и не для подстёгивания интереса это задумывалось.

Список можно сделать с правильными географическими ограничениями.

Э-э-э... Если статья удалена на основании решения суда, то это как раз публичная информация. Судопроизводство у нас пока что еще формально открыто.

Ну вообще-то судебные решения являются совершенно публичной информацией, если не засекречены специально. Очень важно до исполнения решения помечать статьи как подлежащие удалению по решению суда, ставить ссылку на решение и включать таймер на странице со статьёй, по истечению которого статья будет удалена автоматически. Это очень важно для общественного понимания цензуры и недопущения повторения нарушений в будущем.

по истечению которого статья будет удалена автоматически

Закон не требует удалять. Закон требует снять с публикации — и то только в соответствующей юрисдикции (благо в несоответствующей юрисдикции свои законы).

Цензу́ра (лат. censura — «строгое суждение, суровый разбор, взыскательная критика») — система надзора[1] за содержанием и распространением информации, печатной продукции, музыкальных и сценических произведений, произведений изобразительного искусства, кино- и фотопроизведений, передач радио и телевидения, веб-сайтов и порталов, в некоторых случаях — частной переписки для ограничения либо недопущения распространения идей и сведений, признаваемых властями нежелательными

Цензурой называют также органы светской или духовной власти, которые осуществляют такой контроль.

(определение из Википедии)

Совершенно не к вам претензия, наверное больше к самому Хабру. Есть же Конституционный суд, можно обратиться в него с просьбой разъяснить что делать, чтобы не так уж сразу бежать выполнять.

Ну тот же Антизапрет где-то реестр адресов берёт для антифильтра...

Этот список рассылают провайдерам, чтобы те включали блокировки. Даже API какой-то есть для его получения.

Это так называемая «выгрузка» для провайдеров. Но там есть только те «указатели» (адреса, домены и т.д.), которые надо заблокировать. Если владелец сайта удалил спорный контент, то такой факт в этот список не попадает.

о нарушении авторских прав

Т.е. статья в которой будет говориться что авторское право в нынешней редакции устарело, и нелицензионное копирование противозаконно, но не аморально будет заблокирована?

А так замечательно... Хотя теперь скоро статьи о том как настроить VPN без VPN и не получится увидеть ;) Но принцип понятен. И повод вроде тоже понятен.

Речь о материалах, которые нарушают авторские права, а не про обсуждение законодательства. В любом случае, все обращения анализируются.

Эх, не хватает инфы о статьях... Заголовок бы ничего не дал, текст не законен... Ждём nlp-сеть, чудесным образом "выдумывающую" удалённые статьи?

В судебных решениях, выписанных в РФ отсутствуют сведения, что именно из материала признано незаконным. Там даже отсутствуют экспертизы. Закон, на основании которого даются предписания, имеет императивный характер и требует удаления, не конкретизирую чего именно, давая только url. Остальные трактовки, которых много, остаются трактовками и не подкреплены судебной практикой.

Спасибо. Хотя вот она - балканизация интернета. Другое дело, что пока за трансграничные переходы не требуют делать визу.

Искренне надеюсь, что у Хабра хватит мужества под давлением роскомпозора не блокировать статью глобально, а лишь локально, как и анонсировано.

Мы, увы, рисковать не стали, в итоге просто выпиливаем((

UFO just landed and posted this here

Нет, но мы думаем и над иным функционалом, завязанным на гео, в том числе и самостоятельный таргетинг для авторов.

А для читателя будет видно, что статья не доступна в каких-то регионах?

Читатель будет либо видеть статью без ограничений, либо не видеть и любоваться заглушкой, исходя из его IP-адреса. В каких странах статья недоступна видит только автор.

Каким образом читатель сможет полюбоваться заглушкой? Название статьи должно появляться в основном потоке, но с пометкой о недоступности, глобальной или региональной.

Действительно, из ленты, rss и т.д. Мы не стали изымать по гео, так как это технически сделать было сложнее, но не невозможно, конечно.

А куда именно роскомнадзор присылает письма счастья? на webmaster@?

На самом деле, в общем случае на abuse-адрес, который прилинкован к whois IP-адреса. Как правило, это адрес провайдера хостинговых услуг сайта либо провайдер приземления ingress трафика (CDN, DDoS-фильтрация и т.д.). Плюс они собирают дополнительные контакты и ведут свою адресную книгу, добавляя эти адреса в CC.

А, то есть письмо отправляется хостеру, а тот уже пересылает его владельцу ресурса? А если за один домен отвечают разные ip адреса у разных хостеров, то каждому будет по письму или только первому попавшемуся?

Тут уж как повезёт, но да, приходит владельцу IP-адреса. Думаю, если у сайта RR DNS, то напишут всем, можете им написать напрямую и уточнить.

На самом деле, отличное решение. Главное, чтобы оно устроило соотв. органы.

Интересно будет, если (когда) кто-то из органов подаст в суд на статью, которая закрыта для РФ, но он её увидит из-за включенного vpn

Сначала надо четко определить все российские айпи, есть ли вообще какой-то официальный источник таких данных?

Смотря кто будет определять и с какой целью. Хабр будет определять по MaxMind, это указано в статье.

Гугл, например, определяет по бОльшему количеству устройств на этом ip. Со временем начинает писать на зарубежные ip "Россия", если клиенты vpn отдают российскую локацию. Ровно как и на русские ip гугл начинает показывать рекламу, если клиенты из-за рубежа

Это понятно, вопрос в том, совпадает ли база MaxMind с базой РКН

IP-адреса не бывают русскими, то есть не имеют принадлежность к языку, а также почти не бывают российскими, так как распространяются одним из пяти региональных регистраторов, а поле кантри кода по большей части факультативное.

Когда я захожу под финским ip через vpn, гугл внизу страницы пишет мой родной город и "определенно по ip", так как под этим ip выходят в интернет несколько телефонов и отдают в гугл gps координаты в России, а не финские. Я это имел в виду

Да, я понял что вы имеете в виду, просто уточнил, что с geoip всё очень непросто и не однозначно.

У Гугла это началось совсем недавно (3-4 месяца назад) и в первый раз помогла заявка на исправление геолокации, но меня быстро "вернули на родину" и последующие стали игнорировать.

Яндекс тоже привязывает IP к региону в логине и может менять его несколько раз в день.

Официальной базы нет.

В отличии от телефонной нумерации (под эгидой ООН-овского бюрократического органа ITU), IP-адреса задумывались без учёта государственной иерархии, так как их придумывали инженеры, а не бюрократы. В ряде стран всё же придумали «национальный уровень», то есть NIR, но это было сделано в регионе APNIC. Россия исторически относится к «европейскому» региону, то есть к RIPE NCC. Чтобы завести в нём национальный уровень, за это должны проголосовать участники этого региона, что нынче невыполнимо, хотя попытки были. Поэтому IP-адреса продолжат распределяться на основании политик RIPE NCC согласно воле RIPE community, а не госорганов. Да, у объекта типа «сеть», то есть блока IP-адресов, есть поле страновой принадлежности, но оно, согласно политикам, не имеет чёткого регулирования. Дело в том, что такого рода блоки делятся владельцем на более мелкие самостоятельно и могут быть делегированы как душа владельца пожелает, поэтому он может указать этот код как ему велят сердце, голоса в голове и фаза луны.

Естественно, российского регулятора это не устраивает, но надавить на RIPE NCC он не может никак.

Это был короткий экскурс в проблематику. Геобазы можно либо собирать самостоятельно, основываясь на полупубличных регистрах RIR, либо использовать коммерческие компиляции. Maxmind как раз располагает таковой, в том числе продаёт в удобном для автономного использования виде. Кроме них есть ещё поставщики, но большинство продаёт геоинформацию в виде SaaS, что неудобно для использования, да и требует раскрытия информации перед сторонним поставщиком. Свои базы можно формировать на базе данных RIR, но это довольно сложно, да и не всегда в RIR указаны актуальные данные. Поэтому мы используем Maxmind компиляцию.

Какие недостатки? В Maxmind довольно точные сведения, но всё же не всегда они актуальны. Например, если блок адресов недавно был перепродан, то надо уведомить Maxmind об изменении гео, иначе данные из БД RIR могут приехать сильно не сразу (масяцы-годы). Также, такое случается в тех региональных образованиях, которые недавно сменили свою страновую приписку.

Теперь на счёт РКН. Да, российскому телеком авторити не нравится такая вольность с гео, особенно в свете поголовного учёта каждого гвоздя у российских операторов связи. Поэтому время от времени они приходят с новыми инициативами сбора «суверенной» базы данных «российских» номерных ресурсов, IP-адресов и автономных систем. На моей памяти таких заходов было несколько, самая известная на сегодня — это РАНР, однако идея была сильно скомпрометирована относительно вольным наполнением этой базы. Сейчас готовится новая инициатива сбора геоинформации. До этого российским гео пытались заниматься различные подгосударственные образования, тот же Росниирос, но тоже с отсутствующим успехом. Как бы то ни было, эти базы не распространяются в каком-то общеупотребимом формате, удобном для совместного использования с иными геобазами. А некоторые и вовсе не распространяются.

Учитывая, что Россия — это только один из рынков, откуда приходят подобного рода запросы на ограничения, нам нужно иметь не только российскую базу, а вполне себе мировую. По соотношению факторов, база Maxmind выглядит как наиболее подходящая: достаточная точность, офлайн работа и well-known формат. Но не идеальная, да. Можно считать это компромиссом.

К слову, есть геобазы, формируемые не столько на данных БД RIR, а на основе эвристического исследования сетевых задержек и путей прохождения пакетов. Но эти базы мало того, что малодоступны, особенно как офлайн продукт и достаточно дороги, но и существуют для иных целей, как распределение CDN трафика, но иногда используются и для ограничений, но больше по копирастическим соображениям.

Ну вот хороший и актуальный пример об айпи адресах в "региональных образованиях, которые недавно сменили свою страновую приписку". Есть вполне реальный шанс, что пользователь из такого "регионального образования" увидит заблокированный контент и побежит жаловаться в РКН

Ну, если настолько «повезёт», то такой риск есть, конечно. Но что-то мне подсказывает, что надзорный орган сначала пойдёт «подержать за пуговицу» оператора связи, так как сейчас к неверному гео они относятся довольно нервно.

Оператор связи не влияет напрямую на БД Maxmind.

У Maxmind есть специальная форма для операторов связи для исправления геоинформации для блоков адресов.

Не совсем понял чем не доволен ркн, ведь ему до фене геобазы, он же проверят отсутствие доступа у оператора, который априори российский?

UFO just landed and posted this here

Интересно, что же там такое попросил заблокировать Суд Эстонии? :))

Hidden text

А само решение блокировать статьи только в недовольных ими странах - отличное. Конечно, лучше бы вообще ничего не блокировать, но к переходу в tor\i2p готовы еще далеко не все :)

Интересно, что же там такое попросил заблокировать Суд Эстонии? :))

Geektimes наверное )

На лостфильме так. "Доступ для вашей страны закрыт". И дальше жирный намёк: "страна определяется по ip". Не хватает только большой кнопки "вкл. VPN"

Мы заблокируем, но на основании чего и что - не скажем. Ну хоть так да...

Ну норм, если статья недоступна по геолокации всегда можно воспользоваться прокси/VPNом чтобы прочитать. Уж лучше, чем полный выпил с сайта

полный выпил

Написал - выпил - в тюрьму!

Мне другой вопрос интересен. У администраторов хабра есть возможность создать какой-нибудь классификатор авторов и пользователей на основе их статей, комментариев, активности на сайте и т.п. Натренировать сетку, и затем, с какими-либо целями показывать пользователю только те статьи и комментарии, которые ему интересны. Таким образом полностью изолировав эти классы пользователей друг от друга и от общения друг с другом.

Кто как думает, какие цели могут быть у подобной практики? И есть ли она на сегодняшний день?

Это называется «рекомендательные алгоритмы» и существуют практически везде, в том или ином виде. На Хабре они в зачаточном состоянии, иногда это и хорошо, так как агрессивные рекомендательные алгоритмы часто помещают посетителей в информационные пузыри.

А эти алгоритмы хабр планирует развивать?

Да, конечно, но это деликатный механизм и хорошо сделать не сказать что просто.

только не убивайте RSS, пожалуйста, чтобы иметь возможность игнорировать все эти рекомендации

Натренировать сетку, и затем, с какими-либо целями показывать пользователю только те статьи и комментарии, которые ему интересны.

Рекламные рекомендации, которые опираются на опыт прошлых просмотров и покупок, не умеют предугадывать интересы в будущем. Если я уже купил рубашку, то нет смысла показывать мне новые рубашки. Это же верно и для Хабра - если я уже прочитал о каком-то открытии, то зачем мне рекомендовать новые материалы по этому же открытию? А для тематических подборок новых материалов не нужно тренировать, есть хабы, теги и поиск.

Вот "статьи с тегами, которые ты читаешь и плюсуешь, но не выставил себе руками" - логично подсовывать в рекомендациях.

А может пора ввести отдельную версию Хабра - по платной подписке: со всеми статьями и без всякого, прости Господи, роскомнадзора? И каждый, кто подписывается, гарантирует, что не является барабанщиком, иначе обязуется отрезать себе мизинец и выплатить штраф в размере стоимости почки на чёрном рынке. И каждому статью выдавать по сгенерированной для него ссылке. Чтоб по запросу роскомнадзора сразу распознать предателя и всячески выразить ему неодобрение сообщества. Вдобавок, удаление статьи по этому адресу оставит материал доступным для остальных подписчиков, а требования регулятора будут при этом исполнены.

Насколько помню, достаточно просто убрать эти статьи из общего доступа, чтобы просмотреть её можно было только после регистрации. И у Роскомнадзора претензий быть уже не должно. Или эта информация уже устарела?

Эта информация ничтожна, если по ней нет юридической/судебной практики. В целом, если исходить из риск-ориентированного подхода, то распространение среди зарегистрированных пользователей выглядит излишне рискованным, в том числе исходя из формулировок в немногочисленных судебных делах по смежным тематикам.

У Роскомнадзора (читай государства) хватит "денег" на любые доступы к любым подпискам сколько бы они не стоили.
Никакие "гарантии" (истребовать почкуштраф потом в Басманном, прости г-ди, суде собираетесь?), персональные ссылки и тем более "неодобрение сообщества" не спасут от "сознательных" стукачей. Два таких стукача с уникальными ссылками на запрещенные регулятором материалы смогут перевести ресурс в ранг злостных нарушителей/неисполнителей требований регулятора, что значительно ускорит блокировку ресурса целиком.

Спасибо за лучшее из тех, что в ваших силах, решение этой проблемы. Вы молодцы.

Регион можно будет выбрать в настройках профиля?

Я поддерживаю список ресурсов, которые геоблокируют россиян. Этот список можно прикрутить, например, к расширению в браузере, которое будет пускать трафик до указанных ресурсов через прокси.

Как действовать владельцу материала, чтобы снять блокировку?

Как модераторы Хабра отнесутся к такому варианту - автор узнает о факте блокировки, снимает статью с публикации, чистит текст по мере своих догадок о причинах блокировки и публикует отредактированный вариант как новую статью?

К сожалению, от мнения и желания модераторов это не зависит. Пока существует решение суда о признании информации, находящейся по некому URL незаконной, отражение любой информации по этому URL остаётся под запретом под угрозой блокировок. Да, в теории по духу нормы закона, на который мы ссылаемся, можно доколебаться даже до текста 404, но вроде тут всех всё устраивает. Если автор хочет вывести статью из блока, ему надо оспорить и отменить решение суда, на основании которого была произведена блокировка. Более того, в большинстве решений первичного суда вообще отсутствуют детали, какая часть публикации признана незаконной.

Немного юридической душноты: вот норма закона 149-ФЗ: 15.1.8, по которому приходит 95 процентов запросов из России:

Незамедлительно с момента получения от провайдера хостинга уведомления о
включении доменного имени и (или) указателя страницы сайта в сети
"Интернет" в реестр владелец сайта в сети "Интернет" обязан удалить
интернет-страницу
, содержащую информацию, распространение которой в
Российской Федерации запрещено.

Норма написана излишне коряво и в более поздней норме того же закона 149-ФЗ: 15.2.4, связанной с иным составом (авторские права), детализировано требование более грамотно:

В течение одного рабочего дня с момента получения от провайдера хостинга
или иного указанного в пункте 1 части 2 настоящей статьи лица
уведомления о необходимости ограничить доступ к незаконно размещенной
информации владелец информационного ресурса обязан удалить незаконно
размещенную информацию или принять меры по ограничению доступа к ней
. В
случае отказа или бездействия владельца информационного ресурса
провайдер хостинга или иное указанное в пункте 1 части 2 настоящей
статьи лицо обязаны ограничить доступ к соответствующему информационному
ресурсу не позднее истечения трех рабочих дней с момента получения
уведомления, указанного в пункте 2 части 2 настоящей статьи.

Среди интересных edge case у нас были случаи, когда URL, на который ссылались суды, был якорем на комментарий. В целом, тогда мы удаляли комментарий и иногда приходилось несколько раз доказывать и рассказывать что такое якорь и почему страница открывается всё равно, хоть и информация и удалена вместе с якорем. Пока понимание находили.

> снимает статью с публикации, чистит текст по мере своих догадок о причинах блокировки и публикует отредактированный вариант как новую статью?

Пока существует решение суда о признании информации, находящейся по некому URL незаконной

При перепубликации URL сменится - у статьи будет новый идентификатор.

Тут вопрос именно к модераторам. Если кто-то начнет просто переопубликовывать старое, чтобы обрести новых читателей, то это наверняка будет сочтено плохим поведением. А если для ухода от страйка, то может ли такое поведение быть допустимым?

Нет мнения на этот счёт. Формально да, предписание распространяется на конкретный URL, для нового поста он сменится. Более того, я даже не уверен, что кто-то это будет выявлять, так как для всех галка стоит и палка сделана. Если это не будет нарушать правила Хабра и не будет доставлять никому неудобств, я не вижу проблем, но я не модератор. Особенно, если материал публикации будет переработан.

Было бы круто интегрировать выгрузку в веб-архив перед блокировкой статьи на случай изменения политики сайта в будущем.

Мы как раз ввели механизм геоблокировок, чтобы не блокировать (удалять) статьи, а только скрывать от части аудитории. Думаю, что статьи, заблокированные для аудитории из России, будут доступны в Веб-архиве, хотя бы потому, что маловероятно, что их краулеры используют IP-адреса c RU в гео.

Удалённые статьи можно вытащить из кэша поисковиков (если прошло не очень много времени) и с ресурсов, которые зеркалируют контент Хабра. У меня есть юзерскрипт, облегчающий задачу.

Мне кажется, информация о блокировке какой-либо статьи является важным дополнительным контекстом для ее восприятия. Было бы здорово, если бы информация о таковой явно отображалась в заголовке. А еще, было бы круто регулярно видеть новости о поступлении запросов на блокировку, с подробностями в рамках законодательства, естественно.

Интересно, а старые статьи вновь появятся, или это только в отношении новых будет применяться? Может не внимательно прочел.

Похоже, что не внимательно прочитали:

Внедрение этой фичи позволило пересмотреть режим доступности для старых статей, которые были заблокированы по подобным предписаниям, теперь они будут заблокированы только для пользователей из стран блокировки.

Полагаю, что 451 отсылка к знаменитому произведению Рея Бредбери)

Да, об этом прямо указано в самом конце RFC7725:

Acknowledgements Thanks to Terence Eden, who observed that the existing status code 403 was not really suitable for this situation, and suggested the creation of a new status code. Thanks also to Ray Bradbury.

К слову, наши дизайнеры тоже постарались и сделали отсылку к произведению в самой иллюстрации.

Во что превратили интернет. Это ужас. Причëм сейчас не всегда зайдëшь и с VPN, ведь некоторые решили посадить себя в клетку от "злых монстров" под кроватью. В итоге некоторые ресурсы доступны с одного гео, другие с другого. Люди .. что вы творите? Удивительное существо человек. В негативном смысле.

Sign up to leave a comment.