Комментарии 278
Если эти файлы были доступны в интернете, то чего Яндексу вообще боятся и удалять их из выдачи? Доказали бы, что они тут не при чём, выдав адреса куда люди сами слили эти ссылки.
А так что-то дурно пахнет это всё.
Если бы яндекс слил данные, которые под паролем находятся, тогда другой разговор.
А браузеру точно разрешали собирать данные? Я им не пользуюсь не в курсе.
Если конечно там прям так и написано, что все страницы посещённые вами будут переданы поисковику, то проблем нет.
robots.txt индексацию не запрещал, пароль на ссылку никто не поставил.
В соглашении они получили для себя это право.
Не совсем, для индексации ссылка должна попасть в поисковик. Из известной поисковику страницы, ручным заявлением или из карты сайта (которая указана в robots). Просто случайную страницу он не схватит, ради чего-то (профиля аккаунта?) они сливают посещённые страницы. Помнится, этим страдал один сервис и тогда это вызвало всеобщее возмущение, но сервис обламывается об https, а браузер — нет.
Я вам еще больше скажу: в Метрике есть отдельный пункт «отправлять на индексацию страницы, посещенные пользователем». Это немного оффтоп, т.к. в доксе явно Метрика не стоит, но все же.
Раз уж легально собирают всё, то зачем бояться.
Если бы эти документы всегда показывали, то никто бы и слова не сказал, а вот так вдруг появившийся немаленький пул специфических документов — это что-то не то. Вот и решили, что проще выпилить, чем потом объяснять РКН кто тут верблюд.
Ну тогда взятки гладки, не понятно почему тогда Яндекс испугался и удалил выдачу.
Раз уж легально собирают всё, то зачем бояться.
Потому что не все так просто.
1) Нельзя просто написать «пользуясь браузером вы отдаете все имущество и личную свободу компании Яндекс», то есть написать можно, а вот легально работать оно не будет, так как есть базовые права, которые нельзя нарушать договорами, в частности право на приватность личной жизни, всякие права на защиту персональных данных.
2) Там не сказано про индексацию, только использование для улучшения сервиса. Проблема в том, что по сути персональные данные раскрылись всему свету из-за ошибки Яндекса (он не должен был индексировать приватные ссылки на диски),
3) И если вам мало, Яндекс имеет офисы в ЕС, среди пользователей его браузера найдутся русскоязычные граждане ЕС у которых могли утечь в сеть приватные данные (вроде скана паспорта) — те кто следит за соблюдением GDPR с радостью вкатят штраф в десятки миллионов $. Впрочем в РФ тоже есть закон о персональных данных (не следил, не знаю насколько он страшен).
Постойте, приватные данные раскрылись всему свету из-за ошибки пользователей, а не Яндекса. Яндекс не виноват, что пользователи не понимают различия между "доступен по ссылке" и "доступен по паролю"
Однако стоит заметить, что невозможно отследить за изменениями лицензионных соглашений при каждом обновлении всего испольуемого софта.
ТАк что по хорошему, такие вещи на уровне законов должны признаваться не имеющими силы.
У меня в доме доступ по коду — разве код стал публичным от того, что я его записал в телефонный блокнот?
Сам URL является кодом доступа. Он не нигде не публикуется, значит его знают только те, кто должен. То что поисковик своими махинцаями за ним подглядел — так он также может и пароль подсмотреть.
Если ваш телефонный блокнот доступен без пароля в интернете — то да, он стал публичным. Неправда ли все те, чьи iot устройства с дефолтным паролем можно найти через shodan.io — сами виноваты? Чем лучше те, кто оставил свою информацию в интернете БЕЗ пароля?
Яндекс же не скопировал все эти пароли в фейсбук с заголовком "Шок! Слитые пароли", он просто их нашел. Он же, как бы, поисковик.
Он его «нашел» в моей записной книжке, доступной ему.
Есть разница между "браузер проиндексировал приватную информацию, и ее теперь видно в поиске (хотя по ссылке она не доступна)" и "браузер намайнил какой-то урл, на который из интернета пришел бот и в поиске появилось что-то (что доступно любому по этому урлу)"
Даже больше — куча сервисом делается авторизщацию через передачу данных в виде хэша в get запросе. И о боже, у них на выходе получается как раз та самая ссылка, по которой можно получить доступ к данным. И что? Эти ссылки теперь можно выкладывать в интернет свободно?
Правильные авторизующие ссылки во-первых одноразовые, во-вторых потухают. Если какой-то сервис делает не так — это плохой, не безопасный сервис. Именно по той причине, что урл это идентификатор ресурса, а не способ аутентификации.
Серьезно?
От закрытой сложной ссылки вполне логично ожидать, что она не станет публичной никаким образом кроме прямой публикации.
Если оно происходит иначе — это не вина пользователя.
Пожалуй вы правы, Гуглу следовало более явно обозначить риски.
От закрытой сложной ссылки
Она НЕ закрытая. Она просто длинная и сложная, но для обычного пользователя, подозреваю, она не отличается от любой другой. Я не думаю, что они читают урлы, и транскрибируют их с английского языка. Они просто знают, что если кликнуть мышкой вот на этот набор букв — попадешь на одноклассники, а на вот этот — в документ с паролями.
Ну, я так подозреваю. Почти уверен.
Я больше чем уверен, что браузеры делают не настолько глупые люди, чтобы не отфильтровать схемы вроде data-uri, smb или file. И кстати найти это изображение по слову пароль при всем желании будет нельзя — потому что ни в урле, ни в картинке слова "пароль" нет
И кстати найти это изображение по слову пароль при всем желании будет нельзя — потому что ни в урле, ни в картинке слова «пароль» нетOCR не вчера, однако, придумали…
все те, чьи iot устройства с дефолтным паролем можно найти через shodan.io — сами виноваты?
Абсолютно да, они виноваты сами.
Кто сказал, что эта ссылка публичная?
А браузеру точно разрешали собирать данные?
При чем тут браузер?
ПОСЛЕ того как ссылка была проиндексирована — она была показана обычному пользователю. У которого НЕТ АВТОРИЗАЦИИ.
И он по ней благополучно вошел.
Вы таки удивитесь, но вы сами все разрешили.
Или соглашение перед установкой не читали? ай-яй-яй.
P.S. Человек-айпадоножка
Хром — после захода на ссылку приходил гугл.
Яндекс что, рыжий чтоль?
Если браузер собирает обезличенные данные, а ссылка публичная, то все ok.
Если ссылка фактически не была опубликована, то почему вдруг она может считаться публичной?
Неужели вы думаете, что поисковику делать нечего, кроме как случайные строки генерировать и искать, есть ли сайт с таким названием.
Но создать сайт и не опубликовать как-то не просто. Вы как минимум его опубликуете в DNS.
PS. Да и список доменов получить тоже не просто. Есть у регистраторов запрос «дай все свои домены»? Подозреваю что нет, а регистраторов много.
У краулера _очень_ много источников, где взять ссылку на сайт/страницу. И прямой href= — это только самый простой и понятны для большинства.
У краулера _очень_ много источников, где взять ссылку на сайт/страницу.
Отсюда можно поподробнее?
Другое дело, что ошибкой Яндекса в данном случае была индексация/ранжирование всех этих документов. Скорее это база, собранная для задач внутренней аналитики/обучений нейросетей, и которая почему-то попала вместо «ToAnalyze» в «ToIndex».
внутрисайтовая аналитика — по вине юзера?
мобильные приложения — по вине юзера?
Ну тогда извините, юзер виноват в нарушении безопасности потому, что открыл таблицу, ок.
браузер — по вине юзера??У браузера яндекса, как пример, в пользовательском соглашении же русским по белому написано, что они аналитику собирают. Юзер выбрал его добровольно среди других альтернатив.
внутрисайтовая аналитика — по вине юзера?Аналитика на сайте с претензией на анонимность? Серьезно?)
Концепция защиты Gdocs и кибербезопасность в общем — это отдельная тема пары сотен докторских диссертаций)
Судя по интересам вы в курсе, что и как в веб-разработке? Dev-домены потому и закрывают всегда (ага, щаз) от индексации, что иначе через пару недель разработки вдруг полуготовый сайт оказывается в поиске. А иногда такие домены находят сеошники лет через 5 жизни сайта.
Я не говорю, что невозможно закрыть сайт от краулера. Я говорю, что способов получить ссылку далеко не один. И если вы не оставляли ссылку на «приватный» сайт в публичных интернетах, то это не значит ровным счетом ничего.
Виноват в индексации юзер или Хоттабыч — это важно?
Если это не важно, то что вообще важно? Может кто-то сделает выводы. Под новым углом посмотрит на привычные инструменты. И начнет как-то заботиться о своей приватности.
Остаётся браузер.
И да, список мобильных приложений не ограничивается одними мессенджерами, совсем нет.
Я не говорю, что невозможно закрыть сайт от краулера. Я говорю, что способов получить ссылку далеко не один. И если вы не оставляли ссылку на «приватный» сайт в публичных интернетах, то это не значит ровным счетом ничего.
В теории — конечно, получить ссылку можно множеством способов. Но их легальность и моральная чистота далеко не всегда не оставляет сомнений :)
плагины/виджеты
Вы про JavaScript код?
всевозможные каталоги
Это по сути тот же href.
браузер
А вот законность этого метода уже под большим вопросом. Я как пользователь браузера, возможно совершенно не хочу, чтобы кто-то индексировал посещённые мной страницы, если их ещё нет в индексах.
Вы про JavaScript код?
Метод сбора — ну да, js, наверно, я хз как там плагины работают и на чем написаны. Я про внешний «интерфейс» сбора информации.
Это по сути тот же href.
по сути да. А по смыслу несколько иное. Есть пользовательские ссылки, которые все и воспринимают как ссылки в классическом виде. А есть автогенерируемые каталоги, которые представляют собой свалку всевозможного хлама.
А вот законность этого метода уже под большим вопросом
Лицензию читали? принимали? Дальее вы можете или в рамках допустимого настроить чекбоксы или не использовать ПО.
Метод сбора
Нет, вы не поняли. Я именно про парсинг JS кода на сайтах. Есть же динамически подставляемые ссылки в JS приложениях, которые в теории можно извлечь, анализируя код. Хотя это не всегда тривиально (высокий риск ошибок и очень ресурсоёмкий анализ). Например:
var href = 'https://site.com/' + path + page
А есть автогенерируемые каталоги, которые представляют собой свалку всевозможного хлама.
А как связан процент хлама с вышеописанной ситуацией?)
Лицензию читали? принимали?
Если лицензия нарушает какой-то реально существующий закон — она не имеет юридической силы в этом пункте. Если не нарушает… что ж, всё равно практика отправки куда бы то ни было вводимых в адресную строку URL, даже обезличенных — это очень странно (да, я знаю про удобную функцию autosuggest от Гугла, я и сам иногда ей пользуюсь — однако я без неё проживу, раньше ведь как-то жили во времена IE 6-8).
У нас, например, CMS преобразует все ссылки «наружу» из somewhere.there/something в secure.site/redirect#http://somewhere.there/something (а на secure.site/redirect висит тривиальный скрипт). Referer в этом случае будет вести на secure.site/redirect, который отправит пользователя на secure.site, так что утечки не будет.
Адреса страниц пользователей или групп, на которых произошёл клик по ссылке? Если скрывать такую информацию, вебмастерам будет сложнее отслеживать эффективность переходов с ссылок в разных сообществах. Но я не могу понять, как можно было бы эти данные использовать кому-то во вред.
Если скрывать такую информацию, вебмастерам будет сложнее отслеживать эффективность переходов с ссылок в разных сообществах.Если учесть, что речь идёт о внутренних страницах, недоступных людям без пароля — то не очень понятно что могут вебмастера делать с подобной информацией.
Но я не могу понять, как можно было бы эти данные использовать кому-то во вред.В случае если это Wiki? Сами названия страничек будут содержать разного рода конфиденциальную информацию. Названия продуктов, используемых технологий и прочего.
Тогда я не понимаю, адреса каких страниц скрывают, и зачем :)Адреса страничек, на которые произошёл переход никому не интересен — они ж публичные, мы с этого начали.
Адреса страниц пользователей или групп, на которых произошёл клик по ссылке?
А вот адреса страничек с которых произошел переход — другое дело. На современных сайтах установлены зачастую десятки разных счётчиков и «лайков»… какой из них эту информацию сольёт — неизвестно, так что лучше сделать так, чтобы этой информации просто не было.
Страницы, с которых осуществлён переход — в 80 процентах случаев доступны без пароля незарегистрированным пользователям, в том-то и дело. Это значительная часть личных профилей и ещё более значительная часть сообществ.
Адреса страниц пользователей или групп, на которых произошёл клик по ссылке?
Я написал «на которых», а не «на которые», это не было опечаткой.
В случае если это Wiki? Сами названия страничек будут содержать разного рода конфиденциальную информацию.
Вы про некую внутрикорпоративную Вики? В таком случае да. Но я писал про соцсети, с вашим сценарием и так понятно, за что есть смысл опасаться.
А в случае с социальными сетями всё банальнее и проще: они учитывают переходы со страничек, чтобы оценивать станицы, с которых переходят.
Если на страничке куча ссылок, но по ним никто не кликает — то это явно менее полезная страница, чем та, где есть одна ссылка, но на которую кликают всё время.
Зачем ВК нужно оценивать эффективность ссылок в постах Васи?Не «эффективность ссылкок» в приципе. А частоту, с которой по ним кликает Петя. Чтобы понять — нужно ли этого Васю включать в ленту Пети или нет. Чтобы найти друзей с похожими интересами. И прочая, прочая, прочая.
Это куча геморроя, за который никто не заплатит :)Наоборот — это то, что отличает современные социальные сети от MySpace и LiveJournal'а.
Чтобы понять — нужно ли этого Васю включать в ленту Пети или нет
Эм, что?)) В ленте выводятся только посты тех людей, на которых пользователь подписан явно (и кого не добавил в фильтр).
На счёт поиска друзей: те, кого обычно предлагали мне — это друзья друзей с некоторым дополнительным фильтром по вузам и профилям вузов. Для этого не нужны данные по кликам на ссылках :)
Хотя можно провести эксперимент: кликнуть у кого-нибудь на стене по ссылкам пару раз (желательно у кого-то из френдлиста одного из друзей), а потом посмотреть, выведет ли этого человека в «возможных друзьях».
См. в первом абзаце.
Да и как иначе? Google должен понять — нет ли там заразы (чтобы в последующем предупредить вас), может собирать разную статистику и прочее, прочее, прочее.
Заходит он туда ботом именно для того, чтобы гарантировать приватность (Chrome мог бы и сам текст на сервис проверки на «заразу» посылать — но тут уже есть возможность «слить» в Гугл инфу и из интранета тоже, чтобы будет уж совсем нехорошо).
Но вот про внесение в индекс и в базу данных краулера — по вашей ссылке ни звука.
Единственный способ добавить ссылку, недоступную «из открытых источников» в базу карулера — через www.google.com/webmasters/tools/submit-url
Google должен понять — нет ли там заразы
Простите, а я его об этом просил?.. Если речь о скриптах на некой площадке, проверяющих мой пост перед размещением на ней — воля владельца площадки делать любые проверки. Но всё остальное… Гугл не поставщик антивирусного ПО. И я его не умолномачивал ничего сканировать. Аналогично — Microsoft в примере со Skype.
Если браузер собирает обезличенные данные, а ссылка публичная, то все ok.
Сама ссылка может быть паролем. Вариант на «предъявителя» (authorization without authentication)
К слову — все ваши фотографии в соц. сетях доступны без авторизации по публичным ссылкам. В том числе и приватные (можете проверить). Ничего так, если поисковик возьмет и все их сольет в паблик?
Единственный способ этого избежать — не класть.
Ну выложите в паблик свои логины-пароли, чего уж. Раз все равно нет приватности. А если не собираетесь, значит на какой-то минимальный уровень приватности все-таки рассчитываете. Что ваши данные хотя бы первый случайный мимокрокодил не откроет, для 99% задач этого уровня достаточно. Но хочется, чтобы конвенции об этих 99% поддерживались всеми влияющими сторонами.
в Интернете приватности нет. Всё, что туда попало — будет скомпрометировано, рано или поздно.Единственный способ этого избежать — не класть.
Проблема в том, что это справедливо вообще для любого компьютера/смартфона, подключенного к инету, так как антивирусы, ОС, сайты, брузеры, трояны и вирусы массово сливают информацию, и единственный способ (и то не гарантированный) избежать этого вообще не подключать комп к сети, а лучше вообще не держать критичную информацию на электронных устройствах. Иначе она будет скомпроментирована рано или поздно.
Выше кто-то приводил пример парсинга текстов электронных писем для проверки на наличие опасных ссылок, создание превью для вложений, и прочего. Так ведь есть же выход этого избежать: использование своего почтового сервера, и нативного (под мобильные такое тоже есть) клиента. А если человек совсем параноик, и не доверяет встроенному в ОС почтовику — можно написать свой, если квалификация позволяет :)
Ну или смириться с риском, да.
P.S. Хотя я вот совершенно не верю, что тот же стандартный e-mail клиент из Андроид (весом менее 300 килобайт) что-то куда-то сливает на сторону.
стандартный e-mail клиент из Андроид (весом менее 300 килобайт) что-то куда-то сливает на сторону.
Так кроме стандартного клиента есть несколько Гб программ ОС Андроида, содержимое которых известно только гуглу. У меня, например, на собственные нужды ОС Андроида тратит несколько Гб трафика в месяц, мне все равно он в оснвном вай файный, но в таком кол-ве трафика можно что угодно спрятать.
ОС почтовику — можно написать свой
А если я не доверяю самой ОС тоже написать свою? Нет, можно, конечно, залить Линукс на смартфон, но даже это не гарантирует нулевой уязвимости/бекдора в ОС или железе. А боюсь квалификации и времени по написанию с нуля своей ОС + созданию своего железа + надежной защиты всего этого — нет практически ни у кого.
пусть Яндекс докажет, что они были доступны свободно в интернете, а не слиты Яндексу его браузером
Презумпция невиновности, как она есть.
Если вы не согласны, что репутации Яндекса нанесён урон, то докажите, я вокруг себя вижу обратное, люди стали удалять браузер, хотя пользовались им.
Причины не всегда объективны, иногда совсем даже необъяснимы или ошибочны.
В данном случае мне позвонили люди и явно озвучили причины почему они ищут другой браузер на замену Яндексу — потому что все новости забиты ссылками на то, что именно Яндекс слил пароли пользователей да ещё РКН от него требует объяснений.
Если не это называется репутацией, то что ещё?
На месте Яндекса я бы очень озаботился этим положением и повернул СМИ в другую сторону, пока остатки лояльных пользователей не разбежались.
А то что тото позвонил вам это такая себе метрика, мне вот никто не звонил.
А сколько народа зашли посмотреть на яндекс чтобы глянуть что же там такое слили?
Вот если бы вы мне сообщили, что есть хоть один человек, который решил, что репутация улучшилась после таких новостей, то моя метрика перестала бы что-то показывать. Есть такие?
Но когда пару лет назад обновление яндекс-диска посносило системы народу, как-то никто особо никуда не разбежался. И вовсе не потому, что Яндекс чем-то там озаботился, а просто привычно вздохнули и продолжили есть кактус.
Разбираться заново, переезжать, переучиваться… Не покупать же новую машину, если у старой внезапно спустило колесо?
По большей части (в моей эникейской практике) это те люди, для которых компьютер довольно далек от сферы ежедневных интересов.
У меня было несколько пострадавших, которые вообще ни сном, ни духом, откуда этот яндекс-диск у них взялся. Не ставили, не пользовались, даже не слышали. То ли с мусором поставился, как амиго, хотя вроде к тому времени Яндекс уже прекратил такую практику…
Будут выкручиваться до последнего.
Презумпция невиновности, как она есть
… которая не действует в гражданском кодексе, только в уголовном. Если ваш сосед утвреждает, что вы слушали музыку всю ночь, а вы утверждаете обратное, то если вы не докажете, что не слушали, судья будет решать кому он верит больше.
Но тут явно никто не подбирал хеш, ссылки на документы попали в выдачу по другому пути.
Только Яндекс.Браузер об этом не знал и добавил ссылки, на которые заходили пользователи по приглашению, в общий буфер индекса. Так что ссылка по приглашению стала доступна поисковому боту, а значит всем. И вот тут уже Яндекс действительно должен объяснить, почему он использовал подобную информацию в целях, о которых не говорит в условиях использования браузера.
И вот тут уже Яндекс действительно должен объяснить, почему он использовал подобную информацию в целях, о которых не говорит в условиях использования браузера.
Пункт 5.1 пользовательского соглашения.
Пользователь настоящим уведомлен и соглашается, что при включении в Программе функции автоматической отправки статистики
Пользователь может отключить сбор указанных данных отключением функции автоматической отправки статистики в настройках Программы.
Я должен это включить сам, верно?
А теперь установите Яндекс браузер и зайдите в настройки.
И реально — по таким ссылкам ходит, например скайп при пересылке ссылки может решить проверить а не вредоносная ли ссылка. И не только скайп.
Если же надо чтобы не ходили (белопушистые) краулеры — есть robots.txt, и есть (правда не все кралеры это понимают но все же) спецтеги в html на тему «не индексировать этот документ». Есть наконец фильтрация по user-agent — поисковые краулеры для индексации — представляются собой (для всяких проверок могут и браузером представляться но это отдельный вопрос).
Если владельцу сайта оно важно — он прописывает все что надо.
Если пользователю что-то не нравится — он может обращаться к владельцу сайта, если не обращается и по прежнему использует сайт — ну значит его все устраивает.
Владелец робота может забить на robots.txt. Это вообще не защита. Т.е. защита на том же уровне доброй воли поставщика ПО, который в какой-то момент, как мы поняли, может начать индексировать приватные доки.

Это, в принципе, еще не гарантирует, что и раньше указывал — но как-то слабо верится что нет.
Если же она попала, то значит где-то произошла утечка, либо на моём компе, либо на компе друга, если он, например, использует Яндекс браузер, либо где-то посредине, например в РКН.
Это всё равно, что создать доступ по одноразовому паролю и переслать ссылку и пароль.
Вообще-то, нет. По одноразовому паролю доступ получить можно один раз, а по открытой ссылке сколько угодно раз.
Ссылка чем от пароля отличается?Вы шутите, я надеюсь?
(в данном контексте, разумеется)
Давайте это будет не адрес квартиры, а карта с крестиком, где клад закопан.
Ок?
И чем карта с крестиком отличается от ключа к замку сундука? На мой взгляд прятать карту даже важнее чем ключ. Потому что зная где сундук уж ключ как ниюудь подберут. А вот ключ без сундука совершенно бесполезен.
UPD:
Это я просто хотел показать что игра в аналогии — это бессмысленно. Аналогию можно придумать любую, с перекосом в любую сторону.
Так что давайте без аналогий, а с точки зрения ИБ.
Ссылка — это указатель на местоположение. Пароль — часть процедуры подтверждения прав доступа к местоположению. Разница, на мой непросвещенный взгляд, очевидна.
Да, пароль может быть частью ссылки при некоторых условиях (в случае гуглодока они вроде бы не выполняются).
Как, строго говоря, и фраза «ключ под ковриком» может являться частью описания местоположения квартиры.
Вы лучше сразу скажите, чего я не знаю (я много что не знаю, это нормально, и не ирония) о разнице между ссылкой и паролем.
Работа с паролем может быть реализована так, что скрытая ссылка будет безопаснее, ссылка может быть настолько очевидной что не будет защитой ни от чего.
Глобально говорить что пароль — это ого-го, а ссылка — это фи — бессмысленно. Потому что вопрос в деталях реализации, а не концепции.
Ваше мнение заключается в том, что в силу уязвимости реализаций некоторых паролей и сложности некоторых открытых ссылок принципиальной разницы между ссылками и паролями, как классами явлений, нет. Концепции авторизации и прав доступа не нужны.
Я все правильно понял?
Но это всё попытки решить проблему херовыми методами.
Пароль — это херовый метод. Но пока альтернатив ему не много.
Поэтому придмуывают всякие двухфакторные авторизации и прочие вещи. Чтобы из плохой вещи сделать не такую плохую.
Но на глобальном уровне пароль и уникальная ссылка мало чем отличаются.
Собственно вам ниже уже привели пример того, как ссылка сама может содержать пароль.
о разнице между ссылкой и паролем
Ссылка это то что обычно приходит в Get запросы, пароль то что в Post запросе (но вообще-то только потому что пароль меньше и его легче запомнить). Ссылку нужно где-то хранить в электроном виде, пароль — можно и запомнить. При этом подобрать пароль можно, реально длинную автогенеренную ссылку — не реально.
В общем-то, больше отличий нет. Множество сервисов при сбросе пароля высылают ссылку на почту, часто по уникальной ссылке можно получить доступ к деньгам или личному кабинету. Любая утекшая ссылка может иметь не менее плохие последствия, чем утекший пароль.
Уязвимость только вот такие сервисы и программы, которые могут слить себе ссылку, впрочем пароли они тоже могут себе замечательно сливать.
Я подумаю над этой концепцией.
чем адрес квартиры от ключа
Скорее чем ключ от входной двери/сейфа (ссылка) и код от кодового замка от этой двери/сейфа (пароль). У каждого способа есть свои достоинства и недостатки, но в общем-то если что ключ, что код подглядит злоумышленик будет одинаково фигово.
То, что доверять браузеру от поисковой системы не стоит, понятно и без таких эксцессов. Но по моему скромному, если нет пароля, то неавторизованный доступ к информации по ссылке, если я верно понимаю, в пределах fair use (и по-любому вопрос исключительно времени).
Уникальные ссылки для восстановления паролей, кстати, обычно как раз имеют ограничение по времени — и да, предоставляют доступ неавторизованному пользователю в надежде, что некие косвенные методы (например, доступ к почтовому ящику) идентифицировали его достаточно надежно.
Ссылка — ресурс, пароль — доступ к ресурсу. Нет пароля — ресурс общедоступен.
Вот вам ссылки (не настоящие, конечно):
ftp:\\admin:ksjghkt53242@159.03.73.22:6090
ssh:\\root:ksj532terttre42@193.03.73.15:6090
mysql:\\sysadm:ksjghkt53242@159.03.73.22:5619
Вы правда думаете они публичные и какая-нибудь программа их может выложить в инет? А это типичные ссылки для многих сервисов. Пароль и ссылка это очень расплывчато, то что находится в параметрах Get запроса вполне может быть приватной информацией, даже фио пользователя в ссылке на сайте гейзнакомств, может оказаться таким ударом по приватности, что уж лучше потерять все пароли.
пароль — доступ к ресурсу. Нет пароля — ресурс общедоступен.
Если вы так уверены, когда зайдете в свой банк клиент и увидите url вроде page?token=sdf43534egfgkel6346dghgfht2432 или session=sdf43534egfgkel6346dghgfht2432 киньте ссылку куда-нибудь на форум хакеров и чуть-чуть подождите. :) Они будут вам благодарны. :)
Видимо, я еще и плохо знаю терминологию (да запросто). На мой непросвещенный взгляд, от включения в запрос пароль не перестает называться паролем. В приведенном вами запросе ssh:\\root:ksj532terttre42@193.03.73.15:6090 я болдом выделил пару логин-пароль, и курсивом то, что назвал бы собственно ссылкой. Я неправ?
М-мм… Ладно. По-любому, спор уже идет об оттенках смысла в значениях терминов. Содержимое адресной строки браузера может являться конфиденциальным, я не спорю. А что до его названия — пароль, ссылка, get-запрос или молитва высшим силам — в общем, только в печку не ставьте…
docs.google.com/spreadsheets/d/1gNyRn1w9DBqHgizLfZDegHkneB0T6Y60UVIcVFttvXI/
я еще и плохо знаю терминологию (да запросто). На мой непросвещенный взгляд, от включения в запрос пароль не перестает называться паролем.
Если говорит о терминологии, то пара логин и пароль это ключ аутентификации. Ключ аутентификации может быть в принципе любой текстовой строкой (иногда может быть и бинарной строкой, но это скорее экзотика).
Как вы понимаете, не сильно важно скажу я вам логин: fsgsg пароль: gldkhgjklhd4, либо скажу токен/ключ — fsgsg:gldkhgjklhd4. По сути, логин и пароль это понятия только для человека, для комьютера имеет смысл только ключ, полученный конкатенацией логина и пароля.
Поэтому любой ид сессии или токен в GET запросе равноцены логину и паролю, это лишь разные виды ключей аутентификации.
1) Есть такое обобщенное понятие — «аутентификация, основанная на знании секрета (обладании секретной информацией)». Пароль, ключ и т.п. — это и есть такой секрет. Уникальная ссылка, предназначенная для ограничения доступа — соответственно, тоже.
2) Секретная ссылка содержит в себе некую уникальную комбинацию (хеш или еще что-то подобное), которая по сути и является паролем (предьявляемым ключом).
Таким образом, произошла утечка секретной информации — неважно, изолированных паролей или в составе ссылок.
Возможных мест утечек три — сервис, пользователь и канал. Исключим канал (MitM-атаки отдельная тема рассмотрения, неспецифичная для рассматриваемого случая).
Утечкой на стороне пользователя, предположительно, является передача индексатору ссылок, введённых пользователем — браузером из адресной строки, скриптом через разные там метрики, через месенджеры и т.п.
На стороне сервиса же утечкой является допуск индексатора, пришедшего по такой ссылке.
При этом браузер и индексатор, по большому счёту, не могут отличить секретные ссылки от обычных (за исключением случаев, когда URL записан в полной форме, с логином и паролем в отведенных стандартом для этого местах — как приведено выше). И единственный способ для индексатора быть «лояльным» — вообще не использовать никакие ссылки пользователя, что малореально.
А вот сервис, предлагающий услугу «разделения секрета», знает, какие ссылки у него секретные — и вполне мог бы не пускать по ним роботов (хотя бы честных). Конкретная реализация — вопрос второй. Гугл, похоже, этого не сделал никак.
Очень распространенная ошибка, берущая корни от «я не нужен — меня не найдут».
Дело в том, что в интернете такое не работает, найдут все и вся, благо есть боты. Это квартиру вы можете оставлять не запертой уповая что вы не нужны. Не запертый сервак в инете найдут и заселят.
Конкретно без аналогий — перебирая ссылки можно найти интересные, пароль же перебирается на заведомо интересный аккаунт, что и произошло.
tl;dr ссылки уязвимы к удару по площади и неуязвимы к точечному, пароли — наоборот.
Конкретно без аналогий — перебирая ссылки можно найти интересные, пароль же перебирается на заведомо интересный аккаунт, что и произошло.Прекрасное определение! А теперь посмотрите на обсуждаемые ссылки на GDocs'ах — и вы поймёте, что в соотвествии с вашим определением они являются не ссылками, а паролями, так как переборной атаке не поддаются (там SHA256 от секретного числа, сгенерированного пользователем, подобрать его невозможно просто потому что сервера Гугла раньше сломаются).
tl;dr ссылки уязвимы к удару по площади и неуязвимы к точечному, пароли — наоборот.
Что, собственно, и ведёт ко всему описанному в статье, запросам Роскомнадзора и прочему.
Ну подберите ссылку к моим открытым документам.
Я вам даже подскажу — они на серверах гугла.
Давайте ещё раз:
Вопрос стоит так: «Чем ссылка отличается от пароля».
Чтобы объяснить это, давайте возьмем две цели — конкретно ваши документы и часть всех документов на гуглодоках, в т.ч. с некоторой вероятностью и ваши документы.
Так вот, чем ссылка отличается от пароля? Тем что перебирая ссылки, конкретно ваши документы мб и не найти, но можно найти кучу других. Если долго перебирать ссылки, можно найти и ваши. Смысл перебора ссылок — найти много документов, не обязательно ваших.
С паролем ровно наоборот — перебирая пароли к вашему документу можно открыть только его, но зато он точно будет ваш.
А вы вот уверены теперь?
Тут же люди стали предлагать всякие нюансы, типа «переслать ссылку, переход по которой приводит к удалению важной информации, а потом засудить скайп за потерю данных когда их бот по ней перейдет».
news.ycombinator.com/item?id=5704574
Выложил — сам виноват.
Это значит что вот с этого момента вы смело можете говорить «я выложил это в интернет, теперь это доступно всем».
ps /me ностальгически вспоминает начало 2000х и расшаренные прямиком в интернет принтеры и диски пользователей, которые в неимоверных количествах находились элементарным сетевым сканером.
Где граница, выложил или ещё нет?
Сами же пишите, что локальные диски с помощью сканера находили. Значит
они выложены в интернет?
Вот и инфа на вашем компе или телефоне также может считаться выложеной, если с помощью чего-то к ней можно доступ получить.
Я пожалуй закруглюсь с абсурдом, не понимают многие для чего он.
Ребенок захотел помочь родителям и оплачивает счета через сайт банка (на котором на каждой странице яндекс-метрика). Гугл создал сервис для связывания различных девайсов, например — если они были рядом в какой-то момент (для выдачи рекламы, но позволяет деанонимизировать пользователей и сделать инфомацию более полной). Пришли в кафе, а у соседа телефон слушает на предмет «Окей, гугл» с отправкой на сервера голосового трафика для лучшей расшифровки, а по закону Яровой такие данные также в какой-то момент обязаны будут храниться в полном объеме.
Живете обычной жизнью, а вас сеть уже знает. А если американец — то там еще проще, даже в новостях проскакивают утечки баз данных с кучей маркетинговой информации (в России «пиратские базы» от недалеких ведомств не содержат данных о религиозных предпочтениях, наличии домашних животных, хобби и т.д.)
Ах да, все, что я тут рассказал — голимая конспирология, не верьте мне! И вообще — надо жизни радоваться! И обязательно установите амиго браузер, яндекс-браузер, гугл хром, Windows 10 (не энтерпрайз и не взломанную «отключалками»), голосовых помощников (Алиса и другие) и т.д. Это позволит
Допутим у меня нет машины, нет прав, дороги в городе от этого не пропадают и те кто пользуятся машинами тоже. В итоге мне нужно знать хотябы минимум этих правил что бы не попасть под колёса.
Так и с сетью, хочешь не хочешь с ней надо мирится, и очень желательно хотябы примерно понимать что стоит за всеми замечательными и удобными сервисами. Если ты кидаешь ссылку в контакт/скайп/телеграм шлёш её по почте, или вбиваешь в браузере то ты она может уплыть к тем кто делал эти сервисы. А учитывая что сейчас половину прог обновляются тихо и без предупреждений, то даже если они сейчас этого не делают не означает что через пол часа не начнут.
Проблема не в том, чтобы как-то учить правила, а в том, что, по сути, нужно вести себя так, как будто все находятся под колпаком и готовы стучать друг на друга непрерывно, в режиме онлайн (те же «заботливые» друзья и родственники, и ведь из лучших побуждений). И все действия хранятся на серверах практически вечность, а новые технологии позволят хранить больше и лучше. Т.е. нужно измениться не только в настоящем, но чтобы и в прошлом не было серьезных ошибок, типа «сохранил себе на стену музыку, которая ныне признана экстремисткой», а потом покурор интересуется — растпространяете?
Но о чем это я? Как таковой приватности то у людей и не было. Даже в деревнях все друг друга знали. Просто появилась мнимая приватность на короткий срок, а все подумали, что оно навсегда. Раньше про ситуацию «под колпаком» и жизни по правилам писали и говорили попроще — «поступай по совести», чтобы потом проблем не было. И всегда найдется админ (хозяин, дворянин, князь), который обладает большими полномочиями и может менять даже историю методом переписывания.
Есть еще рекомендация — «не заморачивайся», «не думай о сложных вещах», «меньше знаешь — крепче спишь» и прочее. И действительно, если не задумываться, то все намного поще — просто есть удобные услуги и сервисы, а если вы думаете, что мы все «под колпаком» у корпораций — то это все голимая пропоганда и вообще шизофреническая конспирология, достойная упоминания только на сайтах всяких альтернативщиков-конспирологов-плоскоземельщиков-уфологов. Кстати, лично я придерживаюсь идей, высказанных в последнем абзаце. И никто не запрещает использовать официально публичную информацию в личных корыстных интересах. Таки дела.
Как таковой приватности то у людей и не было. Даже в деревнях все друг друга знали. Просто появилась мнимая приватность на короткий срок, а все подумали, что оно навсегда. Раньше про ситуацию «под колпаком» и жизни по правилам писали и говорили попроще — «поступай по совести»
«Никогда не было» — не аргумент. Это не означает что к этому не надо стремиться. Не было много чего из современных гуманитарных ценностей — всяких там «свободы-равенства-братства» и прочих прав человека. Рабство тоже когда-то было в норме вещей.
Причём, ценности отражают не только базовые потребности — жизнь, здоровье, безопасность и т.п., но и высшие- в частности, свободу самореализации.
Приватность, на первый взгляд, не является базовой потребностью. Но только на первый. В условиях, когда информация об индивидууме может быть оружием против него, (открытием уязвимостей) — приватность становится частью безопасности.
Но даже если рассматривать малочисленную «деревню», где «все друг друга знают» и злоумышленник точно так же оказывается на виду — и в этих случаях скорее всего придётся жить не «по совести» а «чтоб не выделяться» — ограничения самореализации во весь рост.
Ну и в наших реалиях «все всех знают» не действует, игра идёт в одни ворота — злоумышленники могут нарыть информацию о добропорядочных гражданах, сами оставаясь в тени.
В итоге рекомендация «не заморачиваться» выглядит как «если вас насилуют — расслабьтесь и получайте удовольствие».
Поход в магазин, на первый взгляд, не является базовой потребностью. Но только на первый. В условиях, когда без похода в магазин нельзя получить еду (выращивание невозможно в многоэтажке в квартире 22м^2) — поход в магазин становится частью базовой потребности.
Дальше появляется общество по борьбе с теми, кто не ходит в магазины — «они покушаются на нашу свободу!» (методом конкуренции магазинам и создании недополученного дохода). Митинги, миллионые толпы на улицах небольшой численностью и прочее. Не ходящие начинают объединяться в антимагазинные движения. Кровавые столкновения, политические требования, революции…
Кажется, что-то такое уже где-то было… Борьба за права — она такая, в борьбе за мир и камня на камне не оставит. И все крутится вокруг базовой потребности!
Или все происходит иначе?
Вот, например, Google по запросу
intext:"Index of /.git"
находит репозитории, которые владельцы сайтов не стремились афишировать, но забыли закрыть. В одном таком репозитории (я не буду афишировать сайт) лежат даже лицензии на коммерческий софт.Я сделал что-то плохое или нет?
Если вы пользуетесь брутфорсером и делаете это со злым умыслом, то с моральной точки зрения — да. Без брутфорсера — это чистая удача, которая не только ссылку вскроет, но и любой пароль.
Меня вот всегда удивляет эта лёгкость с которой люди проводят границы.
Я так не умею, для меня вообще понятия плохо и хорошо очень размыты и я стараюсь не использовать их.
Если вы, найдя брутфорсом, эту директорию, спасли детей от голодной смерти, то вроде как хорошо.
А если случайно нашли, но из-за этого кто-то погиб, то вроде как плохо, причём для меня, но если погиб серийный убийца, то вроде как хорошо.
Поэтому не буду я комментировать ваш поступок с входом в мою директорию.
Если Яндекс скрыл из выдачи ссылки, то я вижу две причины:
1. Скрывают свой косяк.
2. Скрывают косяк других.
Мне кажется более вероятным первый вариант.
Возможно конечно, что они пытаются таким костылём спасти накосячивших пользователей, но мне не нравится мир, где за людей решают как им жить. Если кто-то накосячил и его пароли уплыли, то он должен это понять и жить дальше с этим.
А без брутфорсера с моральной точки зрения уже не плохо?
Злой умысел еще же. При этом ошибаться при вводе пароля — это нормально.
Если вы, найдя брутфорсом, эту директорию, спасли детей от голодной смерти, то вроде как хорошо.А если дети выросли бы гитлерами, то это снова плохо. Мы не забыли уточнить какой моралью пользуемся?
Сноуден ведь тоже не пароли слил, а его до сих пор в определенных организациях очень ждут.
Я сделал что-то плохое или нет?
Разумеется, нет. Когда вы делали на публичном ресурсе директорию /123, то должны были понимать насколько это опасно/безопасно относительно контента в этой директории.
Слишком много если, а правило должно быть простое если нет авторизации для доступа к ссылке то она публичная.
Всё что я нашёл у них, хоть они и с паролями, но явно предназначенные для довольно широкого круга людей, и скорее всего были опубликованы в каких-то форумах, где их нашли поисковики.
Но главное, остальные поисковики не убирают их из выдачи, так как они ни в чём не виноваты.
А браузер честно подставит впереди этого запроса что-то типа поисковик_com/q=<ваша_ссылка> и отобразится страница поисковика. Либо вообще поисковик увидит ссылку и сделает переадресацию на эту ссылке.
В сообщение ptica_filin это и имелось ввиду.
Дополнительно к вашему описанию. Приходит ссылка, но откроется оно в IE. Да, и такое бывает, даже когда по умолчанию браузер другой. Но такое часто бывает из приложений. И если я хочу открыть ссылку в моем любимом браузере, то буду копировать, а не кликать. А дальше — см. первый абзац этого комментария.
А всего-то гуглу надо было добавить настройку «Не в списке», включенную по умолчанию, чтобы она добавляла «X-Robots-Tag: noindex» документу
А такая настройка там есть, только она заголовок не добавляет…
А в документации Яндекса он не упомянут! yandex.ru/support/webmaster/controlling-robot/html.html
Вот и вся разгадка.
В паролях есть какой-то волшебный слой защиты, кроме длины и безумного содержимого?
Я не вижу чем это отличается от перехода по сложной не публичной ссылке.
Расскажите?
Подобрать URL гуглдока невозможно. С точки зрения рядового пользователя доступ по такой ссылке левых людей невозможен.
Я не вижу здесь проблемы людей использующих эту систему.***
Ну то есть пароли хранить в гугл доках мне странно. Даже сама идея как-то не очень.
Но сама вера в то, что данные защищены вполне понятна и адекватна.
***Ну кроме использования Яндекс Браузера само-собой.
Ну то есть пароли хранить в гугл доках мне странно. Даже сама идея как-то не очень.
Я скажу больше — хранить пароли в Интернете — сама идея как-то не очень.
Но сама вера в то, что данные защищены вполне понятна и адекватна.
Ну, теперь эта вера пошатнулась, кто-то огреб некислых трендюлей, может, хоть кто-то задумается.
Даже то, что ссылки часто короткоживущие, все равно распостранение приватных ссылок не сильно лучше распостранения POST запросов. При этом, если уж подходить формально к лицензионному соглашению Яндекса браузере, никто не мешал ему выложить и ваши POST запросы в паблик (например, решив, что это запросы к поисковой системе)
git вон тоже по ссылке часто используется:
https://user:password@git_repo.git
. Утечёт такое — слиты, считайте, все сорсы.Сброс пароля, регулирование подписок и т.п, да, много подобного.
robots.txt + ограничение токена по времени. Где проблема?
git вон тоже по ссылке часто используется: user:password@git_repo.git. Утечёт такое — слиты, считайте, все сорсы.
Какая необходимость вписывать пароль и пользователя в URL? Есть множество других разнообразных способов защитить git от постороннего доступа. Например, использовать SSH+keys.
Тем не менее огромное кол-во сервисов присылает ссылки на почту при сбросе пароля, по уникальной ссылке часто можно попасть в личный кабинет, сессия может идти через GET запрос, картинки в мессенджерах доступны по уникальным ссылкам и т.п.
Я же уже писал про robots.txt, вы просто игнорируете что вам пишут?
Многие сервисы (не только по протоколу http, например ftp/ssh, аудио- видеостримы и т.д.) авторизируются с помощью ссылки протокол://имя: пароль@адрес: порт
Многие также оставляют листочек с паролем на мониторе. Что мешает сначала зайти на ресурс и потом в окошке ввести логин/пароль? Если вы нарушаете цифровую гигиену, то странно ожидать другого результата.
Даже то, что ссылки часто короткоживущие, все равно распостранение приватных ссылок не сильно лучше распостранения POST запросов.
Распространение POST запросов? Что?
При этом, если уж подходить формально к лицензионному соглашению Яндекса браузере, никто не мешал ему выложить и ваши POST запросы в паблик (например, решив, что это запросы к поисковой системе)
Яндекс не работает с POST запросами, зачем ему они? Выкладывание POST-запросов в паблик? Что? Я, честно говоря, не понимаю что вы пишите.
Плюс, при установке яндекс браузера показывается окно с галочкой: «Принять участие в улучшении сервисов Яндекса: отправлять анонимную статистику использования браузера», которую можно отжать.
А пароли или любая другая sensitive-информация обычно пересылается через POST и не индексируется.Какой конкретно стандарт регламентирует такое использование GET и POST, извините? Насколько я знаю единственное чем HTTP отличает GET от POST — это то, что GET не должен вносить необратимых изменений на сайт, а POST — может это делать (причём эти требования нарушаются сплошь и рядом, в частности Хабр на них плюёт), больше никакой разницы нет…
www.w3.org/Protocols/rfc2616/rfc2616-sec15.html#sec15.1.3
А вот то, что кто-то напортачил с настройками приватности а еще кто-то — не прописал robots.txt корректно (статья яндекса на тему как — корректно — yandex.ru/support/webmaster/controlling-robot/robots-txt.html, статья гугла support.google.com/webmasters/answer/6062608?hl=ru, статья гугла как заблокировать страницу без robots.txt support.google.com/webmasters/answer/93710, тоже самое от яндекса yandex.ru/support/webmaster/controlling-robot/html.html (и тот же метатег)).
Сливание ЯндексБраузером это вообще совершенно отдельный вопрос (тем более что по соглашению с пользователем — они могут это делать).
«Сливание ЯндексБраузером это вообще совершенно отдельный вопрос (тем более что по соглашению с пользователем — они могут это делать).» — нет этого в соглашениях. там четко говорится что могут собирать статистику по использованию самого браузера. Показ моих данных в поисковике никак не входит в этот перечень.
Роскомнадзор потребовал объяснений от «Яндекса» по поводу ситуации с Google Docs