«Яндекс» опять проиндексировал документы Google Docs


    Одна из таблиц, которая попала в выдачу. Вероятно, «Яндекс» проиндексировал документ какого-то рекрутингового агентства

    Поисковая система «Яндекс» снова проиндексировала документы пользователей Google Docs, не защищённые паролем. Если вы открыли доступ для документа всем, у кого есть ссылка, и отправили эту ссылку одному человеку, то имейте в виду — эта ссылка может стать известна «Яндексу», а тот сделает ваш «приватный» документ доступным для поиска.

    Для поиска открылись и текстовые документы, и электронные таблицы. Большинство из них не выглядят какими-то секретными. Возможно, большинство из них действительно открыты для общего доступа. Примеры поисковых запросов: документы с паролями, откаты, зарплата.

    «Яндекс» не видит в произошедшем ничего необычного: «На документы, о которых идет речь, стоят ссылки в интернете. Сами документы не запрещены для индексации, — сказали в пресс-службе. — Нет признаков, что наши системы тегируют Документы Google как доступные в Сети некорректно. Поисковые системы должны индексировать только те документы, которые были намеренно опубликованы и маркированы как доступные всем в интернете».

    Аналогичный случай произошёл в начале июля, когда на проблему обратили внимание администраторы паблика MDK. Тогда читатели начали оперативно редактировать чужие документы.



    Тогда многие пользователи обратились с жалобами в техподдержку «Яндекса», а поисковик на некоторое время закрывал доступ к поиску по документам Google, пишет РБК.

    Специалисты по безопасности Group IB рекомендуют в такой ситуации всем пользователям сервисов Google Docs и Google Drive защищать паролем документы, которые они выкладывают в облачные хранилища.

    Similar posts

    Ads
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More

    Comments 38

    • UFO just landed and posted this here
        +1
        Полагаю, проиндексировались ссылки на те документы, которые люди нашли при первом сливе и разместили на форумах, имиджбордах и пр.
        Ну и теперь, естественно, ссылки на них есть, все законно :) Только первоначально как они в индекс попали, никто ответа до сих пор не дал.
          +7
          Есть много подозрений в сторону Ябраузера
            0
            Имел ввиду официальных комментариев нет. И да, я тоже полагаю, что со стороны яндекс браузера слив произошел.
          +10
            0
            Тоже понравился. А скока читателей там сейчас — ууу :)

            Несколько минут назад было больше.
            • UFO just landed and posted this here
                +1
                Почитайте про этот самый ОАО «Ярославский завод «Красный Маяк». Там история достойная того, чтоб по ней фильм снимать.
                0
                Этот документ в сети уже лет 10 гуляет.
                +8
                А ничего, что во всех этих документах стоит «Public on Web» вместо «Anyone with the link» (дефолтное значение)? Т.е. владельцы файлов сами активировали индексацию этих документов. Причем здесь Гугл и Яндекс вообще?

                Вот как выглядит форма с дефолтными значениями, если что:
                image

                PS:
                Правда, есть предположение, что эти документы были созданы до введения этого разделения в Google Docs, а потом просто каким-то образом получили другое дефолтное значение, но у меня нет этому подтверждений. Мои старые документы так и лежат в «Anyone with the link».
                  0
                  Правда, есть предположение, что эти документы были созданы до введения этого разделения в Google Docs

                  А как давно это разделение введено? Нашел у себя в гуглодоках документ от 2014 года (скорее всего до появления Public on the web) пошаренный с anyone with the link и он не стал Public on the web, при этом есть полная уверенность что документ не трогали т.к. создан он чисто для примера, я его просто удалить забыл
                    0
                    Вот я не помню, когда это ввели, но у них был даже анонс про это. Очень давно. Лет пять назад как минимум. Самое старое, что я у себя нашел расшаренного, так это документ 2012-го года. В нем тоже стоит «Anyone with the link», т.ч. скорее всего эта гипотеза не верна, и люди сами это активировали по незнанию/умышленно.

                  +6
                  Если глупые люди сами выкладывают конфиденциальную информацию, причём тут поисковики?
                    –2
                    «Глупых людей» никто не предупреждает, что ссылка, которую они отправили другу и которая больше нигде не светилась, вдруг всплывёт в поисковике.

                    Проблема в том, что в прошлом инциденте (не знаю насчёт этого) в поиск вывалились ссылки вовсе не первого типа (см. скриншот).
                      +1
                      Здравомыслящий человек должен понимать, что такая ссылка — не защита. Можно ошибиться, набирая адрес ссылки, и попасть на чужой документ. Можно написать скрипт, перебирающий брутфорсом ссылки в заданном диапазоне. Да даже скрипт не нужен, я делал такое с помощью Download Master: настраивается маска по адресу, типам файлов и пр. и запускается скачивание. Но вот если по ссылке попадётся запароленный 7z-архив с нормальным паролем, тут уж ничего не утечёт.
                        0
                        И всё же, справедливости ради, id 1GeOQWyQt30VXeSAzgx0Z2SINJvxmmz9ffM1kzJXes9U Вам придётся подбирать очень, очень долго…
                          0
                          Не придётся очень, очень долго подбирать, а матожидание времени подбора полным перебором очень большое. Но первое же испытание может оказаться успешным.
                          0
                          «Случайно попасть»?
                          Знаете, почему UUID гарантирует уникальность идентификаторов?
                            +1
                            Не гарантирует, а даёт высокую вероятность уникальности при небольшом количестве случайных значений. На больших количествах уже нужно учитывать возможность совпадений. Например при количестве UUID v4 ключей порядка 10^18 вероятно встретить два одинаковых значения уже близка к бросанию монеты. И это при наличии идеального генератора случайных чисел.
                              0

                              Соглашусь. При использовании нодовского пакета uuid и генерации миллиона записей в одном цикле, натыкался на дубли частенько.

                          +1
                          А как отправили? Даже если по телефону диктовали, есть вероятность что товарищ майор её слышал.
                          +1
                          Может, это глупые программисты сделали интерфейсы, которые вводят людей в заблуждение? А другие глупые программисты решили сливать в поисковик ссылки из браузера или почты.
                            0
                            В таких компаниях программисты интерфейсы пользовательские не делают.
                            +4

                            Проблема в том, что ябраузер все ваши ссылки сливает на сервер, а они потом чудесным образом в поисковую выдачу попадают. Или это не проблема?

                            • UFO just landed and posted this here
                              • UFO just landed and posted this here
                                  0
                                  «Прогоняет через свой анализатор» — совсем не то же самое что «индексирует».
                                  • UFO just landed and posted this here
                                +1
                                проблема в том, что слитые ссылки доступны кому ни попадя. Вы бы ещё shodan обвинили в обнаружении адресов уязвимым ip камер к примеру.
                                  0

                                  Нет, они доступны должны быть только человеку с ссылкой.

                                  +2
                                  Если эти ссылки не закрыты даже банальным robots.txt, то это если и проблема, то точно не браузера. Ну, блин, есть же стандарты, соглашения и вот это вот все. И если ты не хочешь, чтоб ссылки индексировались, ну сделай хоть что-нибудь, кроме медитации
                                    –3

                                    Если бы ссылки не были закрыты через роботс тогда бы и яху и бинг и дакдак тоже б их индексировали. Неужели надо еще разжевать поподробнее? Человек с яндекс браузера либо используя яндекс почту передает ссылку другому человеку(не скидывая ее на форумы) и эта ссылка предназначена только для этого человека. И вот она магическим образом оказывается в поисковой выдаче. Все еще проблема не видна?

                                      +5
                                      О какой проблеме речь, если в «утекших» документах в настройках явно указано, что их нужно индексировать? У вас есть примеры документов, которые есть в выдаче и у которых стоит «Anyone with the link», а не «Public on web»? Я пока таких не видел.
                                        +5
                                        Что значит «если бы»? А своими глазами глянуть вера не позволяет?
                                        Вот: https://docs.google.com/robots.txt

                                        Там не то что не закрыто, а явно разрешено индексировать документы по прямым ссылкам. Это раз.

                                        Два: а с чего решили, что бинг не индексирует такие документы?
                                          0
                                          Если бы ссылки не были закрыты через роботс

                                          Если бы вы не занимались досужими вымыслами, а проверили, то обнаружили бы, что нет, НЕ закрыты.


                                          Все еще проблема не видна?

                                          Конечно, видна, только не там, где вы ищите. Какие-то дебилы с дырой в голове полностью пренебрегают элементарными правилами безопасности, но виноваты кто угодно, кроме них. Это как положить бумажник на столик в уличном кафе и уйти в туалет, а вернувшись, обвинить потника, изготовившего стол в том, что бумажник магическим образом утёк благодаря столику.


                                          Человек с яндекс браузера либо используя яндекс почту передает ссылку другому человеку(не скидывая ее на форумы) и эта ссылка предназначена только для этого человека. И вот она магическим образом оказывается в поисковой выдаче.

                                          А вот это заявление в приличных местах следует доказывать. Один из банков, тоже с дыркой в голове, рассылает ежемесячные отчёты по счетам такими ссылками (а мне они на яндекс-почту как раз валятся). За других не скажу, но мои отчёты в поисковые выдачи не попадали почему-то. Почему? Может потому, что не рассылаю их кому-попало посредством асек, вконтактегов и фейсбучеков и, прости господи, одноглазников?

                                    0
                                    А когда выйдет серия «Гугл проиндексировал Яндекс%name наносит ответный удар»?
                                      +1
                                      До чего доводят облака… Локальных утечек было бы сильно-сильно меньше.
                                        +1
                                        существование паблик-анонимус фтп там, где доступ должен быть закрыт, опровергает ваше утверждение.

                                      Only users with full accounts can post comments. Log in, please.