Антипиратский робот в режиме паранойи

    Правообладатели присылают в Google всё больше запросов на удаление «пиратского контента» из поисковой выдачи, в соответствии с законом DMCA. Компания Google послушно выполняет запросы, но после этого публикует информацию об удалённых URL. Таким образом, усилиями правообладателей пополняется база нелицензионного контента.

    Больше всего запросов на удаление в Google присылается от имени Microsoft — каждый день приходят тысячи адресов, где лежат пиратские версии Windows 8, Visual Studio или Office 2013. За последний год из индекса Google было удалено 4 826 032 URL с пиратскими продуктами Microsoft (в среднем, по 13186 в день).

    Недавно автоматический фильтр борцов с пиратством дал конкретный сбой. В список на удаление, присланный агентством LeakID по запросу Microsoft, попали сайты Википедии, TechCrunch, BBC, CNN, различные научные журналы и даже несколько сайтов правительства США. Якобы, на них лежит «пиратка» Windows 8.



    К счастью, в компании Google были готовы к такому развитию событий: существует «белый список» сайтов, для которых не работает процедура автоматического удаления DMCA. Так что указанные документы остались в поисковой выдаче.

    Интересно другое: каким образом антипиратский робот заподозрил в нелегальном распространении пиратской копии Windows 8 следующие ссылки?

    http://www.570news.com/business/article/386434--goldcorp-posts-45-drop-in-second-quarter-earnings-gold-prices-under-pressure
    http://minnesota.cbslocal.com/video/7546215-745-a-m-weather-update/
    http://www.washingtonpost.com/world/europe/spains-repsol-says-q2-profits-down-45-pc-as-lower-oil-prices-take-toll-on-value-of-inventory/2012/07/26/gJQAX3GjAX_story.html
    http://www.pasadenasun.com/sports/pasadenasu-howie-farer-45year-panther-coach-steps-down-20120725,0,6636990.story
    http://www.epa.gov/iris/subst/0395.htm
    http://www.upi.com/Top_News/US/2012/07/01/Waldo-Canyon-fire-45-percent-contained/UPI-54181341179119/
    http://en.wikipedia.org/wiki/Caesar's_Civil_War
    http://en.wikipedia.org/wiki/Glock
    http://techcrunch.com/2012/07/25/roku-45-million-news-corp-bskyb/
    http://eclkc.ohs.acf.hhs.gov/hslc/standards/Head%20Start%20Requirements/45%20CFR%20Chapter%20XIII
    http://forums.digitalpoint.com/forumdisplay.php?f=45
    http://www.bbc.co.uk/torchrelay/day45
    http://www.huffingtonpost.com/2012/07/25/mi-2012-president-45-romn_n_1701685.html
    http://en.wikipedia.org/wiki/45th_Fighter_Squadron

    На первый взгляд, в них нет ничего общего. Но, если присмотреться, кое-что есть: это число 45. Оно встречается и в указанных статьях из Википедии: Гражданская война в Древнем Риме закончилась в 45 г. до н.э., а пистолет «Глок» стреляет пулями калибра .45.

    Конечно, число 45 не является основанием удалять данные документы из поисковой выдачи Google. Просто доказательство глючности фильтра.

    Это ещё не самый весёлый глюк: в 15 запросах от имени Microsoft из поисковой системы Google требуют убрать ссылки на Bing.com, то есть на собственный поисковик Microsoft.

    Поиском пиратского контента по заказу Microsoft занимается несколько сторонних компаний, в том числе Marketly, DtecNet (MarkMonitor) и LeakID, на их счету 3,26 млн удалённых URL, 1,34 млн и 270 тыс., соответственно. Кстати, учредителями компании Marketly являются бывшие сотрудники Microsoft.

    via TorrentFreak
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 19

      +19
      Почему не 42? Действительно, какая-то мистика.
        0
        Я оставлю это здесь.

        image
          +12
          Простите пожалуйста, что-то не получилось…

          image
            0
            По-моему, Вы не ту ссылку тегом обработали.
            Нужно было: cdn.habrastorage.com/images/w4.jpg
          +38
          В пост врывается нейросеть Google из предыдущего поста.image
            +17
            У это новости ссылка также заканчивается на 45: http://habrahabr.ru/post/153945/
            Как бы Хабрахабр не…
              +9
              Не переглядит.

              image
              +17
              А бороться с копирастами сайты не будут?
              Не смогли доказать, что на вики была пиратская винда — извольте под суд за клевету и распространение порочащих сведений.
                +3
                Для того, чтобы их засудили за клевету и распространение порочащих сведений, нужно доказать, что они знали, что эта информация является клеветой, а не добросовестно заблуждались. То есть нужен умысел, а его нет, поскольку они «ошиблись».
                  +1
                  Скорее тут они проявили неосторожность (легкомыслие или небрежность), а не добросовестно заблуждались. Ручками не проверили список сайтов перед отправкой. Но даже если нет вины, достаточной для административного или уголовного преследования, то гражданское законодательство подразумевает и безвинную ответственность.
                    +1
                    Как там говорится? Компания Мелгомягкий занимается много лет разработкой софта и компетенция в этом вопросе у нее достаточно высокая, исходя из этого делаем вывод, что это все же злой умысел, так как такая компания так ошибаться не могла…

                    Когда-то встречал схожую формулировку, когда судили какого-то парня за торрент роздачи…
                    +11
                    Проблема в том, собственно, что этот закон, КАК И АНАЛОГИЧНЫЙ НАШ, не предусматривает ответственности правообладателей за ложные жалобы!!!
                    Клиника абсолютная и огромный простор для беспредела, когда неугодный сайт можно обвинить хоть в детской порнографии и его благополучно прикроют, а владелец потом месяца три будет в суде доказывать, что его подставили и из черного списка сайт следует убрать…
                    –1
                    Недавно автоматический фильтр борцов с пиратством дал конкретный сбой

                    Ответ кроется в соседней новости. Нейросеть Google приступила к работе
                      0
                      Какой полезный робот! А главное какой эффективный!

                      Интересно сколько MS денег на это угрохала.

                      +4
                      К счастью, в компании Google были готовы к такому развитию событий: существует «белый список» сайтов, для которых не работает процедура автоматического удаления DMCA. Так что указанные документы остались в поисковой выдаче.
                      Гениально! А если ваш сайт не настолько широко известен, чтобы заслужить попадание в «белый список, то в один прекрасный день Google совершенно перестанет находить его, и вам ужé никогда, никогда не доискаться правды, и сетевой бизнес ваш (если он строится на количестве заходов на сайт) потерпит несказáнные убытки.

                      Кстати, повод для коррупции компаний, поставляющих DMCA-запросы.
                        0
                        Вообще-то DMCA takedown может отправить любой резидент США. Google не станет рассматривать сам запрос от Microsoft как более важный или более легитимный, чем аналогичный, но отправленный Джоном Смитом. Впрочем, трубу к роботу не дадут, это верно.
                        –3
                        Поисковик — зеркало интернета. Неча на зеркало пенять....(с)
                          +2
                          Интересно, но, по-моему, не в тему.

                        Only users with full accounts can post comments. Log in, please.