Pull to refresh

Антипиратский робот в режиме паранойи

Reading time2 min
Views30K
Правообладатели присылают в Google всё больше запросов на удаление «пиратского контента» из поисковой выдачи, в соответствии с законом DMCA. Компания Google послушно выполняет запросы, но после этого публикует информацию об удалённых URL. Таким образом, усилиями правообладателей пополняется база нелицензионного контента.

Больше всего запросов на удаление в Google присылается от имени Microsoft — каждый день приходят тысячи адресов, где лежат пиратские версии Windows 8, Visual Studio или Office 2013. За последний год из индекса Google было удалено 4 826 032 URL с пиратскими продуктами Microsoft (в среднем, по 13186 в день).

Недавно автоматический фильтр борцов с пиратством дал конкретный сбой. В список на удаление, присланный агентством LeakID по запросу Microsoft, попали сайты Википедии, TechCrunch, BBC, CNN, различные научные журналы и даже несколько сайтов правительства США. Якобы, на них лежит «пиратка» Windows 8.



К счастью, в компании Google были готовы к такому развитию событий: существует «белый список» сайтов, для которых не работает процедура автоматического удаления DMCA. Так что указанные документы остались в поисковой выдаче.

Интересно другое: каким образом антипиратский робот заподозрил в нелегальном распространении пиратской копии Windows 8 следующие ссылки?

http://www.570news.com/business/article/386434--goldcorp-posts-45-drop-in-second-quarter-earnings-gold-prices-under-pressure
http://minnesota.cbslocal.com/video/7546215-745-a-m-weather-update/
http://www.washingtonpost.com/world/europe/spains-repsol-says-q2-profits-down-45-pc-as-lower-oil-prices-take-toll-on-value-of-inventory/2012/07/26/gJQAX3GjAX_story.html
http://www.pasadenasun.com/sports/pasadenasu-howie-farer-45year-panther-coach-steps-down-20120725,0,6636990.story
http://www.epa.gov/iris/subst/0395.htm
http://www.upi.com/Top_News/US/2012/07/01/Waldo-Canyon-fire-45-percent-contained/UPI-54181341179119/
http://en.wikipedia.org/wiki/Caesar's_Civil_War
http://en.wikipedia.org/wiki/Glock
http://techcrunch.com/2012/07/25/roku-45-million-news-corp-bskyb/
http://eclkc.ohs.acf.hhs.gov/hslc/standards/Head%20Start%20Requirements/45%20CFR%20Chapter%20XIII
http://forums.digitalpoint.com/forumdisplay.php?f=45
http://www.bbc.co.uk/torchrelay/day45
http://www.huffingtonpost.com/2012/07/25/mi-2012-president-45-romn_n_1701685.html
http://en.wikipedia.org/wiki/45th_Fighter_Squadron

На первый взгляд, в них нет ничего общего. Но, если присмотреться, кое-что есть: это число 45. Оно встречается и в указанных статьях из Википедии: Гражданская война в Древнем Риме закончилась в 45 г. до н.э., а пистолет «Глок» стреляет пулями калибра .45.

Конечно, число 45 не является основанием удалять данные документы из поисковой выдачи Google. Просто доказательство глючности фильтра.

Это ещё не самый весёлый глюк: в 15 запросах от имени Microsoft из поисковой системы Google требуют убрать ссылки на Bing.com, то есть на собственный поисковик Microsoft.

Поиском пиратского контента по заказу Microsoft занимается несколько сторонних компаний, в том числе Marketly, DtecNet (MarkMonitor) и LeakID, на их счету 3,26 млн удалённых URL, 1,34 млн и 270 тыс., соответственно. Кстати, учредителями компании Marketly являются бывшие сотрудники Microsoft.

via TorrentFreak
Tags:
Hubs:
+47
Comments19

Articles

Change theme settings