Comments 21
Ну то есть возмущение перепродажей внутренних данных ФБ, с социальным графом, накопленными данными по интересам и т.п. — понятно. Но web-scraping по открытым страницам — это действительно неизбежность. И это понимание действительно надо вбивать в головы.
С каких пор web scraping = утечка?
Если с того что где то закон приняли очередной то почему для Google и Яндекса исключение? Иди для яндекса нет потом что русские хакеры? -:)
А для Yacy?
Хотя вообще то если бот следует robots.txt — и это не что-то популярное — не будет он фейсбук скрейпить, у Facebook там disallow по умолчанию и исключения для кого надо, а заодно очень короткая ToS для авторов ботов. Но тогда вопрос — почему автор бота обязан учитывать robots.txt?
Ну и вроде в США есть решение суда что запрет LinkedIn'а его парсить — незаконный потому что монополизм и все такое. почему это не применимо тут?
Как могло утечь письмо из внутренней рассылки? Там его емейл дописали в адресаты? To: facebook-all, some-other-guy@gnal.com? Или же ему кто-то его переслал? Тогда это не было ошибкой…
Ну, если Фейсбук утверждает что утечки это нормально и ничего такого особенного — то утечка письма вполне в рамках этой же политики Фейсбука. Если же утечка внутреннего письма с точки зрения FB это что-то неправильное...
Журналист… получил…
по ошибке
Не… Журналисты по ошибке таких писем не получают.
Даже не знаю, как такое комментировать…
Надо всё же отличать открытые данные и закрытые. Чтобы была понятна разница между скрепингом и утечками.
Если ваши ОТКРЫТЫЕ, видимые всем, данные спарсили и связали друг с другом — то это нормально. Если вашу учётку сломали или увели БД и оттуда достали данные, которые иначе достать нельзя — то ЭТО называть нормой нельзя.
Но есть ещё и грани, что считать открытым. Например, в ФБ или ВК есть уровни доступа "видно всем" "не видно поисковикам", "видно зарегистрированным", "только для друзей", "только для..." "Только мне". Так вот, считать ли "видно всем зарегистрированым" публичными данными или нет?
Внутреннее письмо Facebook показало: в компании решили внушить публике, что утечки данных — это нормально