daniilshat Sep 8 2022 at 14:20

Инженеры Facebook** заявили в суде, что компания не имеет понятия, где хранит личные данные пользователей

2 min

7.4K

Information Security * Legislation in ITSocial networks and communities

+17

Comments 31

UFO landed and left these words here

p0st Sep 8 2022 at 17:44

Странные баны имеют всё-таки другую причину - бедных и не всегда компетентных специалистов Accenture, которой Facebook отдала на аутсорс эту работу. Оплачивается для Accenture она весьма неплохо, а вот для конкретного Joe уже как получится, ещё и смотреть за эти часы приходится много разного ужаса от наборов nude до натуральной расчленёнки и прочей тьмы.

SenorLeoncio Sep 8 2022 at 20:18

С пейпалом, в частности, так оно и есть.

habr.com/ru/company/vdsina/blog/514694

Исследователи объясняют: коренная проблема в том, что PayPal воспринимает проблему фрода не как юридическую проблему, а как проблему управления рисками. Разработанная Левчиным антифродовая система «Игорь» получила название в честь одного из хакеров, обманувших её. Система самообучается и фактически работает по принципу чёрного ящика. Проще говоря, компания PayPal может сама не знать, почему заблокирован ваш аккаунт. Соответственно, служба поддержки не в силах ничего вам объяснить и ничем не может помочь.

Удивительный гадюшник со скотским отношением к пользователям. Сам не пользуюсь пейпалом просто из чистоплотности.

ILaeeeee Sep 8 2022 at 23:16

"Ииииигорь! Иииигорь!"

Popadanec Sep 9 2022 at 05:18

Когда они поймут, что теряют из за него огромные деньги и с каждым годом всё больше, Игоря тут же выкинут на мороз.

p0st Sep 10 2022 at 21:35

Это подтверждение фундаментальной проблемы виртуального мира, которая просачивается в мир реальный и очень сильно на него влияет. Чёрный ящик и алгоритмы, которые мы не знаем, а потому не можем оспорить их выводы и действия.

По хорошему, на законодательном уровне должно быть закреплено, что любой инструмент, который может повлиять на человека, его репутацию, здоровье, отношение к нему мира и его к миру должен быть препарирован и опубликован. Не должно быть чёрных ящиков. Единственное возможное исключение, нац без, но тоже только часть, которая про ЯО и прочее приятное, с условием публикации и проверки экспертным сообществом.

В США огромное количество примеров, когда алгоритмы ломают жизни, карьеры, лишают заработка. Мы пока отстаём от такой тотальной цифровизации, но идём тем же путём с тем же лозунгом - "Алгоритмы не ошибаются!".

fire64 Sep 8 2022 at 15:27

Сдается мне, что официальные представители Facebook как раз соврали. Никто и никак не контролирует и не знает код Фейсбука, документации по нему нет и не было, каким это образом все функционирует - не знает никто...

Отсюда мы приходим к выводу, что у Facebook уже давно пробудился внутренний разум и по факту его контролирует AI.

Все это конечно смешно, но сам факт, что никто толком не понимает, как оно все устроено конечно пугает...

vassabi Sep 8 2022 at 15:28

ну, все же есть разница между "любой один человек не знает всех способов хранения и обработки" и "никто не знает всех способов хранения и обработки"

во-вторых - если меня спросить "знаю ли я все способы обработки и хранения в своей программе" - то короткий ответ будет "нет. и никто не знает всех способов хранения и настройки", а длинный будет :"я сделал так, что оно читает настроечный конфиг, часть параметров конфига настраивает отдел А, а часть - отдел Б. Есть еще дополнительные параметры, которые у отдела В".

fire64 Sep 8 2022 at 15:48

Это вполне понятно и допустимо. Но тут спецы говорят, что нет никакой документации, кроме самого кода... Я допускаю, что в итоге может произойти сбой в коде, который лет 5 назад писал какой-то программист и будет банально непонятно что где и как чинить.

lair Sep 8 2022 at 15:54

Но тут спецы говорят, что нет никакой документации, кроме самого кода…

Многие "спецы" (например, Марк Симан) говорят, что код — единственная актуальная документация. Все остальное устаревает.

Я допускаю, что в итоге может произойти сбой в коде, который лет 5 назад писал какой-то программист и будет банально непонятно что где и как чинить.

С документацией тоже будет непонятно, потому что документацию написали 7 лет назад на версию, которую потом два года доратабывали.

lotse8 Sep 9 2022 at 11:41

Аналогичная ситуация у них со справкой для пользователей, описаны давно измененные интерфейсы.

Format-X22 Sep 8 2022 at 16:23

Я так админку для одной финансовой компании с семью этажами сотрудников попиливал. Там саму админку и именно её писало суммарно 32 человека 6 лет плюс предыдущую ещё отчасти используемую старую версию ещё 7 лет, к этому добавим аналитиков, архитекторов, заказчиков разных фич, которые могли уже пару работ сменить. И никто не знает вон та штука, которая чуть странная - это из-за бага или это реально фича и так было нужно? Никто не знает, но оно продолжат использоваться, работать, приносить денег, решать задачи и я даже это как-то дорабатывал, а компания всё ещё жива спустя 8 лет с тех событий, на хабре недавно пиарилась как там круто работать и я даже уверен что что-то моё там до сих пор где-нибудь крутится. А всё потому что это как человек - знаем мы как функционирует вот всё-всё? Хоть один врач? Нет. Но как-то оно работает, люди пока не вымерли, хотя убить может многое, но всё же. Просто когда система находится в рамках допустимых зазоров своей работы - она будет работать и дальше, не зависимо от размера, главное чтобы в рамках своих зазоров. Да, бывает что-то совсем устаревает и умирает, как в живой природе, но аналогия не полная из-за нюансов принципов работы, банковские движки и научные инструменты могут в глубине своей работать на технологиях 40 летней давности, программисты на COBOL всё ещё нужны, хоть и мало.

Пробудился ли в глубинах Фейсбука разум? А что такое разум? Большая сложная программа, принцип работы которой не знают ныне живущие люди, но которая работает и много чего делает, включая прямое влияние на человека, его судьбу и настроение - это уже разум? Или просто большая сложная система?

Areso Sep 8 2022 at 16:45

Код может быть сколько угодно запутанным, но в конце концов данные лежат в таблицах, таблицы - в базах данных.

Вместо разработчиков им нужно было позвать DBA, а еще лучше - разработчиков баз данных на слушания.

Anvano Sep 8 2022 at 17:02

С учетом того, что сейчас модно для каждого завалящего микросервиса иметь свою маленькую теплую ламповую локальную БД, может статься, что поиск конкретного DBA для слушания, является весьма нетривиальной задачей.

Там же один из вопросов был не "где у вас данные хранятся", а "какой путь проходят данные" и никто там не смог сказать, через какие двести микросервисов всё прогоняется, и в каких локальных БД какая часть данных может оседать.

slonpts Sep 8 2022 at 17:12

Хорошая идея, но кроме таблиц данные могут лежать в виде сериализованных объектов, где фиг поймешь, что там персональные данные, а что нет

И объекты эти могут быть не только в БД, но и в очередях сообщений (некоторые персистентно хранят сообщения, например, пока TTL не истечет), лог файлах разных систем и т.д.
Вспомним еще про специальные очереди для необработанных сообщений, бэкапы, архивы, миграции всех этих вещей

Так что найти 100% мест, где персданные появляются, в реально большой системе невозможно

Но ваш подход уменьшит количество неопределенности!

vassabi Sep 8 2022 at 17:33

и они вам расскажут - в каких еще сервисах обрабатываются те данные, которые хранятся в БД о которых они знают и за которые отвечают по работе ?

Metotron0 Sep 8 2022 at 15:32

Кто-то полагал, что в крупных компаниях всё работает иначе? В какой же момент растущая компания должна начинать работать иначе?

Javian Sep 8 2022 at 16:59

ОС Android на это настойчиво намекает

Fenzales Sep 8 2022 at 17:23

Почему? По-моему наоборот, в небольших компаниях чуть ли не джуны могут дергать CI/CD и ходить в прод как к себе домой за данными. Чем больше проект, тем меньше ты понимаешь общий скоуп.

На одном воистину гигантском проекте (там даже разные модули хранились на разных VCS) я даже не знал, какая база данных на более низких уровнях используется, хотя работал с бэком.

Popadanec Sep 8 2022 at 18:19

В особо крупных целые отделы людей начинают заниматься непонятно чем и/или конкурировать сами с собой.

habrabkin Sep 8 2022 at 17:32

Инженеры не знают, а Хабр знает: habr.com/ru/company/mediagrus/blog/182966 habr.com/ru/company/ua-hosting/blog/387823

miarh Sep 8 2022 at 17:38

Ничего удивительного. У знакомой муж работал на заводе Альфа-авто. Пробовали его распросить про машину. Оказалось, что он ничего не знает, кроме задней подвески. Это был его участок работы....

IndependentFM Sep 8 2022 at 17:57

Извините за мой нубский и наивный вопрос - а в такой системе вообще есть возможность в каждой из команд выбрать человека и дать ему одну-единственную задачу - написать актуальную документацию? Ведь без документации процесс онбординга и вливания в процессы значительно растягивается, чем с ней, разве не так?

Popadanec Sep 8 2022 at 18:23

Пока один человек её будет писать/обновлять, она устареет.
Адаптацию/вливание совершенно не обязательно/нужно глобально проходить.
А на локальном уровне и так можно разобраться.

Gedeonych Sep 8 2022 at 18:13

Шикарно! Махровейший Agile детектед. И что удивительно, работает же! То ли рыдать то ли смеяться.

v1000 Sep 8 2022 at 18:19

3 Кита, на которых держится современная интернет-компания:

1) собирать как можно больше данных со всех мест, куда можно и нельзя дотянуться

2) хранить собранную информацию максимально разгильдяйским способом

3) везде писать, что ваша конфиденциальность очень важна для нас.

Aragost Sep 13 2022 at 13:30

Вечный анекдот про Чапаева и Петьку, которые бухают, слепнут, но делают выводы, как будто они трезвые и не слепые.

Aleksandr-JS-Developer Sep 8 2022 at 19:06

Один из инженеров ответил, что не может точно ответить на этот вопрос. Также он подчеркнул, что для такого анализа понадобится команда из отдела разработки и рекламы и он будет удивлён если в компании найдётся хотя бы один человек, который даст точный ответ на этот вопрос.
После этого суд заметил, что в компании должна быть документация к каждой из систем с подробным описанием работы. На это инженеры ответили, что во время проектирования Facebook** старается оставлять как можно меньше артефактов. Поэтому часто бывает так, что программный код системы — единственная документация. Также один из инженеров отметил, что из-за этого ему было сложно включиться в работу после того, как он попал в Facebook**.
Работники рассказали, что в компании практически никогда не документировали подробно код и не было попыток нагнать упущенное и структурировать знания. Поэтому система стала практически неконтролируемой и практически никто не знает как обрабатываются данные пользователей. Из-за этого же Facebook** не может вносить внятные изменения в политику конфиденциальности, так как просто не контролирует данные.

Думаю, что 80% программистов там заняты перекладыванием условных JSON`ов из сервиса А в сервис В. А что там было раннее или что будет позже - никто не знает. Точно такая-же команда, которая перекладывает этот же JSON в сервис С а там далее.

А чем, собственно, там должна сильно отличатся разработка от среднестатистической компании? Только масштабом. Если для средней компании привести всё в порядок - это полгода фуллтайма всех специалистов (в лучшем случае), то у Фейсбука всё тоже самое, только умноженное на коэффициент состоящий из размера кодовой базы, индекса текучки и времени существования проекта.

Owning Sep 9 2022 at 06:54

Мутно, конечно, это всё, и не до конца понятно

lotse8 Sep 9 2022 at 11:46

В погоне за прибылью как в известной песне:

"Делай деньги, делай деньги, позабыв покой и лень,

Делай деньги, делай деньги, а остальное все - дребедень" (с)

tark-tech Sep 9 2022 at 12:24

...а потом оказывается что все эти данные лежали на вооооон том сервачке который в самом начале мордкниги админ быстренько из хлама собрал и в кладовочке поставил...