Раз уж Вы отсылаете читателей к той статье из NYT, то у меня и вопрос про ту же тему: Какой объем статистики по девайсу нужен, чтобы идентифицировать уникального пользователя с надежностью 95%? Понятно, что на больших группах все работает; вопрос: как оно работает на малых группах и насколько малы эти группы?
Более частные вопросы:
1) Насколько уникальный профиль создает история перемещений девайса? Типа, вот этот парень ездит всегда из Коньково в Лужники, по пятницам вьет на Савеловской, а по субботам в Железнодорожный на весь день. Сколько таких парней найдется в одной многоэтажке — 1, 10, 50?
2) Можно ли понять, что вот тот же самый парень (малая группа), которую идентифицировали в вопросе #1, теперь ездит в аэропорт Шереметьево раз в неделю и покидает горд на два дня? Вряд ли таких пользователей в одной многоэтажке будет много, что дает возможность говорить о слежении за девайсом (но не об идентификации пользователя, пока).
3) Можно ли понять по совпадающим трэкам, что владелец данного девайса на iOS является также владельцем вот того девайса на Android? В смысле, пользователь носит два телефона на работу.
Давайте для простоты допустим, что: девайс есть смартфон совершеннолетнего жителя дефолт-сити, который работает 5/2 также в Москве, история доступна за год от одного провайдера.
“ И к чему все эти "gini roc uac", когда всё решается на уровне "этому дам, а этому не дам"? :)”
Ну вот откуда у Вас такая информация о всех банках страны? Я Вас уверяю, Топ 10 ритейловых банков в РФ выдают решение больше вообще без участи человека для 50+% кредитных заявок. А для POS кредитов — до 80% автоматическое решение бывает.
А что, идея для компании-лохотрона позволять корректно выводить малые суммы кажется Вам запредельной хитростью? За столько лет нетрудно накопить статистику, чтобы вычислить оптимальный порог честной игры…
Простите, а вот для Москвы: как так может быть, чтобы максимальные значения по языкам не совпадали с максимальными значениями по специальностям? Вот какая специальность у тех разработчиков Golang, которые получают 200К?
Вы что, по разным выборкам максимум считали?
Этот Explainable AI — это просто движок для брутфорса прогнозной модели по все области определения и отчетник сверху. Оно не «обьясняет», а скорее «показывает тенденции».
Чёт долго они, этой идее уже пару лет…
Есть у меня такая штука. Главный секрет: из-за этой «противоворовской кромки» внутренний объем рюкзака ГОРАЗДО меньше, чем на первый взгляд. Т.е. вот есть у меня два одинаковых по внешнему объему рюкзака, один такой и один обычный, — и в обычный влезает ровно в два раза больше!
Мне все-таки интересно, если бы авторы статьи не были ограниченны возможностями своего солвера, то насколько бы более эффективно решалась задача? Согласно моему опыту, в ограничения MIP упираешься очень быстро и дальше только нелинейные ограничения спасают, но их должен поддерживать движок…
Да, поскольку вода как то (я забыл конкретно, как, но как то сильно) мешает жить этому вирусу, он вызывает водобоязнь у носителя. Там слишком простой сигнал (вода = опасность), поэтому дифференциация не проводятся :)
На самом деле это и правда один из самых ярких примеров, которые приводят поборники зомби-апокалипсиса на вирусной основе: этот вирус реально меняет поведение человека, параметры его ЦНС! То есть это таки возможно...
А вот эта связь из примера в статье, когда не то было засеяно на поле и урожайность упала катастрофически — ее тоже удалось выразить в линейных терминах?
Plaig.Inc — это не биологический симулятор, а довольно смешная и интересная игра типа стратегического уровня в UFO. Я одно время любил в самолете на ней играть, но потом понял, что народ нездорово косится :)
Например, там есть уровень, когда «зомбифицирущие» бактерии ставят задачу осчастливить все человечество: люди превращаются в зомби, но их мозг заливается гормонами счастья, которые генерятся в зараженном организме. Таким образом, зомби по определению заведомо счастливее человеков :)
В общем, ссылаться на эту игру в такой серьезной и тревожной статье, наверное, не стоит.
Более частные вопросы:
1) Насколько уникальный профиль создает история перемещений девайса? Типа, вот этот парень ездит всегда из Коньково в Лужники, по пятницам вьет на Савеловской, а по субботам в Железнодорожный на весь день. Сколько таких парней найдется в одной многоэтажке — 1, 10, 50?
2) Можно ли понять, что вот тот же самый парень (малая группа), которую идентифицировали в вопросе #1, теперь ездит в аэропорт Шереметьево раз в неделю и покидает горд на два дня? Вряд ли таких пользователей в одной многоэтажке будет много, что дает возможность говорить о слежении за девайсом (но не об идентификации пользователя, пока).
3) Можно ли понять по совпадающим трэкам, что владелец данного девайса на iOS является также владельцем вот того девайса на Android? В смысле, пользователь носит два телефона на работу.
Давайте для простоты допустим, что: девайс есть смартфон совершеннолетнего жителя дефолт-сити, который работает 5/2 также в Москве, история доступна за год от одного провайдера.
Спасибо!
“ И к чему все эти "gini roc uac", когда всё решается на уровне "этому дам, а этому не дам"? :)”
Ну вот откуда у Вас такая информация о всех банках страны? Я Вас уверяю, Топ 10 ритейловых банков в РФ выдают решение больше вообще без участи человека для 50+% кредитных заявок. А для POS кредитов — до 80% автоматическое решение бывает.
Милосердие.ру? Нет, не слышал...
Верно. А залезть к Вам в телефон, чтобы поискать там фотки с машинами на газонах — это таки да, «запустить нос в чужие дела»
Вы что, по разным выборкам максимум считали?
Чёт долго они, этой идее уже пару лет…
Ну, пока новость в том, что данная технология вызывает эпилептический припадок в 20% случаев :)
Фокус в том, что чем больше ограничений, тем быстрее получаем результат.Да, но только пока они линейные или целочисленные :)
А какой движок используете вместо САСа?
1) Это в смысле, жесткие (ограничения области определения) и мягкие (штрафы)?
2) Вот это не совсем понял, как именно? Веса штрафов различаются? Но это балансировать надо очень долго…
3) Тоже не очень понял. Движок SAS вроде бы не умеет нарушать запрет на область определения и игнорировать границы?
Да, поскольку вода как то (я забыл конкретно, как, но как то сильно) мешает жить этому вирусу, он вызывает водобоязнь у носителя. Там слишком простой сигнал (вода = опасность), поэтому дифференциация не проводятся :)
На самом деле это и правда один из самых ярких примеров, которые приводят поборники зомби-апокалипсиса на вирусной основе: этот вирус реально меняет поведение человека, параметры его ЦНС! То есть это таки возможно...
А вот эта связь из примера в статье, когда не то было засеяно на поле и урожайность упала катастрофически — ее тоже удалось выразить в линейных терминах?
Спасибо за статью.
Скажите, какая была размерность модели и какой солвер Вы использовали?
Почти наверняка не линейного программирования. Иначе получится, что надо выделить 3,68 трактора на поле #1 :)
Например, там есть уровень, когда «зомбифицирущие» бактерии ставят задачу осчастливить все человечество: люди превращаются в зомби, но их мозг заливается гормонами счастья, которые генерятся в зараженном организме. Таким образом, зомби по определению заведомо счастливее человеков :)
В общем, ссылаться на эту игру в такой серьезной и тревожной статье, наверное, не стоит.