Pull to refresh
81
0
Dmitry Petukhov @codezombie

ML Preacher, Cloud Architect && Coffee Addicted

Send message
Спасибо за совет про саппорт. В контексте статьи и моего комментария (где не говорил, какой конкретно алгоритм будет использоваться) — ему цены нет.
Я тут не бизнес-план описываю, а набор подходов и методик для создания эффективного (в плане стоимости разработки и владения) антифрод-сервиса. Не путайте, пожалуйста.
Статистики по каким признакам было запрещено или отношение разрешенных/запрещенных? По первому — нет, по второму — да (лог транзакций будет храниться в NoSQL-хранилище).
мерчанты даже в таком случае особо не разбегаются отдавать наружу такие данные
Все дело в мотивации — сначала надо узнать, во сколько конкретному мерчанту обходиться фрод.
У облачной платформы есть SLA (у различныхсерсисов различный, но ниже 99.95% он не опускается). Вореры работают в кластере, для сетевых подключений используется retry-policy. Поэтому, будьте уверены, при правильном выборе архитектуры — это крайне отказаоустойчивое решение.
Возможность узнать причину отклонения зависит от выбранного алгоритма: для дерева решений — возможно, для нейросети — нет.
«Вернуть клиенту результат предсказания является ли платеж мошенническим;» обычно не так однозначно 1/0. и не одним критерием…
Вы выдаете желаемое за действительное: где написано, что на основе одного критерия вернется является ли транзакция мошеннической или нет?
Зависит от выбранного алгоритма машинного обучения — Two Class или Multiclass. Я реализовал Two Class — возвращает число в диапозоне от 0 до 1, где единица — фрод.
Нет, не обязательно находиться внутри PCI DSS периметра. Более того, надо максимально стараться этого избежать.
Но, как не парадоксально, именно для этого уже на уровне требований и архитектуры системы необходимо думать о PCI DSS. Во второй части юридическим аспектам будет уделено больше внимания.
Эксперт и data scientist — это именно роли. Возможен вариант, что обе роли выполняет один человек. Если все же люди разные, то взаимодействие приблизительно такое: эксперт говорит 'где-то тут должен быть бозон Хигса', data scientist ищет аномалии, применяет методы статистики и ML и находит!
Это, конечно, упрощенно. Взаимодействие внутри команды, как Вы понимаете, это большая тема.

У antifraud как web-сервис будет наиболее интересен мерчантам, менее интересен агрегаторам, общий подход и практики будут интересны и банкам.
Автор просто упустил или не знал того что антифрод системы
А Вы откуда знаете, что он не знает?
А судя по картинке автор хочет рассказать про 2-5 % операций
Как Вам картинка об этом рассказала?
Тема сисек не то что не раскрыта, а даже не пробовали поднять одеяло.
Опять — зачем выдавать желаемое за действительное? В первых строчках же написано, что статья раскрывает, почему тема фрода стоит так остро. Раскрыть тему мошеннических банковских платежей в рамках одной статьи — это утопия.
как банк может выпустить карту без идентификации клиента?
Где вы это в статье прочли?

У банка есть информация о держателе карты, у мерчанта — о заказчике услуги. Никто не гарантирует, что это одни и те же люди.
Ничего страшного)
… чтобы «остудить» потенциальных клиентов.
Что за извращенные фантазии?) Каких «клиентов»? Статья для исследователей!
Смысл писать об этом в русскоязычном сегменте если оно доступно только для США и Западной Европы?
Создать сервис Stream Analytics можно пользователю из любой страны (в России с этим точно ограничений нет). Регионы в Azure (их 13) и регионы на уроке географии (таких нет) — разные вещи.
Я бы уже с удовольствием почитал статью *Как успевать за всеми изменениями в Azure?*.
Если серьезно: добавляются действительно интересные фичи. Отдельно радует растущая исследовательская активность в Azure.
Ниракамендую, короч.
Ну не надо быть таким категоричным. Проблема с картами, эмитированными некоторыми банками, это еще не вся Azure!
Внимание Microsoft к собственной облачной платформе очень радует.

Особый (скорее исследовательский, чем прикладной) интерес вызвал проект Orleans — облачный (со всеми вытекающими — масштабируемость, распределенность) фреймворк, базирующийся на модели акторов (презентация с Build 2014, source code на codeplex).
Из всех описанных в цикле статей систем доступны (на память) сторонним разработчикам только Dremel и Colossus через PaaS-сервисы Google BigQuery и Google Cloud Storage, соответственно.
Всех интересуют подробности…

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity

Specialization

Data Scientist, ML Engineer
Senior
People management
Development management