Pull to refresh

И меня посчитали: компания «Яндекс» запатентовала способ определения доходов пользователей

Information Security *Social networks and communities


Компания «Яндекс» смогла разработать способ определения доходов пользователей своих сервисов. Эта же технология позволяет определить и профессию человека — именно по этому критерию высчитывается заработок. По словам экспертов, технологию можно использовать для персонализации рекламы, разработки новых сервисов и ряда других задач. Есть вероятность и того, что метод заинтересует спецслужбы.

«Яндекс» запатентовал технологию, патент получил название «Система и способ определения дохода пользователя мобильного устройства». Компания получила патент не сегодня. Заявка поступила в апреле 2017 года, а Роспатент зарегистрировал его в этом году.
Читать дальше →
Total votes 24: ↑21 and ↓3 +18
Views 17K
Comments 34

«Яндекс» запустил проект «Интернет-скоринг бюро», который оценивает платежеспособность пользователей для банков

Payment systems *Statistics in IT IT-companies


Компания «Яндекс», Объединенное кредитное бюро (ОКБ) и бюро кредитных историй «Эквифакс» запустили совместный проект по оценке кредитоспособности физических лиц, сообщает информационное агентство РБК.

Информационные системы кредитных бюро по запросу передают «Яндексу» в хэшированном (зашифрованном) виде два идентификатора клиента: адрес электронной почты и мобильный телефон. Далее для дополнительной оценки заемщика «Яндекс» использует более тысячи разноплановых факторов, в компании не раскрывают, какие именно данные о своих пользователях используют для построения своей скоринговой модели. По итогам анализа «Яндекс» для каждого запрошенного пользователя, используя обезличенную статистику, выдает своим партнерам по проекту только одно число – результат оценки. Это число добавляется к данным, которыми уже располагают бюро кредитных историй (информации о выданных займах, платежах и кредитной нагрузке) и передают в банк.

Проект «Интернет-скоринг бюро» уже используют некоторые банки в тестовом режиме для быстрой оценки потенциальных заемщиков.
Читать дальше →
Total votes 18: ↑13 and ↓5 +8
Views 11K
Comments 86

«Московский акселератор» выведет финтех-стартапы на рынок

IT systems testing *Client optimization *Wireless technologies *Start-up development Voice user interfaces *
image

Партнерами нового трека выступят крупнейшие банки и финансовые организации. Они проведут пилотирование 30 отобранных проектов на своих площадках и за счет своих финансовых средств.
Читать дальше →
Total votes 6: ↑6 and ↓0 +6
Views 1.7K
Comments 10

Яндекс закрыл проект, который оценивал заёмщиков банков

Information Security *Finance in IT IT-companies
image

Яндекс остановил скоринговый проект по оценке платежеспособности банковских заёмщиков. Он был запущен в 2019 году. В компании пояснили, что такое решение было принято еще в начале 2020 года.
Читать дальше →
Total votes 11: ↑10 and ↓1 +9
Views 3.4K
Comments 0

«Сбер» начал выдавать кредиты в новых банкоматах по всей стране после базового скоринга от 2-х минут

Information Security *Finance in IT IT-companies


1 октября 2021 года «Сбер» начал выдавать необеспеченные кредиты наличными суммой до 5 млн рублей для зарплатных клиентов (3 млн рублей для обычных) через свою сеть новых банкоматов с сенсорным экраном. Для получения кредита необходимо авторизоваться в банкомате с помощью банковской карты, проверить личные данные, ознакомиться с правилами и условиями кредитного предложения и подтвердить заявку, введя пин-код карты. «Сбер» обещает, что получить кредит можно после двухминутной проверки клиента.
Читать дальше →
Total votes 24: ↑24 and ↓0 +24
Views 17K
Comments 36

Скоринг, оценка заемщиков для системы Webmoney. Краткий обзор. Инструменты

Payment systems *
Тема заработка в Интернет довольно популярна и материалов посвященных этой теме на различных сайтах существует предостаточно. Несмотря на это, различные средства добычи прибыли во всемирной паутине вызывают у опытных пользователей здоровый и вполне оправданный скепсис.

Причин для этого множество, как и самих сайтов сулящих немалые прибыли без особых трудовых и временных затрат. Различные буксы, пирамиды, хайпы, реферальные системы, партнерские программы, системы активной рекламы, многоуровневый маркетинг и прочее позволяют заработать в большинстве случаев либо копейки, либо и вовсе потерять все вложенные в них сбережения, т.к. места, где сулят огромную выгоду – там существует огромный риск потери средств. Не удивительно, что искушенный пользователь ищет оптимальные способы заработка в сети с позиции “риск потери – прибыль” или же предлагает какие-то свои интересные другим людям услуги, по сути, занимаясь удаленной работой или бизнесом.

В этой статье не рассматриваются идеальные варианты, такие как, наличие у вас посещаемого сайта и заработка с рекламы на нем (пассивный доход), также не будем затрагивать Форекс – это тема для отдельных статей, коих и так достаточно. Поговорим о сервисах кредитования Webmoney и скоринга для них.
Читать дальше →
Total votes 14: ↑5 and ↓9 -4
Views 8.5K
Comments 0

Как я играл в банк

C# *
Привет, Хабр!
Лето, все в отпуске. У всех расходы. Где взять денег? У банка!
Только за этот июль крупнейший банк России выдал кредитов физическим лицам на 73 545 493 тыс. руб. Ипотечные займы Северо-Западного отделения составляет 53% от общего портфеля, потребительские кредиты — 32%, согласно пресс-релизу . Средний размер ипотечного займа за март 2014 составил порядка 1.5 млн рублей. Средний размер автокредита составляет
не менее 0.5 млн рублей. Спасибо lany за предоставленные ссылки.
Исходя из вышеприведенных цифр, можно предположить, что банк умудрился за месяц выдать кредит около двумстам тысячам человек.
Конечно, в этом банке используют скоринговые системы.
Я узнал про скоринговые системы пару лет назад и был потрясен. Сама идея, что бездушная машина может принимать решение о выдаче кредита на основе статистических данных, не выходила из головы. Я захотел поиграть в банк и проверить, выдаст ли компьютер кредиты моим друзьям, just for fun. Настоящие скоринговые системы я никогда не видел, но решил, что это и неважно, напишу сам.
Сказано — сделано.

Исходники на репе в гитхабе.

Осторожно, много изображений!
Читать дальше →
Total votes 99: ↑80 and ↓19 +61
Views 55K
Comments 106

Устойчивая красота неприличных моделей

Data Mining *Algorithms *Big Data *Mathematics *Machine learning *
Титаника на КДПВ нет, он утонул
— Не могли бы вы построить нам статистическую модель?
— С удовольствием. Можно посмотреть на ваши исторические данные?
— Данных у нас ещё нет. Но модель всё равно нужна.

Знакомый диалог, не правда ли? Далее возможны два варианта развития событий:

A. «Тогда приходите, когда появятся данные.» Вариант рассматриваться не будет как тривиальный.
Б. «Расскажите, какие факторы по вашему мнению наиболее важны.» Остаток статьи про это.

Под катом рассказ о том, что такое improper model, почему их красота устойчива и чего это стоит. Всё на примере многострадального набора данных о выживании пассажиров Титаника.
Читать дальше →
Total votes 23: ↑22 and ↓1 +21
Views 16K
Comments 11

Скоринг клиентов: что это и зачем это нужно?

Internet marketing *Branding
Recovery mode
Скоринг (scoring) в переводе на русский язык означает «набирание очков».

image

Чаще всего это понятие ассоциируется с банковской сферой, с помощью этой технологии оцениваются потенциальные заемщики, и принимается решение о выдаче кредита. С развитием маркетинга это понятие перешло на вооружение к маркетологам.

image

В веб-маркетинге существует такое понятие как Lead scoring-(Лид-скоринг). Это метод дробления потенциальных клиентов, путем присваивания им определенных баллов, в соответствии с заранее определенными критериями, которые показывают насколько клиент готов к заключению сделки. Для наглядности мы расскажем, как происходит скоринг в нашей компании.
Читать дальше →
Total votes 10: ↑7 and ↓3 +4
Views 16K
Comments 3

Краткий курс машинного обучения или как создать нейронную сеть для решения скоринг задачи

Python *Programming *Algorithms *Machine learning *Artificial Intelligence
Tutorial
image

Мы часто слышим такие словесные конструкции, как «машинное обучение», «нейронные сети». Эти выражения уже плотно вошли в общественное сознание и чаще всего ассоциируются с распознаванием образов и речи, с генерацией человекоподобного текста. На самом деле алгоритмы машинного обучения могут решать множество различных типов задач, в том числе помогать малому бизнесу, интернет-изданию, да чему угодно. В этой статье я расскажу как создать нейросеть, которая способна решить реальную бизнес-задачу по созданию скоринговой модели. Мы рассмотрим все этапы: от подготовки данных до создания модели и оценки ее качества.

Если тебе интересно машинное обучение, то приглашаю в «Мишин Лернинг» — мой субъективный телеграм-канал об искусстве глубокого обучения, нейронных сетях и новостях из мира искусственного интеллекта.

Вопросы, которые разобраны в статье:

• Как собрать и подготовить данные для построения модели?
• Что такое нейронная сеть и как она устроена?
• Как написать свою нейронную сеть с нуля?
• Как правильно обучить нейронную сеть на имеющихся данных?
• Как интерпретировать модель и ее результаты?
• Как корректно оценить качество модели?
Поехали!
Total votes 51: ↑42 and ↓9 +33
Views 172K
Comments 43

Использование нейронной сети для построения модели оценки заёмщиков в сфере онлайн-микрофинансирования

Finance in IT
Sandbox
В настоящее время для построения скоринговой модели стандартом “де факто” в финансовой отрасли является использование функций логистической регрессии (logit-функций). Суть метода сводится к нахождению такой линейной комбинации начальных данных (предикторов), которая в результате logit-преобразования будет максимально правдоподобно осуществлять предсказания.

Практический недостаток метода — в необходимости длительной подготовки данных для построения модели (около недели работы специалиста). В реальных условиях работы микрофинансовой компании набор данных о заемщиках постоянно меняется, подключаются и отключаются различные дата-провайдеры, сменяются поколения займов — этап подготовки становится узким местом.

Другой недостаток logit-функций связан с их линейностью — влияние каждого отдельного предиктора на конечный результат равномерно на всем множестве значений предиктора.
Модели на базе нейронных сетей лишены этих недостатков, но редко применяются в отрасли — нет надежных методов оценки переобучения, большое влияние “шумящих” значений в исходных данных.

Ниже мы покажем, как с помощью применения различных методов оптимизации модели на базе нейронных сетей позволяют получить лучший результат предсказаний по сравнению с моделями на базе logit-функций.

Читать дальше →
Total votes 15: ↑11 and ↓4 +7
Views 8.4K
Comments 7

Коэффициент Джини. Из экономики в машинное обучение

Open Data Science corporate blog Python *Data Mining *Mathematics *Machine learning *
Интересный факт: в 1912 году итальянский статистик и демограф Коррадо Джини написал знаменитый труд «Вариативность и изменчивость признака», и в этом же году «Титаник» затонул в водах Атлантики. Казалось бы, что общего между этими двумя событиями? Всё просто, их последствия нашли широкое применение в области машинного обучения. И если датасет «Титаник» в представлении не нуждается, то об одной замечательной статистике, впервые опубликованной в труде итальянского учёного, мы поговорим поподробней. Сразу хочу заметить, что статья не имеет никакого отношения к коэффициенту Джини (Gini Impurity), который используется в деревьях решений как критерий качества разбиения в задачах классификации. Эти коэффициенты никак не связаны друг с другом и общего между ними примерно столько же, сколько общего между трактором в Брянской области и газонокосилкой в Оклахоме.

Коэффициент Джини (Gini coefficient) — метрика качества, которая часто используется при оценке предсказательных моделей в задачах бинарной классификации в условиях сильной несбалансированности классов целевой переменной. Именно она широко применяется в задачах банковского кредитования, страхования и целевом маркетинге. Для полного понимания этой метрики нам для начала необходимо окунуться в экономику и разобраться, для чего она используется там.
Читать дальше →
Total votes 67: ↑66 and ↓1 +65
Views 88K
Comments 17

Как разработать систему, которая распознает человека по клавиатурному почерку

ID Finance corporate blog Search engines *Big Data *Data storage *Finance in IT
Мы занимаемся потребительским кредитованием в режиме онлайн. Вопрос предотвращения мошенничества для нас – один из основных. Часто потенциальные мошенники думают, что системы безопасности финтех-компаний ниже, чем в традиционных финансовых организациях. Но это миф. Все ровно наоборот.

image

Для того, чтобы свести к нулю уровень потенциального мошенничества мы разработали систему поведенческой биометрии, которая способна определить человека по клавиатурному почерку. Пилотная версия была внедрена в России в августе 2017 года.
Читать дальше →
Total votes 21: ↑15 and ↓6 +9
Views 7.6K
Comments 17

Как устроен скоринг в индустрии каршеринга. Часть 1. Обзор популярных инструментов на реальных данных

Bright Box corporate blog Programming *Algorithms *Development for IOT *IOT
Каршеринг, несмотря на свою молодость, — одно из самых активно развивающихся направлений в автобизнесе России. С момента запуска первой компании прошло 5 лет, и сегодня на рынке работают более 25 операторов, специализирующихся на краткосрочной аренде. С развитием каршеринга накапливаются данные о пользователях, и вот уже у каршеринга, как у банков, появляется некая система скоринга клиентов. Она также опирается на возраст, пол, стаж вождения, однако здесь рассматривается не история ваших кредитов, а история поездок. Одной из целей такого скоринга, помимо платежеспособности, валидации водительского удостоверения, штрафов, является предсказание вероятности ДТП для конкретного водителя.



В этой статье мы разберем логику работы алгоритмов скоринга пользователей каршеринга, которые будут опираться только на возраст и стиль вождения. Помимо этих параметров, и для получения более точных результатов, могут быть использованы — социальный статус, поездки с детьми, активность в социальных сетях и информация с камеры в салоне автомобиля. Однако, сегодня остановимся на двух базовых — возраст и стиль вождения.

Отметим, что в статье мы продемонстрируем логику работы скоринга на примере водительской активности 50 000 пользователей и 260 000 поездок. Все данные были анонимизированны. Кроме того, мы использовали данные по 220 ДТП, совершенных с Москве и МО.
Читать дальше →
Total votes 23: ↑16 and ↓7 +9
Views 8.2K
Comments 34

Как устроен скоринг в индустрии каршеринга. Часть 2. Определить агрессивного водителя за 5 секунд

Bright Box corporate blog Programming *Algorithms *Development for IOT *IOT
В прошлой статье мы рассмотрели алгоритм скоринга, основанный на резких ускорениях и торможениях. Результаты скоринга по такому алгоритму слабо коррелируют с вероятностью ДТП. В этой статье мы обратимся к более продвинутым алгоритмам анализа стиля вождения, основанным на значениях скорости, оборотов двигателя и показателях акселерометра.


Читать дальше →
Total votes 31: ↑28 and ↓3 +25
Views 14K
Comments 82

Машинное обучение в микрофинансах: строим скоринговую модель для клиентов с пустой кредитной историей

Data Mining *Big Data *Open data *Machine learning *Finance in IT
Recovery mode

Нет кредитной истории — не дают кредиты, не дают кредиты — нет кредитной истории. Замкнутый круг какой-то. Что делать? Давайте разбираться.


Привет! Меня зовут Марк, я data scientist в компании Devim. Недавно мы запустили модель для скоринга заемщиков МФК “До Зарплаты”, у которых отсутствует кредитная история. Хочу поделиться опытом поиска данных, особенностями конструирования и интерпретации признаков.


Читать дальше →
Total votes 34: ↑23 and ↓11 +12
Views 13K
Comments 59

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk

Data Mining *Algorithms *Machine learning *Popular science Artificial Intelligence
Рассмотрим, как работают алгоритмы в банковском скоринге, какие метрики используются и какие параметры заемщика влияют на то, выдадут кредит или нет. В статье описывается прошедший конкурс с kaggle по предсказанию вероятности дефолта и приводятся влияющие на риск дефолта параметры.

Ошибка первого и второго рода


Цель банка – заработать деньги. Первый риск, с которым сталкивается кредитная организация — дать кредит заемщику, который допустит дефолт. Дефолт может иметь разные причины, от финансовых трудностей заемщика, и заканчивая фродом.

Для банка это — ошибка первого рода.

Но если банк будет вести жесткую политику, и никому не выдает кредиты, даже тем, кто вернул бы деньги, то банк не заработает на процентах. Отказ в кредите ответственному заемщику – ошибка второго рода.

Для оценки качества принимаемых алгоритмом решений, используется коэффициент Джини (GINI). В экономике и в Data Science коэффициент Gini имеет разную интерпретацию. Для кредитного скоринга он рассчитывается, как

GINI = 2 ROC AUC — 1

Для оценки банковского скоринга используется стандартная ROC AUC кривая!



Читать дальше →
Total votes 23: ↑17 and ↓6 +11
Views 15K
Comments 22

Мониторинг работы кредитного скоринга в Power BI

Data visualization *Machine learning *Project management *Product Management *Finance in IT
В условиях когда большая часть заявок на кредит рассматривается автоматически, мониторинг становится особенно важным. Всё ли работает в штатном режиме, как меняются ключевые показатели, какие изменения нужно внести, чтобы добиться нужного результата?

В статье я расскажу, как мы мониторим кредитный конвейер с помощью Power BI, какие отчеты и метрики используем для оценки качества выдач.

Ключевые показатели внутри дня



Читать дальше →
Total votes 16: ↑16 and ↓0 +16
Views 7.6K
Comments 4

Каким бывает фрод в маркетплейсе, как его вычислять и предотвращать. Доклад Яндекса

Яндекс corporate blog Information Security *Payment systems *Sales management *
Прежде чем строить антифрод, надо понять, каким на сервисе бывает фрод — какие методы злоумышленники выбирают, чтобы получить выгоду и навредить пользователям. Алексей Савостин поделился опытом Яндекс.Маркета в исследовании способов фрода, рассказал о целях (порой изощрённых), которые преследуют фродеры, и о данных, по которым можно определять подозрительную активность.

— Всем привет, меня зовут Алексей Савостин. Я занимаюсь направлением антифрода в Яндекс.Маркете и сегодня расскажу, как мы строили антифрод для маркетплейса «Беру», который с октября стал частью Маркета.
Читать дальше →
Total votes 21: ↑17 and ↓4 +13
Views 8.5K
Comments 11

CRM: разделяй и продавай! Поднимаем продажи, фокусируясь на перспективных клиентах. Просто о скоринге и грейдинге

CRM systems *Sales management *Personnel Management *

Сравните два диалога:

Диалог 1

Руководитель: “С кем ты целый день занимаешься?” 

Менеджер: “ООО “Ромашка”, класс B”.

Диалог окончен. За несколько секунд руководитель понял, что клиент достаточно важный, им можно заниматься “целый день”,  и всё же не такой крупный, чтобы руководитель лично тратил на него время. 

Диалог 2

Руководитель:

—  С кем ты целый день занимаешься? 

Менеджер:

— ООО “Ромашка”. Мы им выслали коммерческое предложение, сейчас они хотят изменить часть заказанных наименований.

— Крупный клиент?

— Похоже на то, пока точно неясно. Но отказались от дорогих товаров и ещё хотят скидку.

— Давно общаешься с ним?

— Сейчас гляну в карточке. Может, месяц или два.

В том же духе диалог продолжается ещё 15 минут. Руководитель чувствует, что плохо контролирует ситуацию — он потратил много времени и сил, чтобы понять степень важности всего лишь одного клиента. Как управлять компанией, если таких клиентов тысяча?

Читать далее
Total votes 13: ↑10 and ↓3 +7
Views 4.4K
Comments 2
1