Pull to refresh
5
0
Дмитрий @detimokhin

Senior Data Scientist команды «Моделирование ЖЦК»

Send message

Метаверс ВТБ: как мы развиваем собственную платформу коммуникаций будущего

Level of difficultyEasy
Reading time13 min
Views886

Привет, Хабр! Меня зовут Константин Прошин, я руководитель направления «Метаверс», Венчурной студии. Хочу рассказать о метаверсе ВТБ, который мы с командой совсем недавно представили рынку.

По порядку: о том, что это такое (в теории и на практике), зачем мы вписались в эту авантюру, из чего и как сделан наш метаверс: от движка до конструктора аватаров, какие фичи «отвечают» за особую душевность и о многом другом — читайте в моей статье.

Читать
Total votes 6: ↑5 and ↓1+4
Comments2

Почему айтишники часто не справляются с ролью скрам-мастера? И как ментор может с этим помочь?

Reading time6 min
Views3.8K

Одно дело — внедрить гибкие практики в стартапе на пару команд разработки, совсем другое — в один из крупнейших банков. У нас в ВТБ более двух тысяч команд разработки. Это значит, что нам нужно две тысячи скрам-мастеров — новые практики сами себя до разработчиков не донесут. Какое-то время назад мы организовали школу для скрам-мастеров и столкнулись с тем, что больше половины выпускников не закрепляются в новой роли. Бороться с этим мы решили с помощью наставников для скрам-мастеров — и это вылилось в создание программы менторинга. Она совсем новая, но нам уже очень нравится то, что мы видим. 

Меня зовут Эдуард, я коуч команд в ВТБ. В этой статье расскажу, как мы в течение нескольких лет организовали эту программу и что она нам дала сегодня, с какими неожиданностями столкнулись, как их преодолевали и что собираемся делать дальше. Прошу под кат.

Читать далее
Total votes 15: ↑9 and ↓6+13
Comments15

Применение нейросетевых подходов для формирования признаков в моделях

Level of difficultyMedium
Reading time9 min
Views2.4K

Наша команда Графовой аналитики стрима Моделирование КИБ и СМБ занимается различными исследовательскими задачами для двух основных направлений: риск- и бизнес-моделирования.

В данной статье мы расскажем о том, как продвинутые подходы машинного обучения, в частности нейронные сети, помогают генерировать признаки для моделей, сокращая трудозатраты на проработку гипотез и операционные издержки при подготовке данных для моделей.

Интересно? Поехали...
Total votes 10: ↑10 and ↓0+10
Comments0

Как мы сделали настоящий хакатон. Такой, каким он должен быть

Level of difficultyEasy
Reading time5 min
Views1.5K

Привет! Меня зовут Игорь Бессчастный, я лидер Платформы API ВТБ. Мы представили рынку Платформу два с половиной года назад в рамках большой цифровой трансформации банка. Продумывая хакатон, мы хотели и привлечь внимание к интерфейсам прикладного программирования, и найти решения, учитывающие всю нужную нам специфику.

Два года назад мы запустили первый хакатон. Через год — второй. Третий — стартует 1 октября. В этой статье я и моя коллега — Камилла Куликова, архитектор платформы API ВТБ, расскажем, как мы на сей раз наконец-то сделали всё именно так, как нужно, почему мы не боимся давать очень сложные задачи, как у нас профессиональных хакатонистов иногда обходят те, от кого этого совсем не ожидали, и что получает от этого всего наш банк и рынок в целом.

Читать далее
Total votes 10: ↑10 and ↓0+10
Comments0

Надежность ВТБ: как мы добились «четырёх девяток» доступности банковских систем

Level of difficultyMedium
Reading time7 min
Views4.9K

Привет! Меня зовут Иван Мартинович, я заместитель руководителя департамента поддержки прикладных систем и сервисов — вице-президент в ВТБ. В теперь уже далёком 2019 году мы запустили одну из ключевых программ цифровой трансформации банка, нацеленную на обеспечение надёжности целевых систем. О том, как мы проводили её в разгар пандемии коронавируса и что из этого всего вышло, мне бы и хотелось сегодня рассказать. Добро пожаловать под кат.

Читать далее
Total votes 17: ↑12 and ↓5+12
Comments20

«Вопросов было море»: как создавался Банк в VK

Level of difficultyEasy
Reading time6 min
Views3.3K

Всем привет! На связи команда ВТБ «Мессенджеры и чат-боты». Сегодня расскажем о том, как работали над одним из крупнейших и самых необычных проектов за последнее время. В конце 2022 года стало понятно, что цифровые сервисы ВТБ должны масштабироваться и переходить на новые площадки из-за недоступности мобильного приложения в сторах. Требовалось такое решение, чтобы каждый клиент мог пользоваться услугами банка онлайн; особенно актуально это было для владельцев iOS-устройств. Одним из очевидных решений стал выход онлайн-банка в социальные сети и мессенджеры — привычные для большинства людей мобильные приложения.

Так мы начали интеграцию ВТБ Онлайн в Телеграм и российскую социальную сеть «ВКонтакте». И при этом столкнулись с несколькими вопросами. Как использовать интерфейс мессенджеров для доступа к сверхчувствительной информации? Как сделать авторизацию максимально удобной и безопасной? Каким образом создать понятное и удобное меню? Делимся инсайтами в статье.

Читать далее
Total votes 13: ↑9 and ↓4+5
Comments11

Фреймворк vtb_scorekit для разработки интерпретируемых скоринговых моделей

Level of difficultyMedium
Reading time14 min
Views2.5K

Всем привет! Меня зовут Сакович Руслан, я занимаюсь корпоративным риск-моделированием, и сегодня расскажу о построении скоринговых моделей. Эти модели позволяют оценивать кредитные риски и являются крайне важными в деятельности банка. К ним предъявляются высокие требования в плане точности, стабильности и интерпретируемости результатов, поэтому мы в основном не можем использовать методы «черные ящики» (как например бустинги или нейросети), и обычно вынуждены пользоваться логистической регрессией. Сам по себе метод логистической регрессии довольно простой с точки зрения математики, однако для построения хорошей модели он требует тщательной предварительной обработки и энкодинга исходных данных, а также последующего довольно трудоемкого отбора переменных в модель. Причем стандартные библиотеки вообще не предоставляют возможности построения хоть какой-нибудь адекватной модели прямо из коробки. Мы решили стандартизировать весь процесс разработки скоринговых моделей, собрали используемые нами алгоритмы и объединили в библиотеку vtb_scorekit.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments0

Data Fusion Contest. Издание 2-ое, переработанное и дополненное

Level of difficultyMedium
Reading time13 min
Views1.2K

Соревнование Data Fusion Contest 2023 в этом году состоялось во второй раз и собрало  сильнейшие индустриальные команды и отдельных любителей моделей алгоритмов машинного обучения. Кто-то участвовал впервые, а кто-то, уже умудрённый прошлым опытом был явно настроен только на победу.

В этот раз мы решили принципиально изменить задание и придумали новый формат. Что произойдет, если столкнуть лицом к лицу участников, мотивированных атаковать модели машинного обучения, с другими участниками, мотивированными свои модели защищать? Кто победит, каким окажется тот стек моделей и подходов, который приведет к победе? Что важнее, знания и опыт, или гибкость ума или нестандартные подходы?

Мы задали себе все эти вопросы и решили найти ответы на практике, подготовив для участников Data Fusion Contest 2023 очень нестандартное и по теме и по формату соревнование по Adversarial ML с атаками на модели машинного обучения, а также с их защитой.

Давайте разбираться, что из этого получилось по факту, и какие решения предложили участники, чтобы оказаться в рядах победителей!

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments0

Autobinary: библиотека для простого обучения «деревяшек» – часть третья

Level of difficultyMedium
Reading time4 min
Views1.1K

Привет! Я Василий Сизов, тим-лид команды «Модели управления Жизненным Циклом Клиента», и мы продолжаем нашу серию материалов о библиотеке autobinary.

Ранее мы рассказали вам о кросс-валидации в autobinary, которую можно использовать не только для расчета усредненной оценки модели или расчета усредненных важностей фичей, но и для подбора параметров модели, отбора фичей в модель и т.д.

В этой статье мы расскажем вам о том, как можно использовать библиотеку autobinary для подбора параметров с помощью Optuna, а также о том, как можно интерпретировать вклад фичей с помощью Shap и PDPbox. 

Читать далее
Total votes 5: ↑5 and ↓0+5
Comments7

Autobinary: библиотека для простого обучения «деревяшек» — Part 2

Level of difficultyMedium
Reading time7 min
Views1.3K

С ростом количества источников данных, методов генерации и извлечения признаков возникает вопрос: «А надо ли нам столько информации? Не ухудшит ли каждый новый фактор предсказательную силу модели?» И правда, для решения большинства задач нет необходимости использовать все доступные нам признаки в финальной модели, так как часть из них не несет в себе никакой информации и даже может запутать алгоритм. Для того, чтобы решить эту проблему и сократить признаковое пространство, были придуманы методы отбора факторов в задачах машинного обучения. О некоторых методах, которые мы внедрили в библиотеку Autobinary расскажем в этой статье.

Поехали
Total votes 6: ↑6 and ↓0+6
Comments0

Autobinary: библиотека для простого обучения «деревяшек» — Part 1

Level of difficultyMedium
Reading time4 min
Views1.7K

Рождение autobinary, как и многих других фреймворков, началось с автоматизации рутинных задач. На тот момент мы создавали много look-alike моделей (в основе - модель бинарной классификации) по разным продуктам банка. Одни и те же скрипты писать было скучно. Более того – накопилось много разрозненных скриптов, которые хотелось привести к единому формату.

Что из этого получилось
Total votes 4: ↑4 and ↓0+4
Comments0

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity

Specialization

Data Scientist
Senior
Git
Python
SQL
Pytorch
Computer Science
Machine learning
Deep Learning
Natural language processing
Neural networks
Big data