Как стать автором
Обновить
71.85
Сначала показывать

Маленький data-science для большого бизнеса, или В анализ данных со школьной скамьи

Время на прочтение8 мин
Количество просмотров3.4K

Привет, Хабр! В одной из предыдущих статей команда ВТБ обещала подробнее рассказать, как на конкурсе «Большие вызовы» в образовательном центре «Сириус» команда школьников занималась разработкой сервиса геоаналитики для бизнеса. Итак, время пришло, давайте же скорее начинать!

Меня зовут Максим Воля, мне 17 лет, и я один из тех самых школьников, который принял участие в этом конкурсе в составе школьной команды разработки. В статье расскажу, как мы готовились к проекту и создавали его, с какими данными работали, какой стек технологий применяли, с какими сложностями столкнулись и что получилось в итоге. На проекте я был Product-менеджером, также в команду входили Илья Демидов, который занимался машинным обучением, Даниил Ануфриев — компьютерное зрение, Дмитрий Рынин — аналитика, Владислав Секин — фуллстек-разработка. Сейчас подробно все расскажу. Добро пожаловать под кат!

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии0

Твори, исследуй, побеждай: как устроиться в банк после школы и совмещать работу с учёбой в универе

Время на прочтение7 мин
Количество просмотров1K

Привет, я Даниил Ушаков, главный специалист Департамента анализа данных и моделирования — одного из самых технологичных отделов ВТБ. Так получилось, что я самый молодой Data-Science-специалист в банке: на этой должности я с 18-летнего возраста (сейчас мне 19). Меня взяли бы и в 17, но трудовое законодательство не позволило. Зато я успел окончить школу и поступить в универ. Как оказалось, получение высшего образования прекрасно сочетается с работой в одном из самых технологичных банков страны.

Как строить карьеру в IT с юных лет, можно ли успевать полноценно учиться и работать одновременно — об этом я расскажу под катом.

Читать далее
Всего голосов 10: ↑7 и ↓3+4
Комментарии1

«Большие вызовы» в «Сириусе», или как мы обычно проводим лето

Время на прочтение6 мин
Количество просмотров1.8K

Привет, Хабр! Третий год подряд летом мы в ВТБ снаряжаем команду IT-специалистов менторить школьников, которые пробуют себя в роли разработчиков на конкурсе «Большие вызовы» в образовательном центре «Сириус». В этом году на «Больших вызовах» побывали наши дата-сайентисты — они помогали команде подростков сделать сервис геоаналитики.

В этой статье мы расскажем, как устроено менторство в «Сириусе» и чем это полезно взрослым компаниям. Так, однажды мы нашли на конкурсе талантливого разработчика себе в команду. Но обо всём по порядку. Добро пожаловать под кат.

Читать далее
Всего голосов 8: ↑7 и ↓1+6
Комментарии1

Почему айтишники часто не справляются с ролью скрам-мастера? И как ментор может с этим помочь?

Время на прочтение6 мин
Количество просмотров3.7K

Одно дело — внедрить гибкие практики в стартапе на пару команд разработки, совсем другое — в один из крупнейших банков. У нас в ВТБ более двух тысяч команд разработки. Это значит, что нам нужно две тысячи скрам-мастеров — новые практики сами себя до разработчиков не донесут. Какое-то время назад мы организовали школу для скрам-мастеров и столкнулись с тем, что больше половины выпускников не закрепляются в новой роли. Бороться с этим мы решили с помощью наставников для скрам-мастеров — и это вылилось в создание программы менторинга. Она совсем новая, но нам уже очень нравится то, что мы видим. 

Меня зовут Эдуард, я коуч команд в ВТБ. В этой статье расскажу, как мы в течение нескольких лет организовали эту программу и что она нам дала сегодня, с какими неожиданностями столкнулись, как их преодолевали и что собираемся делать дальше. Прошу под кат.

Читать далее
Всего голосов 25: ↑19 и ↓6+13
Комментарии15

Как мы меняли чат-бот ВТБ для мессенджера ВКонтакте до прода и после

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.3K

Привет, Хабр. Меня зовут Мурат Атила, я фронтенд-разработчик в ВТБ. Недавно мы рассказывали на Хабре о запуске банка в мессенджере «ВКонтакте». В комментариях вы спрашивали про изнанку решения — и коллеги призвали меня ответить и рассказать побольше о том, как мы создавали банк в VK и Telegram.

В этой статье я расскажу, как мы делали сервис: от чего отталкивались в разработке, почему не портировали в соцсети существующий интернет-банкинг, с какими ограничениями платформ столкнулись, как их решили и что собираемся менять в ближайшее время.

Читать далее
Всего голосов 10: ↑9 и ↓1+8
Комментарии6

Применение нейросетевых подходов для формирования признаков в моделях

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.2K

Наша команда Графовой аналитики стрима Моделирование КИБ и СМБ занимается различными исследовательскими задачами для двух основных направлений: риск- и бизнес-моделирования.

В данной статье мы расскажем о том, как продвинутые подходы машинного обучения, в частности нейронные сети, помогают генерировать признаки для моделей, сокращая трудозатраты на проработку гипотез и операционные издержки при подготовке данных для моделей.

Интересно? Поехали...
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Как мы сделали настоящий хакатон. Такой, каким он должен быть

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.3K

Привет! Меня зовут Игорь Бессчастный, я лидер Платформы API ВТБ. Мы представили рынку Платформу два с половиной года назад в рамках большой цифровой трансформации банка. Продумывая хакатон, мы хотели и привлечь внимание к интерфейсам прикладного программирования, и найти решения, учитывающие всю нужную нам специфику.

Два года назад мы запустили первый хакатон. Через год — второй. Третий — стартует 1 октября. В этой статье я и моя коллега — Камилла Куликова, архитектор платформы API ВТБ, расскажем, как мы на сей раз наконец-то сделали всё именно так, как нужно, почему мы не боимся давать очень сложные задачи, как у нас профессиональных хакатонистов иногда обходят те, от кого этого совсем не ожидали, и что получает от этого всего наш банк и рынок в целом.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Надежность ВТБ: как мы добились «четырёх девяток» доступности банковских систем

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров4.6K

Привет! Меня зовут Иван Мартинович, я заместитель руководителя департамента поддержки прикладных систем и сервисов — вице-президент в ВТБ. В теперь уже далёком 2019 году мы запустили одну из ключевых программ цифровой трансформации банка, нацеленную на обеспечение надёжности целевых систем. О том, как мы проводили её в разгар пандемии коронавируса и что из этого всего вышло, мне бы и хотелось сегодня рассказать. Добро пожаловать под кат.

Читать далее
Всего голосов 22: ↑17 и ↓5+12
Комментарии20

«Вопросов было море»: как создавался Банк в VK

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K

Всем привет! На связи команда ВТБ «Мессенджеры и чат-боты». Сегодня расскажем о том, как работали над одним из крупнейших и самых необычных проектов за последнее время. В конце 2022 года стало понятно, что цифровые сервисы ВТБ должны масштабироваться и переходить на новые площадки из-за недоступности мобильного приложения в сторах. Требовалось такое решение, чтобы каждый клиент мог пользоваться услугами банка онлайн; особенно актуально это было для владельцев iOS-устройств. Одним из очевидных решений стал выход онлайн-банка в социальные сети и мессенджеры — привычные для большинства людей мобильные приложения.

Так мы начали интеграцию ВТБ Онлайн в Телеграм и российскую социальную сеть «ВКонтакте». И при этом столкнулись с несколькими вопросами. Как использовать интерфейс мессенджеров для доступа к сверхчувствительной информации? Как сделать авторизацию максимально удобной и безопасной? Каким образом создать понятное и удобное меню? Делимся инсайтами в статье.

Читать далее
Всего голосов 13: ↑9 и ↓4+5
Комментарии11

Фреймворк vtb_scorekit для разработки интерпретируемых скоринговых моделей

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров2.3K

Всем привет! Меня зовут Сакович Руслан, я занимаюсь корпоративным риск-моделированием, и сегодня расскажу о построении скоринговых моделей. Эти модели позволяют оценивать кредитные риски и являются крайне важными в деятельности банка. К ним предъявляются высокие требования в плане точности, стабильности и интерпретируемости результатов, поэтому мы в основном не можем использовать методы «черные ящики» (как например бустинги или нейросети), и обычно вынуждены пользоваться логистической регрессией. Сам по себе метод логистической регрессии довольно простой с точки зрения математики, однако для построения хорошей модели он требует тщательной предварительной обработки и энкодинга исходных данных, а также последующего довольно трудоемкого отбора переменных в модель. Причем стандартные библиотеки вообще не предоставляют возможности построения хоть какой-нибудь адекватной модели прямо из коробки. Мы решили стандартизировать весь процесс разработки скоринговых моделей, собрали используемые нами алгоритмы и объединили в библиотеку vtb_scorekit.

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии0

Data Fusion Contest. Издание 2-ое, переработанное и дополненное

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.1K

Соревнование Data Fusion Contest 2023 в этом году состоялось во второй раз и собрало  сильнейшие индустриальные команды и отдельных любителей моделей алгоритмов машинного обучения. Кто-то участвовал впервые, а кто-то, уже умудрённый прошлым опытом был явно настроен только на победу.

В этот раз мы решили принципиально изменить задание и придумали новый формат. Что произойдет, если столкнуть лицом к лицу участников, мотивированных атаковать модели машинного обучения, с другими участниками, мотивированными свои модели защищать? Кто победит, каким окажется тот стек моделей и подходов, который приведет к победе? Что важнее, знания и опыт, или гибкость ума или нестандартные подходы?

Мы задали себе все эти вопросы и решили найти ответы на практике, подготовив для участников Data Fusion Contest 2023 очень нестандартное и по теме и по формату соревнование по Adversarial ML с атаками на модели машинного обучения, а также с их защитой.

Давайте разбираться, что из этого получилось по факту, и какие решения предложили участники, чтобы оказаться в рядах победителей!

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Autobinary: библиотека для простого обучения «деревяшек» – часть третья

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.1K

Привет! Я Василий Сизов, тим-лид команды «Модели управления Жизненным Циклом Клиента», и мы продолжаем нашу серию материалов о библиотеке autobinary.

Ранее мы рассказали вам о кросс-валидации в autobinary, которую можно использовать не только для расчета усредненной оценки модели или расчета усредненных важностей фичей, но и для подбора параметров модели, отбора фичей в модель и т.д.

В этой статье мы расскажем вам о том, как можно использовать библиотеку autobinary для подбора параметров с помощью Optuna, а также о том, как можно интерпретировать вклад фичей с помощью Shap и PDPbox. 

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии7

Autobinary: библиотека для простого обучения «деревяшек» — Part 2

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.2K

С ростом количества источников данных, методов генерации и извлечения признаков возникает вопрос: «А надо ли нам столько информации? Не ухудшит ли каждый новый фактор предсказательную силу модели?» И правда, для решения большинства задач нет необходимости использовать все доступные нам признаки в финальной модели, так как часть из них не несет в себе никакой информации и даже может запутать алгоритм. Для того, чтобы решить эту проблему и сократить признаковое пространство, были придуманы методы отбора факторов в задачах машинного обучения. О некоторых методах, которые мы внедрили в библиотеку Autobinary расскажем в этой статье.

Поехали
Всего голосов 6: ↑6 и ↓0+6
Комментарии0

ChatGPT с руками и другие итоги сезона Machine Learning

Время на прочтение10 мин
Количество просмотров18K

Давным-давно, в далёкой-далёкой галактике 1 марта Хабр объявил начало сезона «Машинное обучение», и вот настало время подводить итоги. За чтением хардкорных конкурсных текстов месяц пролетел незаметно. Мы узнали много интересного о нейросетях и неочевидных способах взаимодействия с ними, пополнили свою коллекцию туториалов и в очередной раз убедились в актуальности темы Machine Learning для читателей Хабра.

Мы не получили ответ на главный вопрос Вселенной, жизни и всего такого, но зато нам известен лучший автор сезона ML. Впрочем, у него были достойные соперники, их тексты привлекли много внимания и породили холивары в комментариях. Под катом наградим победителя новым макбуком, познакомимся с участниками сезона, пофлудим о Machine Learning и обсудим перспективы этого направления. 

Читать далее
Всего голосов 25: ↑22 и ↓3+19
Комментарии4

Autobinary: библиотека для простого обучения «деревяшек» — Part 1

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.6K

Рождение autobinary, как и многих других фреймворков, началось с автоматизации рутинных задач. На тот момент мы создавали много look-alike моделей (в основе - модель бинарной классификации) по разным продуктам банка. Одни и те же скрипты писать было скучно. Более того – накопилось много разрозненных скриптов, которые хотелось привести к единому формату.

Что из этого получилось
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Как выбрать библиотеку стайлинга и заменить несколько дизайн-систем на одну. Часть 1

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров2.4K

Привет! Меня зовут Вадим Казаченко, я лид фронта дизайн-системы ВТБ. Год назад устроился в банк и получил командную задачу — построить единую библиотеку компонентов, настолько универсальную, чтобы ее можно было использовать в любом продукте дизайн-системы банка, и при этом она не должна становиться «узким горлышком», как это обычно происходит с UI-китами в крупных компаниях. Дело в том, что в ВТБ существует множество дизайн-систем, над которыми работают десятки дизайнеров.

Непростая задача требовала проработки архитектуры дизайн-системы и сильно зависела от выбора решения для стайлинга. В этой статье подробно расскажу, от чего мы отталкивались и на чем остановили свой выбор.

Читать далее
Всего голосов 6: ↑6 и ↓0+6
Комментарии6

Ищем ответ на главный вопрос Вселенной, жизни и всего такого в новом сезоне ML на Хабре

Время на прочтение17 мин
Количество просмотров22K

Меня зовут Андрей Аврамчук, я старший продюсер спецпроектов в Хабре, принёс не ответ на главный вопрос, а пока только новый сезон на Хабре — «Машинное обучение», который мы проводим совместно с ВТБ с 1 по 31 марта. Будем искать вместе, и да поможет нам магия ML.

UPD. Сезон закончился, итоги можно посмотреть в этой статье.

Артур Филип Дент?
Всего голосов 32: ↑31 и ↓1+30
Комментарии11

Введение в Adversarial attacks: как защититься от атак в модели глубокого обучения на транзакционных данных

Время на прочтение7 мин
Количество просмотров3.6K

Машинное обучение широко применяется в различных отраслях. Последние несколько лет все большее распространение получают модели глубокого обучения, включая финансовую и банковскую сферы. В тоже время существуют риски, связанные с манипуляциями ограничений данного рода решений. В частности, риск подвергнуться намеренной атаки на такие модели. В этой статье представим общую таксономию таких атак и способов защиты от них. А также частный случай возможных атак на модели глубокого обучения на транзакционных данных и защиты от таких атак.

Adversarial attacks — это злонамеренное манипулирование входными данными модели машинного обучения с целью заставить ее выдать неправильные предсказания.

Эти атаки проектируются, чтобы использовать уязвимости алгоритмов машинного обучения и часто могут быть выполнены незаметно для системы или пользователя.

Цели таких атак могут варьироваться от причинения финансовых убытков, кражи конфиденциальной информации до нарушения работы системы в целом.

Виды атак

Существует несколько типов Adversarial attacks, каждый из которых имеет свои уникальные характеристики и методологию.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

Конвейер ML-систем и ловушка регулятора: как ВТБ реализует MLOps-практики без вайтбука

Время на прочтение10 мин
Количество просмотров1.8K

Нет ещё в мире IT-вайтбука по MLOps. Нет вайтбука — нет однозначного способа «сделать хорошо, а плохо не делать». Время экспериментов и открытий.

Привет, я Юрий Карев. В ВТБ руковожу командой, которая занимается созданием процессов и стандартов моделирования машинного обучения. И, помимо прочего, работаю с командой как раз над таким экспериментом: мы создаём в ВТБ MLOps-конвейер. По сути, делаем ту самую инструкцию: как правильно реализовать MLOps на практике. Одну из множества: уверен, наши конкуренты всё делают по-своему и тоже получают уникальный ценный опыт. Но этот пост — о нас. О том, как мы подошли к теме MLOps, как продали её бизнесу, чего уже достигли, какие трудности у нас были и как мы их преодолевали. Интересно? Проходите под кат, не стесняйтесь.

Как мы внедряли MLOps «с нуля»
Всего голосов 7: ↑6 и ↓1+5
Комментарии1

Как привлечь разработчиков компании к исследованиям клиентского опыта

Время на прочтение5 мин
Количество просмотров860

Этим летом команда «ВТБ Онлайн» проводила много исследований для изучения сложившегося клиентского опыта и оптимизации сервиса. Обычно в этих процессах активно участвуют product owner, СJE и бизнес-аналитики. Но тут к product owner напрямую обратился разработчик команды «Мобильного банка» с просьбой подключить его к исследованиям и проектированию клиентских сценариев. 

Постепенно всё больше разработчиков, тестировщиков и системных аналитиков интересовались не только результатами исследований, но и самим процессом. Так начал складываться новый формат работы, который требовал внимания и организации. Меня зовут Вера Нещадина, я лид-исследователь платформы «ВТБ Онлайн». Подробнее в статье расскажу, как мы опробовали новый для себя вид работы в команде и помогли коллегам разобраться в исследованиях на системном уровне.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии0

Информация

Сайт
www.vtb.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия