Как стать автором
Поиск
Написать публикацию
Обновить
66.38
Сначала показывать

Стратегия успеха: ключи к развитию карьеры в Data Science

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров365

Привет! Меня зовут Анна Ширшова, я уже 14 лет работаю в Data Science. В этом материале вы найдете мой личный чек‑лист по развитию карьеры: как ставить цели, где искать возможности, какие ошибки тормозят рост и как их обходить. 

Работу в ВТБ я начала в качестве лида команды, которую сама собирала с нуля. За время работы она была расширена до целого Кластера моделирования для СRM и оптимизации. В него вошли четыре команды из DE, DS, MLOPs, системных аналитиков и тестировщиков, руководителем которого являюсь. 

Некоторые коллеги, которые тогда вошли в команду в качестве junior DS, сейчас уже являются лидерами (product owner) команд Кластера. На основе своего опыта найма и развития сотрудников в сжатые сроки, в этой статье делюсь как стопперами, которые, на мой взгляд, мешают развитию карьеры, так и возможными путями по их устранению.

Читать далее

Data Fusion Contest 2025: разбор и итоги серии соревнований

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров419

Привет, Хабр!

В этом году Т1 совместно с ВТБ организовал соревнование Data Fusion Contest 2025 — ставшее ежегодной традицией событие, которого с нетерпением ждут и участники, и мы сами. Фотографии.

В этой статье мы расскажем, какие задачи были подготовлены, как проходили соревнования, и, конечно же, поделимся подробностями о решениях победителей этого года.

Читать далее

Зачем банку ещё одна ALM-система

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.5K

Хабр, привет! В этой статье расскажем, как команда банка ВТБ построила собственную аналитическую систему на базе открытых технологий и с использованием решений Arenadata. Мы рассмотрим архитектуру платформы, разберём её сильные и слабые стороны, а также заглянем «под капот» — покажем, как устроены процессы внутри банка и почему ВТБ решил идти своим путём, а не использовать готовые вендорские системы.

Читать далее

Многорукие бандиты: когда классическое тестирование не работает

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров868

Привет, Хабр! Мы команда ЖЦК, занимаемся машинным обучением в ВТБ. Сегодня расскажем про алгоритмическую магию, которая творится прямо у нас под носом. Авторами проекта этой магии в ВТБ стали дата-сайентисты Дмитрий Тимохин, Василий Сизов, Александр Лукашевич и Егор Суравейкин. Речь пойдет не о хитрых нейросетях с их миллионами параметров, а о простом подходе, который помог им и команде сэкономить много времени на решении задач, в которых раньше использовались классические методы тестирования. 

Читать далее

От монолита к микросервисам. Монолитная модель данных. Распознать и обезвредить

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров2.7K

Привет! Меня зовут Светлана Уварова, я архитектор информационных систем.

Микросервисная архитектура не гарантирует модульность, если в системе остаются монолитные данные. В этой статье разберемся, как модель данных может незаметно превратить микросервисы в монолит — и как этого избежать на этапе проектирования.

Ранее я уже писала, что архитектору важно понимать, какие данные будут использоваться в системе, как и кем они будут настраиваться, откуда данные собираются и куда передаются. 

А если вам уже приходилось переводить монолит в микросервисы — или вы только планируете это сделать — вы могли и можете столкнуться с монолитной моделью данных (далее — ММД).

Неважно, идет ли речь о миграции данных или о ручном заполнении оператором: если вовремя не выявить ММД, в итоге получится новый монолит — только на микросервисном коде. Он будет иметь все характерные для него свойства, в том числе:

Читать далее

Мечтать, чтобы строить: как прошёл сезон «Будущее здесь»

Время на прочтение8 мин
Количество просмотров16K

Гипотезы становятся концепциями, идеи — планами, а мечты — реальностью особенно быстро, когда речь идёт об искусственном интеллекте. Сезон «Будущее здесь» на Хабре стал лабораторией ближнего будущего, где ИИ — больше чем просто инструмент. Он превращается в собеседника, помощника, зеркало, в котором наши ценности, страхи и надежды сначала отражаются, а затем обретают самостоятельную жизнь.

Участники сезона принесли десятки версий завтрашнего дня: одни — в виде рассказов, другие — как инженерные концепции и технологические прогнозы. Вместе с ВТБ мы подводим итоги — и выбираем идеи, готовые воплотиться в жизнь.

Читать далее

Оптимизация стратегии взыскания с помощью ML-моделей

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров999

Привет! Меня зовут Мария Шпак, я лидер команды collection стрима моделирования розничного бизнеса в Департаменте анализа данных и моделирования банка ВТБ. Наша команда занимается разработкой моделей машинного обучения для различных процессов, в совокупности служащих для финансового урегулирования. Основной заказчик этих моделей – соответствующий департамент банка, целью которого является помощь клиентам, допустившим просрочку платежа или находящимся в графике, но имеющим риск просрочки (Pre-Collection). Наши коллеги предлагают клиентам различные инструменты урегулирования этой проблемы и в большинстве случаев добиваются скорейшего возврата клиента в график платежей и в статус добросовестного заемщика. Оптимизация стратегий финансового урегулирования предполагает учёт разных параметров ситуации клиента: причины возникновения просрочки, степени серьезности возникших у него проблем, а также наиболее удобных и эффективных способов установить с ним контакт.

Читать далее

Секционирование в PostgreSQL. Архитектура корзинного хранения данных. (Basket partitioning)

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров5.1K

Привет, ХАБР! Я Хаймин Владимир, эксперт по системам управления базами данных PostgreSQL в ВТБ. Когда размеры таблиц становятся большими — обслуживание и доступ к данным становятся непростой задачей. Я хочу поделиться методикой организации секционирования в PostgreSQL, которая существенно упростила нам жизнь с таблицами большого размера, хранящие, например, исторические данные по датам. Назовем ее условно «Корзинным секционированием» (Basket partitioning). Данная технология реализована архитектурно, без необходимости расширения функционала сторонними инструментами или расширениями только штатными средствами ванильных версий PostgreSQL. Такая система хранения реализована, например, в проекте мониторинга pg_awr для упрощения удаления старых данных.

Секционирование в PostgreSQL

Секционирование — это техника разбиения одной большой таблицы базы данных (БД) на несколько меньших, логически связанных частей, называемых секциями. При этом, такая таблица с точки зрения ППО выглядит как одна большая таблица. 

Современные версии PostgreSQL имеют достаточно развитые средства для работы с секционированными таблицами. При этом, несмотря на то что страдает автоматизация, например, создания и удаления секций, при правильной организации хранения данных работать с такой БД достаточно удобно. И эти удобства минимизируют вероятные ошибки.

PostgreSQL начиная с 10 версии, помимо наследования, поддерживается декларативное секционирование: диапазонное, списочное, хэш-секционирование.

Какие бывают базы данных по методу их наполнения и использования?

Читать далее

Как мы обучили модель прогноза ранней просрочки: логистическая регрессия vs градиентный бустинг

Время на прочтение9 мин
Количество просмотров2.5K

Всем привет! На связи дата-сайентисты стрима разработки моделей для корпоративного сегмента ВТБ — Андрей Бояренков, Иван Кондраков и Денис Дурасов.

Как уже писали ранее в другой статье, внедрение процесса AutoML позволило нам во многом автоматизировать рутину и разработки, и применения моделей. Соответственно, у нас появилось больше времени для RnD-задач, которые могли бы быть полезны нашим заказчикам, чтобы охватить моделями новые процессы, а также провести исследования новых алгоритмов.

Поэтому мы составили мэппинг возможных моделей на элементы работы Банка с клиентами малого и среднего бизнеса в части предотвращения просрочек по кредитной задолженности, а также по взысканию задолженности. Из данной схемы стало понятно, что есть необходимость разработать модели для процессов по мониторингу заёмщиков Банка — Precollection-модели.

Под катом расскажем, как мы их разрабатывали и каких результатов удалось с ними добиться.

Читать далее

Бегущий по лезвию ИИ — 2025: сезон футурологии на Хабре

Время на прочтение4 мин
Количество просмотров47K

В 2025 году школьники не летают на Марс, автомобили всё так же колесят по земле, а искусственный интеллект, к счастью, не стремится поработить человечество. Но он уже меняет мир вокруг нас, проникая в самые разные сферы жизни. Каким будет наше будущее? Какие технологии определят его облик? В новом сезоне — «Будущее здесь» — предлагаем вместе с нами поразмышлять над этими вопросами.

Думать широко, глубоко и даже дерзко — в духе Хабра, и тема сезона этому способствует. Ведь каждое смелое предсказание — это шаг в неизведанное. А самый смелый шаг заслуживает не только признания, но и крутого приза.

Узнать об условиях и призах

Через тернии к Омни. Эпизод 10. Последний ингредиент

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров623

Действительно, есть, одна проблема: можно ли реализовать омниканальную архитектуру в неомникальной организации? Как у Петра Первого, можно пробовать построить Санкт-Петербург и так, но может оказаться, что и бороды надо брить. Причем с этого и надо начинать. То-то и оно. Для новой архитектуры нужно менять и организацию. Как это сделать — в финальном эпизоде. 

Мы начинаем

Через тернии к Омни. Эпизод 9. Остановись, мгновенье

Уровень сложностиСредний
Время на прочтение1 мин
Количество просмотров471

Итак, мы узнали об омникальности достаточно. Витрины, продукты, СУБО а в жизни то что? Концепции, принципы – да где посмотреть Конечно, здесь – мы занимаемся этим с 2020 года, и кое-что получилось. 

Мы начинаем

Через тернии к Омни. Эпизод 8. Архитектура 5-го поколения

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров998

Хочется поговорить с умным человеком (это я про тебя читатель). Все то, что мы рассказывали раннее — это поколение 4++. Теперь нужно сделать следующий шаг в будущее. На «пятерку». Было страшно. Но глаза боятся, а руки делают! Главное не оглядываться, а то упадешь. Делаем омниканальное банковское ядро.

Мы начинаем

Через тернии к Омни. Эпизод 7. Бережливая унификация

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров535

Теперь мы знаем, что за «коктейль» у нас получается и важно, что логика идет снизу-вверх, что позволяет нарезать ее так, как нужно потребителю. Видно: витрины — канальные приложения, продуктовые системы — СУБО, общие элементы ОПС/ОС/СС. Красиво? Вроде да, но как-то уж больно просто. Неужели в производстве все также гладко?

Мы начинаем

Через тернии к Омни. Эпизод 6. Смешать, но не взбалтывать

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров438

В предыдущем эпизоде мы собрали общую конструкцию, соответствующую формуле омниканальности. Определены слои и ингредиенты для каждого слоя, даже в виде одной фразы приведен общий рецепт предлагаемого напитка. Теперь надо пробовать этот коктейль, но как?

Мы начинаем

Через тернии к Омни. Эпизод 5. Омниплатформа, схема принципиальная, электрическая

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров812

Собираем конструкцию омниархитектуры по слоям. В этом эпизоде мы узнаем: из каких слоев состоит омниканальная платформа, какие элементы находятся на каком слое и для чего они нужны. В конце сформулируем, что такое омниканальная архитектура одной фразой! Фраза, конечно, не как у Льва Николаевича (Толстого), но нужно дотянуть до конца. Мы не редкие птицы, но Николай Васильевич (который Гоголь) должен подсобить.

Мы начинаем

Через тернии к Омни. Эпизод 4. Омниплатформа. Схема принципиальная, электрическая

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.2K

С багажом из предыдущих серий мы отравляемся в следующий эпизод, в котором мы определим имманентные (простите вырвалось) проблемы ИТ-архитектуры 4-го поколения, на примере ВТБ 2019 года выпуска. А также узнаем, как решаются эти проблемы в Омниканальной архитектуре. В рамках этого мы сформулируем формулу омниканальности.

Мы начинаем

Через тернии к Омни. Эпизод 3. Цифровая трансформация: как она проявляется в ИТ

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.2K

В предыдущем эпизоде мы посмотрели, в какой точке был ИТ-ландшафт ВТБ, и что привело его в эту конкретную точку. ИТ-архитектура была в принципе вполне нормальна, отвечала задачам бизнеса на тот момент и в принципе «каши не просила». В 2019 была точка принятия решения, что делать дальше? Какая «погода», какие технологические тренды дуют, пойдем или полетим, сидим в гавани или идем в открытое море. 

Мы начинаем

Через тернии к Омни. Эпизод 2. Откуда пошла Омниканальная платформа

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1K

В первом эпизоде первого в мире архитектурного сериала мы определились с буквами, словами и терминами. Теперь мы рассмотрим траекторию развития ИТ вообще, что двигало это развитие, какие задачи решались и какими средствам. Какая траектория была у ИТ-ландшафта ВТБ и в какой точке мы были в 2019 году.

Мы начинаем

Через тернии к Омни. Эпизод 1. Вместо предисловия

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.8K

Творческий центр Департамента ИТ-архитектуры ВТБ, при сдержанной поддержке Технологического блока банка, под настороженно-дружелюбными взглядами неравнодушных представителей ИТ-производства, и с трудно угадываемым молчаливым одобрением служб эксплуатации, неожиданно представляет: первый в России (а значит и в мире) архитектурный сериал «Через тернии к Омни». Присоединяйтесь к нашему многосерийному лонгриду.

Мы начинаем
1
23 ...

Информация

Сайт
www.vtb.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия