Articles / Profile of MaximML / Habr

Максим@MaximML

Machine Learning Team Lead, автор канала @ml_maxim

Subscribers

ProfileArticles15PostsNewsComments22

MaximML May 18 at 13:30

15 приемов EDA на Python, которые работают лучше красивого дизайна

Easy

20 min

12K

МТС corporate blogData visualization * Studying in ITBig Data *

Tutorial

Каждый раз, когда вы делаете EDA, вы стоите перед выбором: нарисовать быстрый df.plot() - или потратить 10-20 минут на оформление, которое скажет что-то важное про ваши данные. В нашем курсе в МТС Школа Аналитиков Данных мы проверили этот выбор экспериментально: 44 студента сделали 220 EDA-графиков, мы получили 6000 попарных сравнений и проанализировали через CrowdBT. (кстати, уже второй раз!) Результат: победители используют не больше данных, а больше контекста. Фоновые зоны, медианы, адаптивная перекраска, inset-axes - именно эти приёмы отличают скучный график от графика, который меняет решения.

В статье - cookbook из 15 рецептов с кодом "до" и "после" на python. Данные - встроенный seaborn.load_dataset("diamonds"), копируйте, запускайте, вдохновляйтесь.

Погрузиться в мир визуализации данных

+30

MaximML Jan 25 at 14:00

7 pet-проектов с LLM: приватность, скорость и безопасность своими руками

Easy

5 min

14K

IT careerArtificial IntelligenceMachine learning *

Зачем всё это?

В последние годы NLP развивается так быстро, что собрать LLM‑систему стало почти так же просто и естественно, как поднять веб‑сервис или собрать пайплайн данных. И всё же логичный вопрос: зачем делать что-то с нуля, если есть готовые SaaS и open-source решения, которые уже просто работают из коробки?

Потому что готовые решения обычно оптимизированы под средний сценарий, а реальный мир почти всегда про частные ограничения: приватность данных, стоимость инференса, задержки, нестандартные источники знаний, требования безопасности и воспроизводимость.

Pet‑проект - это способ руками потрогать ключевые узлы современного LLM‑стека и понять, где именно рождаются качество, скорость и риски. В этой подборке я собрал направления, которые сам считаю самыми обучающими и практически применимыми в 2026 году. В каждом пункте: что строим, зачем, минимальный план и что получится на выходе.

MaximML Dec 23 2025 at 07:39

Автоматизация фоновой аналитики в финтехе с помощью background LLM‑агента: реальный опыт

Medium

11 min

5.6K

МТС corporate blogArtificial IntelligenceBig Data * Python *

Case

AI in developers season

Всем привет, меня зовут Максим Шаланкин, Machine Learning Team Lead в команде финтеха Big Data MWS. Внутренняя аналитика в финтехе живет в режиме постоянной гонки: новые клиенты приходят, ведут себя по‑разному, а бизнесу нужно быстро понимать, чем группы с разными сценариями отличаются друг от друга. При этом значительная часть работы аналитика — это однотипное сравнение когорт и поиски закономерностей в табличках и графиках. Фоновый LLM‑агент, который умеет сам поднимать данные, запускать статистические проверки и возвращать готовые инсайты, заметно сокращает путь от данных до решения.

Под катом — разбор, как устроен такой background‑агент для анализа активности новых клиентов, на чем он основан, как мы минимизируем галлюцинации и почему выбрали архитектуру, похожую на Claude Skills, а не идем в сторону MCP‑подхода.

MaximML Oct 23 2025 at 07:02

Как создать AI-аналитика во время учебы: кейс выпускного проекта студентов Школы аналитиков данных МТС

7 min

6.6K

МТС corporate blogIT careerStudying in ITMachine learning *

Case

Привет, Habr! На связи Максим Шаланкин из команды Школы аналитиков данных МТС. Каждый год наши студенты в качестве итогового проекта решают реальные бизнес-задачи, и этот не стал исключением. Четверо выпускников — Анна Шестакова, Григорий Суханов, Михаил Футьянов, Алексей Жданов — создали InsightFinder, мультиагентную систему для автоматического анализа данных (EDA). Этот проект автоматизирует EDA и бизнес-интерпретацию данных, сокращая рутинный процесс с нескольких часов до пяти минут.

Добавление бизнес-интерпретации повышает вариативность использования: проект становится полезным инструментом как для специалистов Data Scientist или Data Analyst, так и для менеджеров, которые занимаются развитием продуктов и которым нужна быстрая проверка гипотез.

В этом материале я не только покажу результат работы ребят, но и дам подробное руководство, как создать такое решение самостоятельно. Это будет полезно всем, кто интересуется применением LLM в аналитике, мультиагентными системами и следит за развитием анализа данных.

+28

MaximML Oct 15 2025 at 09:53

Perplexity под капотом: архитектура AI-песочницы

Medium

6 min

7.3K

Machine learning * Industrial Programming * High performance * Google Cloud Platform *

Analytics

Каждый, кто работает с AI, рано или поздно сталкивается с его ограничениями. Недавно я столкнулся с такой ситуацией: Perplexity успешно проанализировал сайт и собрал все ссылки, но отказался их обработать, сославшись на «превышение лимитов ресурсов». Что это за «лимиты» в облачной системе, обладающей, казалось бы, бесконечными мощностями? Этот, на первый взгляд, рядовой сбой стал отправной точкой для технического исследования: я решил заглянуть «под капот» AI-песочницы, чтобы понять, как она на самом деле устроена и почему знание ее архитектуры помогает работать с ней гораздо эффективнее

MaximML Sep 18 2025 at 12:59

Учим ai-агента ориентироваться на местности: кастомный tool на python и overpass (OSM)

Medium

5 min

7.1K

Geoinformation services * Artificial IntelligenceMachine learning *

Case

Привет, Хабр!

Современные AI-агенты уже умеют планировать отпуск, писать код, и совершать покупки в интернете, но поставьте их перед простым вопросом «где лучше снять квартиру рядом с метро и школой» - и они начинают галлюцинировать. Они не понимают, что «5 минут до метро» и «500 метров по прямой через реку» - совершенно разные вещи. В результате пользователь получает красивые, но бесполезные советы

Этот проект покажет, как добавить агенту «глаза» для карты, чтобы он мог реально находить ближайшие кафе около парков, считать расстояние пеших прогулок и показывать результаты прямо на интерактивной карте

MaximML Apr 17 2025 at 08:00

Анализ данных: от EDA до Tinder-битвы графиков

6 min

3.4K

МТС corporate blogStudying in ITBig Data * Machine learning * Data visualization *

Всем привет! Меня зовут Максим Шаланкин, и я веду несколько образовательных блоков в нашей школе аналитиков данных в МТС. Сегодня я хочу рассказать, как мы организовали необычное занятие по анализу данных: в нем студенты соревновались за звание лучшего в игре, напоминающей Tinder, но для графиков предварительного анализа (EDA). Эта активность не только помогла освоить ключевые навыки визуализации, но и сделала процесс обучения увлекательным и запоминающимся, демонстрируя практическую значимость качественного анализа данных.

В этом материале я расскажу, как мы вообще обучаем EDA, какие нюансы есть в процессе и как мы делаем его интересным с помощью игры. История и графики победителей под катом.

+20

MaximML Jan 21 2025 at 12:44

Топ 6 идей для ваших ML pet-проектов в 2025 году

9 min

10K

IT careerMachine learning *

Новый год — это идеальное время для перезагрузки и новых начинаний. Это уникальная возможность не только подвести итоги прошедшего года, но и заложить фундамент для будущих достижений. Если вы давно мечтали о собственном проекте в области машинного обучения, сейчас самое подходящее время, чтобы воплотить эту идею в жизнь.

погрузиться в мир pet-проектов

MaximML Dec 19 2024 at 12:15

Ошибайся смело: жизненные уроки из мира machine learning

6 min

МТС corporate blogMachine learning * IT career

Всем привет, меня зовут Максим Шаланкин, Data Science Team Lead в команде Финтеха Big Data МТС. На ошибках учатся, и это не просто слова. Идея данного поста возникла из моих ежедневных наблюдений: многие люди вокруг остро реагируют на свои ошибки и теряют мотивацию из-за неудач. Я хочу показать, что промахиваться — нормально и даже полезно для будущего профессионального роста.

А сделаю я это на примере machine learning — сферы, в которой у меня широкая экспертиза. Между обучением человека и алгоритма ML больше общего, чем может показаться на первый взгляд. В этом тексте я проведу параллели и сравню различные жизненные ситуации и процессы обучения ML-алгоритмов.

+15

MaximML Oct 17 2024 at 16:27

Семь каверзных вопросов от преподавателей школы аналитиков данных МТС

6 min

15K

МТС corporate blogBig Data * IT-companiesMachine learning *

Привет, Хабр! Меня зовут Максим Шаланкин, я вместе со своими коллегами — преподавателями в Школе аналитиков данных от МТС — подготовил семь каверзных вопросов, с которыми могут столкнуться начинающие специалисты в области Data Science, ML и Big Data. Ну что, поехали!

+14

MaximML May 27 2024 at 15:08

Быстрая Data Quality проверка на базе алгоритма adversarial validation

10 min

8.8K

МТС corporate blogData Mining * Mathematics * Machine learning * Artificial Intelligence

Привет, Хабр! Всем привет, меня зовут Максим Шаланкин, я Data Science Team Lead в команде Финтеха Big Data МТС. Из этой статьи вы узнаете, как оценивать качество данных при помощи алгоритма adversarial validation с использованием spark user defined function. В частности, я расскажу, почему такой подход хорошо масштабируется и может быть успешно применен к различным типам данных, становясь универсальным инструментом для встраивания в ваши продуктовые процессы. Все подробности — под катом.

MaximML Feb 2 2022 at 09:01

Куда поехать в пятницу вечером, если ты в Питере. Сравнение алгоритмов геокластеризации

7 min

7.8K

Ситимобил corporate blogMachine learning * Geoinformation services * Algorithms *

Всем привет, меня зовут Максим Шаланкин, в Ситимобил я занимаюсь машинным обучением. Мы постоянно принимаем решения на основе больших данных. Даже в пятницу вечером мы доверяем алгоритмам выбор места отдыха. А кто же, если не наши клиенты, лучше всего знают, где в Санкт-Петербурге можно хорошо отдохнуть?

Врууум

+26

MaximML Sep 29 2021 at 09:02

Геоанализ этажности Санкт-Петербурга алгоритмом KDE, или Как меняется облик города

4 min

4.5K

Ситимобил corporate blogBig Data * Geoinformation services * Algorithms *

Всем привет, меня зовут Максим Шаланкин, в Ситимобил я занимаюсь машинным обучением. Мы используем множество крутых алгоритмов для оптимизации наших сервисов и улучшения бизнес-процессов. В этой публикации я расскажу, как использовать в геоаналитике алгоритм ядерной оценки плотности (Kernel Density Estimation) и строить полигоны на карте, основываясь на распределении географических данных.

Врууум

+26

MaximML Aug 11 2021 at 09:01

Жизненный цикл ML-модели

4 min

16K

Ситимобил corporate blogBig Data * Machine learning *

Всем привет! Меня зовут Максим, и в Ситимобил я занимаюсь машинным обучением. Сегодня я расскажу вам, как мы разрабатываем устойчивые ML-модели в суровых условиях изменчивого мира.

Врууум

+19

MaximML Jun 27 2021 at 12:49

Голосовой дневник на python с распознаванием голоса и сохранением в Mongo DB

4 min

19K

Python * MongoDB * Voice user interfaces *

From sandbox

Как (и зачем?) написать голосовой дневник, используя open source инструменты.