All streams
Search
Write a publication
Pull to refresh
30
0
Егор Борисов @egorborisov

Data scientist

Send message

Введение в MLflow

Level of difficultyMedium
Reading time19 min
Views27K

MLflow - это инструмент для управления жизненным циклом машинного обучения: отслеживание экспериментов, управление и деплой моделей и проектов. В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпараметры с помощью optuna, сравнивать модели и выбирать лучшие параметры. Также рассмотрим логирование моделей, использование их в разных форматах, упаковку проекта в MLproject и установку удаленного Tracking Server MLflow.

Читать далее

Анализ вакансий и зарплат в Data Science

Reading time8 min
Views54K

Привет, Хабр!

Делимся нашим исследованием вакансий и зарплат в сфере data science и data engineering. Спрос на специалистов растет, или рынок уже насытился, какие технологии теряют, а какие набирают популярность, размер зарплатных вилок и от чего они зависят?

Для анализа мы использовали вакансии, публикуемые в сообществе ODS. По правилам сообщества все вакансии должны иметь зарплатную вилку от и до и подробное описание вакансии - есть что анализировать. К статье прилагается репозиторий с ноутбуком и исходными данными.

Читать далее

Анализ расписания и загрузки в Tableau

Reading time4 min
Views2.9K
Многие виды бизнеса имеют фиксированную пропускную способность: кол-во клиентов, которых они могут обслужить в определенный период времени. Салон красоты ограничен кол-вом оборудованных мест, ресторан — кол-вом столиков, клиника — оборудованными кабинетами и доступными врачами.

Базовая проблема загрузки для таких компаний — это простой в моменты низкого спроса и невозможность обслужить всех клиентов в момент высокого спроса.



Рассмотрим проблему и подходы к аналитике загрузки на примере сети косметологических клиник. Директор по развитию сети Дэйв недавно занял свой пост. Перед ним поставили амбициозную задачу увеличить выручку без масштабных капитальных затрат (открытия новых филиалов, реконструкции существующих, закупки оборудования для новых процедур).
Читать дальше →

Мониторинг работы кредитного скоринга в Power BI

Reading time5 min
Views10K
В условиях когда большая часть заявок на кредит рассматривается автоматически, мониторинг становится особенно важным. Всё ли работает в штатном режиме, как меняются ключевые показатели, какие изменения нужно внести, чтобы добиться нужного результата?

В статье я расскажу, как мы мониторим кредитный конвейер с помощью Power BI, какие отчеты и метрики используем для оценки качества выдач.

Ключевые показатели внутри дня



Читать дальше →

Как выбрать лучшее место для открытия филиала и визуализировать результаты на картах

Reading time4 min
Views8K

Выбор места для нового филиала — ответственное решение. Ошибка может стоить дорого, особенно в капиталоемких отраслях. Чаще всего такие решения принимаются менеджментом экспертно: на основе знания города, отрасли, предыдущего опыта.


В статье я расскажу о том, как аналитика может помочь в принятии таких решений. Как собрать информацию о населении, ценах на недвижимость и сделать интерактивные визуализации. Зависит ли кол-во клиентов от расстояния до филиала, года постройки дома, стоимости недвижимости.


Население города с точностью до дома


Читать дальше →

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Works in
Date of birth
Registered
Activity