Как стать автором
Обновить
19.5
Карма
0
Рейтинг
Егор Борисов @egorborisov

Data science, credit scoring

  • Подписчики 14
  • Подписки
  • Публикации
  • Комментарии

Как выбрать лучшее место для открытия филиала и визуализировать результаты на картах

Python *Data Mining *Геоинформационные сервисы *Визуализация данных Бизнес-модели
Recovery mode
Выбор места для нового филиала — ответственное решение. Ошибка может стоить дорого, особенно в капиталоемких отраслях. Чаще всего такие решения принимаются менеджментом экспертно: на основе знания города, отрасли, предыдущего опыта.

В статье я расскажу о том, как аналитика может помочь в принятии таких решений. Как собрать информацию о населении, ценах на недвижимость и сделать интерактивные визуализации. Зависит ли кол-во клиентов от расстояния до филиала, года постройки дома, стоимости недвижимости.

Население города с точностью до дома



Читать дальше →
Всего голосов 21: ↑18 и ↓3 +15
Просмотры 6.6K
Комментарии 20

Мониторинг работы кредитного скоринга в Power BI

Визуализация данных Машинное обучение *Управление проектами *Управление продуктом *Финансы в IT
В условиях когда большая часть заявок на кредит рассматривается автоматически, мониторинг становится особенно важным. Всё ли работает в штатном режиме, как меняются ключевые показатели, какие изменения нужно внести, чтобы добиться нужного результата?

В статье я расскажу, как мы мониторим кредитный конвейер с помощью Power BI, какие отчеты и метрики используем для оценки качества выдач.

Ключевые показатели внутри дня



Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Просмотры 6.9K
Комментарии 4

Анализ вакансий и зарплат в Data Science

Блог компании Open Data Science Big Data *Машинное обучение *Карьера в IT-индустрии Искусственный интеллект

Привет, Хабр!

Делимся нашим исследованием вакансий и зарплат в сфере data science и data engineering. Спрос на специалистов растет, или рынок уже насытился, какие технологии теряют, а какие набирают популярность, размер зарплатных вилок и от чего они зависят?

Для анализа мы использовали вакансии, публикуемые в сообществе ODS. По правилам сообщества все вакансии должны иметь зарплатную вилку от и до и подробное описание вакансии - есть что анализировать. К статье прилагается репозиторий с ноутбуком и исходными данными.

Читать далее
Всего голосов 35: ↑34 и ↓1 +33
Просмотры 24K
Комментарии 17

predict_proba в Python не прогнозирует вероятности (и как с этим бороться)

Блог компании OTUS Python *Машинное обучение *
Перевод

Специалисты по анализу данных часто оценивают свои прогностические модели с точки зрения точности и погрешности, но редко спрашивают себя:

«Способна ли моя модель спрогнозировать реальные вероятности?»

Однако точная оценка вероятности чрезвычайно ценна с точки зрения бизнеса (иногда она даже ценнее погрешности). Хотите пример?

Представьте, что ваша компания продает два вида кружек: обычные белые кружки и кружки с котятами. Вам нужно решить, какую из кружек показать клиенту. Для этого нужно предсказать вероятность того, что пользовать может купить ту или другую кружку. Вы обучили пару моделей и у вас есть следующие результаты:

Читать далее
Всего голосов 14: ↑13 и ↓1 +12
Просмотры 4.9K
Комментарии 1

Как создать чат-бота для ВКонтакте, используя Python, Django и webhook

Мессенджеры *Python *Django *ВКонтакте API *
Из песочницы
Tutorial

Зачем ещё одна статья про создание чат-бота?


Возможно я плохо искал, но я не смог найти подробного руководства по созданию бота на python с применением фреймворка Django и подхода webhook, работающего на хостинге от российской компании. В большинстве материалов говориться о применении фреймворка Flask и использования бесплатных хостингов Heroku и PythonAnywhere. Опыт сообщества Хабр меня выручает, поэтому я решил в знак благодарности потратить время на написание данной статьи. Опишу полученный практический опыт, чтобы дать возможность всем кто в этом заинтересован сэкономить время и лучше понять как сделать бота на Python с применением фреймворка Django на своём хостинге, используя подход webhook.
Читать дальше →
Всего голосов 15: ↑10 и ↓5 +5
Просмотры 20K
Комментарии 7

Полезный обзор. 28 книг, которые повлияли на мое мышление, вдохновили или сделали лучше

Профессиональная литература Карьера в IT-индустрии
Recovery mode


Я не люблю читать книжные рейтинги по двум причинам. Во-первых, чаще всего они представляют собой список книг, отобранных неведомым автором по неведомым критериям. Во-вторых, описания книг больше напоминают рекламные тексты издательств, которым сложно верить.

Из-за этого большинство подобных материалов мало полезны, несмотря на то, что могут содержать толковые книги. Мне давно хотелось написать полезный обзор, который не станет навязывать определенные материалы, а позволит читателю выбрать наиболее подходящие.
Читать дальше →
Всего голосов 62: ↑55 и ↓7 +48
Просмотры 117K
Комментарии 79

Анализ расписания и загрузки в Tableau

Data Mining *Big Data *Визуализация данных Управление проектами *Управление продуктом *
Многие виды бизнеса имеют фиксированную пропускную способность: кол-во клиентов, которых они могут обслужить в определенный период времени. Салон красоты ограничен кол-вом оборудованных мест, ресторан — кол-вом столиков, клиника — оборудованными кабинетами и доступными врачами.

Базовая проблема загрузки для таких компаний — это простой в моменты низкого спроса и невозможность обслужить всех клиентов в момент высокого спроса.



Рассмотрим проблему и подходы к аналитике загрузки на примере сети косметологических клиник. Директор по развитию сети Дэйв недавно занял свой пост. Перед ним поставили амбициозную задачу увеличить выручку без масштабных капитальных затрат (открытия новых филиалов, реконструкции существующих, закупки оборудования для новых процедур).
Читать дальше →
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 2K
Комментарии 0

Галерея лучших блокнотов по ML и Data Science

Python *Data Mining *Big Data *Машинное обучение *
Привет, читатель.

Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

image

Итак, приступим.

Вводные курсы в Jupyter Notebook


Читать дальше →
Всего голосов 41: ↑34 и ↓7 +27
Просмотры 29K
Комментарии 7

5 главных алгоритмов сэмплинга

Python *Программирование *Data Mining *Алгоритмы *Big Data *
Перевод


Работа с данными — работа с алгоритмами обработки данных.


И мне приходилось работать с самыми разнообразными на ежедневной основе, так что я решил составить список наиболее востребованных в серии публикаций.


Эта статья посвящена наиболее распространённым способам сэмплинга при работе с данными.

Читать дальше →
Всего голосов 17: ↑15 и ↓2 +13
Просмотры 15K
Комментарии 1

Как считать lifetime value: обзор методов

Монетизация игр *Повышение конверсии *Аналитика мобильных приложений *


Вопрос расчёта lifetime value (он же LTV, customer lifetime value, CLV) рано или поздно встаёт перед разработчиками мобильных (впрочем, и не только) приложений. Методов расчёта придумано множество, и по поводу того, как считать LTV, существует сколько людей, столько же и мнений. В данном материале я решил описать наиболее распространённые методы, обозначить их плюсы и минусы. Данные методы подходят прежде всего для описания f2p-модели.
Читать дальше →
Всего голосов 11: ↑11 и ↓0 +11
Просмотры 36K
Комментарии 9

«Анализ данных на Python» в двух частях

Блог компании Образовательные проекты JetBrains Data Mining *
Курсы по анализу данных в CS центре читает Вадим Леонардович Аббакумов — кандидат физ.-мат. наук, он работает главным экспертом-аналитиком в компании Газпромнефть-Альтернативное топливо.

Лекции предназначены для двух категорий слушателей. Первая — начинающие аналитики, которым сложно начинать с изучения, например, книги The Elements of Statistical Learning. Курс подготовит их к дальнейшей работе. Вторая — опытные аналитики, не получившие систематического образования в области анализа данных. Они могут заполнить пробелы в знаниях. С прошлого года на занятиях используется язык программирования Python.

Чтобы понимать материал, достаточно когда-то прослушанных курсов математического анализа, линейной алгебры и теории вероятностей и базовых знаний языка Python.

Приятного просмотра!
Всего голосов 22: ↑20 и ↓2 +18
Просмотры 44K
Комментарии 0

Как мы ломали скоринговую модель. Машинное обучение на практике

Data Mining *Big Data *Визуализация данных Машинное обучение *Финансы в IT
Recovery mode
Привет, Хабр! Я работаю в команде Devim, которая развивает систему принятия решений в отношении заемщиков кредитов.
Расскажу о проблемах, с которыми мы столкнулись в процессе разработки скоринговых моделей и о том, как мы их решали.

Читать дальше →
Всего голосов 29: ↑14 и ↓15 -1
Просмотры 4.4K
Комментарии 14

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Работает в
Дата рождения
Зарегистрирован
Активность