Как стать автором
Поиск
Написать публикацию
Обновить
39.37

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Когда O(n) мешает отбирать резюме в Росатоме

Время на прочтение9 мин
Количество просмотров21K
image

Главная проблема поиска сотрудников — предвзятость. Порой кажется, что наше резюме подходит под свою роль на 100 %, а рекрутер отклоняет его. Проблема с противоположной стороны баррикад: рекрутер должен отсмотреть по 200, 300 и более резюме в день. По разным данным, на каждое уходит всего лишь 6–10 секунд.

А что если можно решить эти две проблемы с помощью ML? Сделать модель, которая исключит любой байес и поможет рекрутеру объективно отбирать подходящих кандидатов (где «подходящесть» обусловлена красивой математикой!).

Мы это сделали. Оказалось, что если вы хотите добиться непредвзятости, то вам придётся внести в систему предвзятость. Оксюморон в статистике!

Что мы увидели:

  • Женатые и замужние — в топе: пока вы не уходите глубоко в анализ, этот быстрый фактор повышает ранг. Чем точнее ваша модель, тем меньше его вес.
  • Английский — плохо: знание английского почему-то работало как антипаттерн, снижая релевантность.
  • ОГУРЕЦ: кто-то зачем-то написал это слово в резюме. Оно попало в словарь модели и получило большой вес.
  • Иксель — люди пишут Excel как угодно, и само слово в правильном написании оказалось снижающим оценку.
  • К резюме может быть приложено много мусора. Самый эпичный пример: авиабилет Москва — Челябинск вместо резюме.

Но давайте начну с начала.
Читать дальше →

Как читать карту МПТ Москвы и рассчитать льготу за застройку через BI инструменты

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров293

Где в Москве строить выгоднее?

Я собрал интерактивную карту, которая показывает районы и кварталы столицы по коэффициенту МПТ — ключевому параметру при расчёте городских льгот на строительство производственных, логистических и гостиничных объектов. В статье рассказываю, откуда берётся коэффициент, как работает формула, и как использовать дашборд для оценки инвестиционной привлекательности участков. Подойдёт девелоперам, аналитикам и просто тем, кто любит, когда данные говорят.

Читать далее

Когда Excel превращается из помощника во вредителя

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.5K

Мне всегда было интересно, как управляются разные бизнесы: как работает завод, ритейл, другие сферы. Я пытался изнутри наблюдать за бизнесом, где создаётся конечная ценность. Где-то работает автократия, в других компаниях уже есть зрелая бюрократия, а где-то все договариваются на словах, но нигде это не прописано.

Я видел, что даже в среднем бизнесе решения принимаются на основании чуйки хозяина. Тогда как в entreprise решения принимаются на основании процедур, отчётов. Люди страдают и ненавидят этот процесс, так как много времени уходит на оцифровку. Но при этом корпорации довольно эффективны, что показал мой дальнейший опыт. Они работают на 4-ку, но стабильно. Малый бизнес может сегодня сработать на 5, а завтра на 2.

Так у меня появилось убеждение, что в своих решениях нужно опираться на данные. Большой компанией можно стать только та, где есть система принятия решений. 

Читать далее

Анализ текстовых данных на примере ОМ

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров2K

О чем говорят волки? Анализ текстовых данных открывает уникальную возможность заглянуть за кулисы Осознанной меркантильности.

Сделаем частотный анализ, тематическое моделирование, проведем анализ тональности и узнаем, так ли негативно выражаются в сообществе (спойлер: да), а еще построим граф, по которому узнаем, в чем смысл жизни (не сфальсифицировано, клянусь).

Весь код внутри.

Читать далее

Секрет производительности крупных корпораций: как BI повышает эффективность работы

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K

Крупные компании повышают свою эффективность, оптимизируя бизнес-процессы, управляя ресурсами и внедряя современные технологии. Важную роль в этом процессе играет бизнес-анализ. В статье разберём, как BI-системы ускоряют рост компаний.

Читать далее

Как Modus BI помогает получать инсайдерскую информацию на рынке недвижимости?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров624

Стандартный анализ рынка недвижимости часто ограничивается поверхностными показателями: объемами продаж, средней ценой за квадратный метр, очевидными тенденциями. Однако факторы, которые действительно влияют на прибыль и риски, часто остаются незамеченными. BI-системы помогают выявлять скрытые закономерности в данных. Рассмотрим, как это происходит.

Читать далее

BI для X-Com: целевые звонки, лицензии поставщиков и другие нетиповые возможности дашбордов

Время на прочтение4 мин
Количество просмотров200

На связи Анна Астахова, директор по развитию ИТ-интегратор «Белый код». В этой статье расскажу, как можно адаптировать такой инструмент как BI под задачи конкретного бизнеса. Например, вы хотите видеть, сколько звонков совершают менеджеры по продажам, кто из них эффективнее. Внутри примеры таких задач с дашбордами.

Читать далее

Сравнение средних значений в BI: однофакторный критерий Кохрена-Кокса

Уровень сложностиСложный
Время на прочтение6 мин
Количество просмотров1.4K

В рамках BI решаются различные задачи, в том числе и с помощью статистических методов, для корректного выбора которых важно обращать внимание на содержание задачи. Например, если нужны только средние значения для графика, то действительно достаточно их рассчитать. Но иногда требуется решить другие задачи, например, не просто расчет средних значений двух выборок, но и сравнение средних двух выборок, чтобы узнать, в какой выборке среднее больше или меньше. Кроме того, данных для сравнения может быть столько, что они могут не умещаться на графике. В этом случае важно переключиться на подходящую статистическую гипотезу и использовать корректные статистические методы, намного более интересные, чем отображение средних значений на графике. Здесь могут быть эффективны методы дисперсионного анализа (ANOVA), или, в частном случае, когда речь идет о расчетах для одного фактора — методы сравнения средних двух выборок, и, например, метод Кохрена-Кокса. О том, какие результаты подобный подход дает на практике, а также о преимуществах работы с DAX при сравнении средних значений, читайте под катом.

Читать далее

Пятый, юбилейный выпуск исследования «BI-круг Громова»

Время на прочтение11 мин
Количество просмотров2K

Пятый, юбилейный выпуск нашего исследования «Круги Громова» выходит в момент, когда рынок отечественных BI-платформ переживает волну бурного роста и трансформации. За два года, прошедшие с публикации предыдущего отчёта, импортозамещение перестало быть формальностью и стало стратегической необходимостью: доля внедрений российских BI-систем выросла почти в восемь раз, а зарубежных — упала до 23 %[1]. На этом фоне особенно важны объективные ориентиры, позволяющие ИТ-директорам и бизнес-пользователям выбрать платформу, которая останется актуальной на ближайшие несколько лет. Именно такую навигационную карту мы и предлагаем.

Читать далее

RFM, дашборды и немного магии: аналитика лояльности в ритейле

Время на прочтение7 мин
Количество просмотров424

Меня зовут Андрей Рыжик, я разработчик BI. У большинства ритейлеров есть система лояльности. Но далеко не каждый владелец бизнеса имеет внятную аналитику этой лояльности. Кто действительно возвращается, а кто просто копит баллы? Какие клиентские сегменты приносят деньги, а какие висят мертвым грузом? Расскажу про аналитику системы лояльности, которую мы разработали и внедряем в проектах. 

Читать далее

Как сэкономить на внедрении BI и не потерять в функционале

Время на прочтение7 мин
Количество просмотров808

Внедрение систем бизнес-аналитики (BI) — сложный процесс, который включает не только установку программного обеспечения, но и интеграцию с источниками данных, их очистку, проектирование ETL-процессов, разработку дашбордов и наполнение аналитическими моделями. Компании часто сталкиваются с вопросом: как сократить расходы, сохранив ключевые возможности системы? Разберём, где возможна разумная экономия, а где она приведёт к снижению эффективности.

Читать далее

Читательский дневник для первого класса при помощи Google Sheets

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1K

Эта история прежде всего для родителей первоклашек, которые летом должны много прочитать. Программирования тоже немного будет, но главное — хотелось просто поделиться инструментом, надеюсь, полезным.

Первоклашке за лето нам нужно прочитать 39 произведений. Объём довольно приличный, поэтому подумалось, что нужно применить планирование, мониторинг и прочие технологии управления.

Читать далее

Финты справедливости

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров867

Очередной футбольной сезон заканчивается. Самое время вернуться к вопросам справедливости. Давайте попробуем её измерить? Ну хотя бы в футболе.

Какова роль случая в спорте? Действительно ли плей-офф - это лотерея? Портит ли нам впечатление от игры новая схема розыгрыша лиги чемпионов?

Давайте построим много-много графиков и закроем уже этот гештальт.

Читать далее

Ближайшие события

Мониторинг. Когда очень хочется. Порабощаем холодильные контроллеры EliWell

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров799

Продолжаем делать свою систему мониторинга и управления холодильного оборудования.

Сегодня у нас на столе ( и в наших шкафах) контроллер EliWell ID Plus974.

Читать далее

Nocode с MWS Tables: кейсы объединения разных команд в одном пространстве, системы выдачи пропусков и геймификации

Время на прочтение6 мин
Количество просмотров665

Привет, Хабр! Меня зовут Александр Антипов, я продакт-оунер MWS Tables.

Современный бизнес требует быстрых и эффективных решений для управления проектами, задачами и данными. И далеко не всегда есть возможность разрабатывать с нуля сложные системы или интегрировать дорогостоящий софт. Именно для таких случаев создан MWS Tables, чтобы быстро делать приложения без привлечения разработчиков.

В прошлом посте я рассказал, как MWS Tables помог внедрить единый реестр для работы с качеством данных, централизовать управление проектами и заменил таск-трекер. Сегодня будут еще три кейса: создание общего календаря и списка задач в распределенных региональных командах, единая система допусков и внедрение механики рейтингов.

Читать далее

Мониторинг. Когда очень хочется. Предисловие и начало

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.5K

Хабр, привет! Много лет читаю тебя, и решил, что пора внести свой вклад в соообщество. Может мой опыт тоже будет кому полезен.

Делаю систему диспетчеризации уровня «бомж‑плюс» для выявления проблем.

Читать далее

Начало пути в тысячу миль: от Excel до SSRS

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.1K

Мне 25, последние несколько лет я работаю в аналитическом отделе одного из департаментов Правительства города Москвы. Занимаюсь сведением бесконечных таблиц с регулярной отчетностью и подготовкой презентаций на самые разнообразные сюжеты.

Назвать ту работу — работой мечты, сложно, как ни крути. Трудозатраты на сбор, обработку и визуализацию информации были так велики, что уход с работы в десять вечера был для меня настоящим праздником. Именно этот «спартанский» опыт вкупе с желанием доказать себе, что разобраться можно в чем угодно, побудил меня к изучению доселе неведомого для мира баз данных, языка запросов SQL, BI и ETL инструментов.

Как вы, возможно, уже поняли, в аналитику я попал не по зову сердца, а по воле случая. Хантер Томпсон внутри меня, конечно, предпочел бы писать колонки в модные журналы, вести собственный блог о литературе или теннисе, в который я играю с детства, ну или посвятить себя еще какой-то творческой ерундистике, окрыляющей не хуже Red Bull Cola. Не смейтесь, исчезновение этого напитка с полок магазинов стало для меня в свое время настоящей трагедией.

Увы, каждый раз, находясь в поиске работы, здравый смысл неустанно напоминал мне о том, что он — главный враг творчества (Пабло Пикассо был во многом прав), а карьера фрилансера, вернее всего, приведет меня на социальное дно, нежели чем на вершину карьерной лестницы.

Итак, осознание того, что автоматизация процессов востребована на рынке и облегчает собственное существование, становится стартовой точкой долгого пути от полного непонимания азов работы с базами данных до уверенного владения всеми необходимыми инструментами для управления подразделением, обеспечивающим data-driven подход к решению задач внутри компании.

Читать далее

Генеалогические деревья как визуальный язык истории

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.4K

Генеалогическое древо — один из самых древних и устойчивых способов визуализации информации. Сначала — как символическое выражение божественного или королевского происхождения, позже — как аналитический инструмент для науки, политики, биологии, даже искусства. Дерево стало универсальной метафорой: и кровного родства, и интеллектуальной преемственности, и эволюции жизни.

Читать далее

Как в Почтатех внедряли отчетность на Luxms BI: интервью тимлида

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров429

Когда в 2022 году в ИТ-системах Почты России стартовал масштабный проект по импортозамещению, команде BI-направления в дочерней компании «Почтатех» предстояло внедрить отечественную альтернативу привычным зарубежным аналитическим решениям – Luxms BI. О том, как проходил процесс внедрения, с какими трудностями столкнулись и какие возможности открылись перед командой — мы поговорили с Евгением Дрензелевым, техлидом BI-направления в Почтатех.

Далее он расскажет о задачах, которые предстояло решить в процессе импортозамещения, а также о тех выгодах и положительных изменениях, которые были получены в результате.

Читать далее

KPI: Путь к успеху или ловушка неэффективности?

Время на прочтение9 мин
Количество просмотров3.9K

Как сделать так, чтобы система KPI действительно работала на бизнес? Этим вопросом задаются все менеджеры, эффективные и действительно эффективные. Меня зовут Алсу Гибадуллина, и уже несколько лет я работаю в Innostage над сложными проектами управления эффективностью в госсекторе. Теперь расскажу, как наши наработки адаптировать под бизнес и работать с KPI не для галочки, а для реальных результатов.

Читать далее