Обновить

Системный и бизнес-анализ

Сначала показывать
Порог рейтинга
Уровень сложности

Продуктовые метрики для аналитика данных: памятка для собеседований

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.4K

Бывало ли, что для решения бизнес-кейса на собеседовании вам не хватило знания какой-нибудь метрики из предметной области? Это частая ситуация — например, в маркетплейсах всюду говорят про GMV, а в маркетинговой аналитике не обойтись без LTV.

Привет, Хабр! Меня зовут Рафаэль Сайфутдинов, но обычно меня зовут просто Раф. Я работаю аналитиком ценообразования в Авито (а раньше — в Яндекс Лавке), преподаю машинное обучение в Центральном университете, окончил факультет компьютерных наук в НИУ ВШЭ и прошёл курс «Специалист по Data Science» в Яндекс Практикуме. Делюсь памяткой для аналитиков — сохраните, чтобы не провалить собеседование из-за незнания продуктовых метрик.

Читать далее

Как мы встроили ИИ в Process Mining: децентрализация, одна кнопка инсайтов и путь к агентам

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.9K

Привет! Я — Андрей Шалягин, руководитель Офиса цифровизации в Альфа-Банке. Наша команда помогает различным подразделениям внедрять технологии и решения, направленные на выявление и оптимизацию рутины, повышение производительности и цифровизацию операций.

В Альфе множество сквозных процессов и точек взаимодействия между системами и людьми. BI-инструменты хорошо справляются с агрегацией данных и построением отчетности, но они редко отвечают на вопрос: как на самом деле протекает процесс, где он замедляется и почему возникают отклонения.

Чтобы получить объективную картину мы применяем Process mining — технологию, которая позволяет построить модель реального исполнения бизнес-процесса на основе логов событий. В банке развернута платформа Proceset от команды Инфомаксимум.

Но просто увидеть, как устроен процесс — недостаточно. Важно быстро находить возможности для улучшения и запускать изменения. Поэтому мы встроили искусственный интеллект непосредственно в аналитическую платформу. Теперь ИИ не просто помогает с рутиной, а сам предлагает гипотезы, находит узкие места и позволяет аналитикам быстрее принимать решения. Ниже расскажу, как мы это сделали, с какими вызовами столкнулись и куда движемся дальше.

Читать далее

Пейзажная лирика глазами кода

Время на прочтение6 мин
Охват и читатели6.4K

Где заканчивается слово и начинается образ? Использую Python для поиска особенностей творчества К.Г. Паустовского.

Читать далее

Excel-лайфхаки, о которых не знают «эксперты»

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели49K

Я наблюдал, как мой опытный коллега-финансист целый час колупался в Excel. Он гуру экселя, работает с ним 20 лет. Но увидев, как он печатает формулы, я не выдержал и показал пару простых трюков, от которых он пришёл в восторг.

Это была проблема незнания — незнания о функциях, которые лежат в Excel годами, экономят часы работы, но о которых просто никто не рассказывает.

Потому пишу статью, чтобы собрать лучшие лайфхаки и спасти драгоценные секунды вашей жизни.

Читать далее

Превращаем любой текст в модель знаний — и почему это удобно

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели8.5K

Вечером я смотрел на черновик аудита банковской системы. Семьдесят страниц текста — аккуратных, умных… и беспомощных. В них было всё, кроме главного: куда ткнуть пальцем, чтобы увидеть причину и связанный с ней риск.

Я открыл диаграмму и сделал то, чего раньше не делал с текстами: расщепил его на смысловые атомы. Первая глава превратилась в объект. Раздел — тоже объект. Абзац с фразой «есть прямой доступ к БД» — отдельный узел с ссылкой на страницу. Рядом появился «Факт». От него пошли ребра к «Риску» и «Рекомендации».
И тут случилось простое озарение: документ перестал быть рассказом, он стал моделью.

На второй главе я заметил повтор: тот же паттерн всплывает в другом отчёте. Раньше я бы копировал текст. В графе я просто переиспользовал раздел как объект. Тот самый «Интеграционный ландшафт» стал шаблоном — и без лишних объяснений собрал вокруг себя факты, метрики, контроли.

Когда всё склеилось, вопросы заказчика сменились: не «где это написано?», а «какие риски подтверждены фактами?» и «что закроем первым?». Мы щёлкнули по узлу — и увидели цепочку от цитаты первоисточника до предлагаемого изменения архитектуры. Трассировка появилась сама собой, просто потому что текст больше не был плоским.

Читать далее

Анализируем MLP сообщество на Пикабу или как я спарсил 65 тысяч постов с Pikabu и построил интерактивный дашборд

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели8.7K

Дело было вечером, делать было нечего... Я, как и многие в IT, периодически просматриваю вакансии, чтобы держать руку на пульсе рынка. И знаете, что бросается в глаза? Огромное количество позиций "Аналитик данных". Хоть это и не моя основная специализация (я больше по ML), теоретическая база у меня есть. И вот я подумал: а как бы мне сделать интересный пет-проект в этой области, чтобы и навыки прокачать, и самому не заскучать?

Читать далее

Генерация BPMN с помощью LLM в диалоговом режиме: эксперименты и выводы

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.7K

Авторы свежей научной работы попробовали заставить обычные открытые LLM (от 1B до 70B) генерировать валидный BPMN-XML прямо в чате по текстовому описанию процесса.

Если вкратце, то без дообучения — полный провал. 80% токенов тратится на XML-мусор, модели сыплются на синтаксисе, забывают ветки и галлюцинируют теги. Работает только на больших моделях и то не очень хорошо.

Но вроде просматривается рабочий вариант для генерации BPMN — берем 7–13B модель, дообучаем через LoRA/QLoRA на нормальном датасете, переходим на компактный JSON вместо XML и добавляем Preference Tuning + CoT. Тогда может быть взлетит.

Читать далее

Ozon, Mail, Yandex — все в кризисе IT

Время на прочтение2 мин
Охват и читатели28K

Сегодня я покажу Вам примеры кризиса IT у маститых компаний. Казалось бы, там всё должно быть отлично с функционалом у приложений, но нет — все они заложники кризиса в отрасли. В конце объясню, почему, пока смотрим примеры.

Читать далее

Что такое API Gateway: 10 главных функций и роль в архитектуре микросервисов [полный гайд]

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели17K

Микросервисная архитектура уже давно стала нормой для IT-продуктов. И одну из центральных ролей в таком подходе занимает API Gateway.

В этой статье разберём, что такое API Gateway, зачем он нужен в микросервисной архитектуре, какие 10 ключевых функций он выполняет, и является ли он потенциальной точкой отказа в системе.

Внутри вы найдёте много картинок и примеров схем архитектуры, чтобы объяснения были максимально понятными.

Материал будет полезен системным аналитикам, начинающим архитекторам, разработчикам и тестировщикам, особенно при подготовке к собеседованиям в продуктовые компании.

Оглавление:
Что такое API Gateway
10 главных функций API Gateway
Виды API Gateway
API Gateway - центральная точка отказа
Примеры схем архитектуры с API Gateway в нотации C4 (и не только)
Заключение и полезные ссылки

Читать далее

Подход к построению DWH, основанный на единой инфраструктуре данных Unified Data Infrastructure или модели a16z

Время на прочтение5 мин
Охват и читатели9.5K

В статье рассказываем о подходе к построению DWH на базе единой инфраструктуры данных (Unified Data Infrastructure), разработанной Andreessen Horowitz. 

Разбираемся, почему модель a16z полезна в быстрорастущих компаниях или тех, кто переходит к data-driven управлению.

Читать далее

Как мы разработали решение, чтобы ловить сбои в логировании

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели15K

Привет! Меня зовут Маша Иванова, я старший аналитик монетизации в Авито. В статье расскажу, как несовершенство процесса логирования приводит к ошибкам в данных, как это влияет на достоверность аналитики и что мы разработали, чтобы предотвратить такие проблемы. Материал будет интересен аналитикам, QA-инженерам и разработчикам.

Читать далее

Вы не сможете это развидеть: краткий гайд по определению LLM-текстов на Хабре

Уровень сложностиСредний
Время на прочтение25 мин
Охват и читатели45K

Но сейчас я вижу то, что я не просто не люблю, я ненавижу — нейрослоп. Это статьи, которые полны логических ошибок, не отвечает на вопрос заданный в заголовке, с кучей воды. Это не просто дно копирайтинга, это "снизу постучали". Это не было бы проблемой, будь это плохие авторы. Плохие авторы конечны. LLM может генерировать гигабайты текста, только плати за токены, и весьма недорого — у меня есть несколько проектов, в которых LLM используется для NLP, и там ощутимые обьемы входа и генерации, и знаете сколько я потратил за все время существования этих проектов на работу и тесты? Долларов пять. Дешевый некачественный копирайтинг еще никогда не был ТАК дешев.

Возможно этот слоп замечательно индексируется, но я считаю что это путь в никуда для хабра как сообщества специалистов.
Потому что как только таких статей станет большинство — из сообщества уйдут те самые специалисты, просто потому что ну зачем им читать воду. Я закрываю эти статьи ровно сразу же, как только опознаю ИИ. Если их станет слишком много — я просто уйду. И чем больше уходит активных авторов, тем меньше становится интересных статей, и тем больше в процентном соотношении такой воды, тем больше уходит ядерная аудитория. Замкнутый круг.

Читать далее

Томпсоновское семплирование: «расстрел» A/B-тестов и скрытый потенциал ML

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели5.9K

Всем привет! Меня зовут Саша, работаю ведущим аналитиком в Озон Банке. По мотивам доклада на онлайн-дне МатеМаркетинга'25 было решено написать данную статью, пересказывающую основные идеи доклада о семплировании Томпсона.

Читать далее

Ближайшие события

Пушкин против Ершова: кто победит в дуэли стилей?

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

Сравнил Пушкина и Ершова с помощью Python и пытался найти автора "КОнька-горбунка" среди цифр и кода.

Читать далее

Мощь XBRL в мире данных: автоматизируем проверку отчетности с помощью SQL-формул

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.9K

Всем привет! В первой части https://habr.com/ru/articles/958356/ мы познакомились с форматом XBRL-CSV2, который позволяет упаковать сложность XBRL-отчетности в простые и удобные для обработки CSV-таблицы. Мы обсудили, как данные и их метаописания (маппинг) преобразуются из XML-представления в реляционное.

Но сбор данных — это только половина дела. Вторая, не менее важная часть — это их проверка на целостность, непротиворечивость и соответствие бизнес-правилам. В классическом XBRL за это отвечает формульный слой (Formula Layer). Сегодня мы поговорим о том, как мы превратили эти формулы в исполняемые SQL-скрипты, создав так называемый «слой отделяемых формул».

Читать далее

Чебурахнувшийся робот, а также ИГРОКУБ от Valve

Время на прочтение9 мин
Охват и читатели18K

Самые интересные новости финансов и технологий в России и мире за неделю: российский прямоходящий робот упал на презентации, штрафы за подписку на «неправильные» ТГ-каналы, спецоперация США в Южной Америке, уход Уоррена Баффета, GPT-5.1, а также носок для айфона за 150 баксов.

Читать далее

Как мы искали заманивающие категории

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели5.7K

Однажды в ходе рабочей сессии возник вопрос: а какие позиции в ассортименте дают нам приток новых клиентов? Какие категории, подкатегории, бренды?

Задача пришла ко мне (аналитику), со словами: «что мы можем здесь посчитать?»

Читать далее

Как создать динамическую сводную таблицу на Power BI Report Server

Уровень сложностиСредний
Время на прочтение22 мин
Охват и читатели8.4K

Всем привет! Меня зовут Максим Кушнер, и я занимаюсь BI-разработкой в команде HR-аналитики «Лемана Тех». Дашборды, которые создаёт и поддерживает наша команда, охватывают широкий круг HR-процессов компании, в т. ч. состояние и движение персонала, расходы на персонал, продуктивность, контроль использования рабочего времени, обучение, профессиональное развитие, вовлечённость, внутренние конкурсы, различные рейтинги и др. Пользователями дашбордов могут быть все 40 000+ сотрудников нашей компании – от топ-менеджмента до любого работника в магазине. Соответственно, количество различных срезов данных и бизнес-показателей в дашбордах может исчисляться десятками.

И очень часто наши коллеги говорят: «Ваш дашборд, конечно, классный, но нам хочется самим покрутить данные». Другими словами, пользователи хотят построить аналитику в нужных им разрезах и структуре, которые не предусмотрены разработчиком по умолчанию.

Если не пытаться решить эту боль пользователя, то он просто экспортирует сырые данные из дашборда в Excel, где использует инструмент сводных таблиц (pivot tables) для выстраивания аналитики в нужном ему виде. Но тогда встаёт вопрос: зачем нужен такой дашборд (и его разработчики), если пользователь использует его как перевалочный пункт, а основную ценность извлекает из другого инструмента?

Читать далее

Автоматизация совещания. Что дает и как это сделать?

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели8.7K

В каждой компании независимо от ее размера и вида деятельности проводятся совещания. Многие сотрудники, да и руководители разных уровней считают, что совещания отнимают много времени и зачастую зримого результата от них не наблюдается. Тем не менее они регулярно проводятся. Проведение совещания — это прихоть руководителя компании или что‑то другое, что необходимо для деятельности компании?

Прежде всего давайте посмотрим, для чего и с какой целью проводятся совещания. Это же не просто прихоть руководителя любого уровня, который хочет показать свою значимость перед подчиненными?

Необходимо отметить, что вопрос работы руководителей, находящихся на разных уровнях управления, с точки зрения функционирования механизма управления практически нигде не изучается и не рассматривается по очевидной причине — отсутствие точного и ясного понимания, что такое процесс управления и как функционирует система управления. Существующие исследования, которые имеются и затрагивают этот аспект деятельности руководителей (процесс управления), с одной стороны, отрывочные и не системные, а с другой стороны не ясен вопрос, а что здесь изучать.

Обычно авторы рассматривают человеческие аспекты деятельности руководителей в компании и оценка общих результатов их работы на основе числовых показателей деятельности компании. Это тоже важно и нужно, но без ясного понимания, каким образом руководитель осуществляет свою функцию управления — целенаправленное воздействие на сотрудников, нельзя понять, насколько эффективно его управление, как он это реализует и как это может отразится на результатах деятельности компании.

Читать далее

Discovery и Delivery: Как аналитику перестать тушить пожары и начать создавать ценные продукты

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.9K

Вечные переделки и продукты, не решающие реальные проблемы? Возможно, вашей команде не хватает фазы Discovery.

Из этой статьи вы узнаете, как внедрить фреймворк, который делит работу на две четкие стадии: Исследование (Discovery) и Реализация (Delivery).

На практическом примере разберем:

- Как провести глубинное исследование проблемы до написания первой строчки кода.
- Что входит в процессы бизнес- и системного анализа на каждом этапе.
- Шаги внедрения фреймворка на вашем проекте.

Перестаньте тушить пожары и начните создавать востребованные продукты.

Читать далее