Все потоки

Системный и бизнес-анализ

СтатьиПостыНовостиХабыАвторыКомпании

koanse 13 янв в 04:50

Ускорение разработки с ИИ на примере DAX и Power BI

Простой

6 мин

3.7K

Искусственный интеллектВизуализация данных * SQL * Big Data *

Кейс

Сезон ИИ в разработке

Привет, Хабр! С каждым годом ИИ способен решать более сложные задачи, одной из задач является понимание DAX, связанных предметных областей и генерация кода. Можно выделить несколько задач, которые не являются первостепенными, тем не менее актуальны для анализа или работы в Power BI, например, от простейших — создание клиента для выполнения DAX запросов в Power BI из произвольной среды (например, из .NET приложения) и импорт метаданных TOM модели, до более сложных задач — экспорта схемы данных и самих данных из Power BI в произвольную СУБД (понятно, что такая задача не всегда актуальна с точки зрения ETL, т.к. проще взять данные из исходных источников, а не из Power BI, но польза решения задачи «интуитивно понятна» пользователю) и задач генерации SQL запросов на основе DAX для заданной СУБД, причем результаты сгенерированного SQL должны совпадать с результатами DAX запросов.

Интересующимся применением ИИ на примере DAX из Power BI — добро пожаловать под кат :)

Читать далее

+1

mozzalerra 12 янв в 19:30

Как делать дашборды так, чтобы их поняла даже твоя любимая бабушка?

Простой

4 мин

8.6K

Визуализация данных * Интерфейсы *

Из песочницы

Рассказываю и наглядно показываю как делать понятные и красивые дашборды без лишнего шума, которые ответят на вопросы пользователей, а не создадут новые.

Читать далее

+7

ivan-petrov-analyst 12 янв в 13:55

Оценка эффекта релиза по истории метрики: causal impact без AB теста

Средний

5 мин

5.4K

Python * Статистика в ITАналитика мобильных приложений *

После релиза метрика почти всегда меняется. Иногда это реальный эффект изменения, иногда - сезонность, маркетинг, внешний фон или просто шум. Если AB теста не было, а решение все равно нужно принимать, остается вопрос: как аккуратно оценить влияние релиза по истории метрики и не обмануться простым сравнением до и после.

В статье разбираю практический подход causal impact для случая, когда у нас есть одна метрика во времени и понятная дата изменения. Строим контрфакт (counterfactual) - прогноз того, какой была бы метрика без релиза - и сравниваем его с фактом. На этой основе считаем эффект в абсолютных значениях, накопленный эффект и относительный вклад в процентах.

Отдельное внимание уделяю проверкам, без которых такой анализ может превратиться в тыкву: качество прогноза на периоде до изменения, учет зависимости по времени через block bootstrap, устойчивость к выбору окна и плацебо даты, которые помогают понять, выделяется ли реальный эффект на фоне ложных интервенций.

Материал ориентирован на продуктовые задачи: когда релиз уже сделан, данные есть, а надежной оценки эффекта нет. В следующей части перейдем к более частому сценарию, когда изменение затронуло не всех, и вместо одной линии метрики у нас появляется набор линий по группам (географии, сегменты, кластеры). Там разберем синтетический контроль и diff-in-diff и частые ошибки, которые встречаются в таких данных.

Читать далее

0

Product_Analyst 12 янв в 07:00

AB-Labz — менеджмент и анализ продуктовых экспериментов

Простой

7 мин

5.1K

Обзор

Привет, меня зовут Пётр, я занимаюсь продуктовой аналитикой уже около 12 лет, специализируюсь преимущественно на продуктовых рисерчах и экспериментальной аналитике.

Я работал в разных командах, и везде был разный подход к экспериментам. Разные сервисы, которые используются на ключевых этапах жизни гипотезы, разный формат документации, несогласованность в рассчётах, костыли в сложных или нестандартных дизайнах.

Эта боль и легла в основу проекта.

Недавно мы с командой выпустили в открытую бету b2b SaaS платформу для менеджмента и анализа продуктовых экспериментов.

Читать далее

0

RationalAnswer 12 янв в 05:21

Планы Трампа после Венесуэлы, а также бикини-скандал с Grok

9 мин

14K

Финансы в ITКриптовалютыИскусственный интеллект

Дайджест

Самые интересные новости финансов и технологий в России и мире за неделю: последние новости об операции США в Венесуэле, исход миллиардеров из Калифорнии, Яндекс Банк не смог раздать кэшбек из-за сбоя, Брижит Макрон засудила хейтеров, умная ручка и ChatGPT Health от OpenAI, а также скандал с бикини-раздеванием от Grok.

Читать далее

+26

datahub 11 янв в 17:56

Почему аналитика — один из самых рациональных способов войти в IT сегодня

3 мин

14K

Статистика в ITКарьера в IT-индустрии

Мнение

Я работаю продуктовым аналитиком уже много лет и за это время видел, как рынок несколько раз менял ориентиры. Профессии становились «самыми востребованными», потом перегревались и теряли привлекательность. Если смотреть на происходящее без эмоций и громких обещаний, аналитика остаётся редким примером направления, где вход в профессию остаётся относительно доступным, а ценность специалиста для бизнеса ощущается довольно быстро.

Аналитика не выглядит эффектно со стороны. В ней нет визуального результата, как в дизайне, и нет ощущения инженерной сложности, как в разработке. Зато есть постоянная работа с реальностью продукта: с тем, что происходит с пользователями, деньгами и решениями. Пока компании принимают решения на основе данных, аналитики будут частью этого процесса.

Читать далее

+7

lws0954 11 янв в 09:59

Правильный вопрос, но безумный ответ

5 мин

5.3K

Параллельное программирование *

Ретроспектива

Просматривая на Хабре поток «Параллельное программирование», не верится, что на дворе «образованный век». Все против этого. Особенно статьи типа «Три способа менять один объект из нескольких потоков. Больше нет».

Ныне любой, кому поступило «поручение» провести ту или иную идею в массы, может городить любую чушь. А «народ» будет верить. Жечь свечи, восклицать аллилуйя, бить поклоны, рукоплескать и, размазывая слезы, биться в экстазе от восторга, восхищения и прозрения.

Ну, а здесь на Хабре, ставить «плюсы». Каждый, конечно, имеет право на свою позицию. Но в чем-то хочется разобраться, понять и, возможно, простить. Накопилось, наверное…

Упомянутая статья - «гром среди ясного неба»! Ни кто до этого не знал, что делать с одним объектом, а тут вдруг - прозрение! Буквально на раз или, что точнее, на три. Есть ровно три варианта, после чего «объекту» уже не скрыться от «потоков», у которых до него дотянуться руки. Ровно три! Меньше – да, «больше нет»!

Люди, вы пытаетесь вникнуть в смысл прочитанного?! Спросите, где он? А вот это уже другой вопрос. На, который, к счастью, есть ответ… В научном познании мира.

Однако, процитирую отрывок из краеугольной, судя по реакции «народа», статьи...

Читать далее

-7

Alena_Les 9 янв в 22:44

Создаем пет-проект по аналитике в связке с GitHub Actions. Часть 2

Простой

12 мин

11K

Управление проектами * Открытые данные * Хранение данных * Аналитика мобильных приложений *

Кейс

Recovery Mode

Привет, Хабр! Продолжаю обозревать GitHub Actions на примере пет проекта для аналитика.

Статья будет полезна начинающим аналитикам в поисках хорошего проекта для своего портфолио. В этой части разбираю подход к выбору проекта и источника данных, к сбору и анализу данных и представлении результатов своей работы.

Читать далее

+3

geoandreev 9 янв в 18:14

Multi-Curve Framework: Теория и практика оценки кросс-валютных свопов (CIRS)

Сложный

9 мин

8.5K

Финансы в ITМатематика *

Кейс

О том как участники финансового рынка оценивают справедливую стоимость сложных деривативов на примере сделки валютно-процентный своп.

Лучше не читать далее...

+3

Ivan_Yakovlev_G 9 янв в 17:36

Взгляд разметчика данных

Простой

5 мин

8.4K

Data Mining * Data Engineering * Управление проектами * Машинное обучение * Краудсорсинг

Мнение

Дисклеймер: ниже будет описан личный опыт и точка зрения человека-исполнителя. Устройство всей процедуры разметки в статье не раскрывается. Все совпадения сущностей случайны. Названия компаний не упоминаются в целях соблюдения NDA. В статье не будут подниматься вопросы оплаты труда и разбираются только основные рабочие моменты.

Всем добрый день!

Одно время я работал разметчиком данных на разные компании и довольно долго, примерно 5 лет. Так как компании были разные, то и размечать приходилось разное: сайты, картинки, звуки. Только с видео не довелось поработать. С одной стороны, эта работа довольно рутинная и однообразная. С другой стороны - нет. Потому что на разметку попадались разные документы с разной целью. Однако целью данной статьи не документы, а общие закономерности и подводные камни на этом нудном пути с точки зрения непосредственного исполнителя.

Разметка данных используется для обучения различных алгоритмов, чаще всего на основе нейросетей. Она применяется разных отраслях, включая такие сложные, как медицина. Без разметки невозможно обучение моделей, так как нет явной целевой переменной и от качества разметки напрямую зависит качество модели. Я имею опыт работы Data Scientist-ом и даже диплом получил, поэтому понимаю, насколько важна разметка. Более того, сейчас, работая с медицинскими датасетами, я всё чаще задумываюсь: а насколько вообще можно доверять той или иной разметке, даже если её ставит врач?

Итак, приступим к теме нашего разговора.

Читать далее

+6

kmoseenk 9 янв в 16:52

Реляционные шарады: превращаем фильмы в таблицы

Средний

10 мин

10K

Блог компании OTUSБазы данных * Python *

Перевод

Реляционная модель обычно ассоциируется с аккуратными строками и столбцами, но на практике ей регулярно пытаются скормить то, для чего она будто бы не предназначена. В этой статье — эксперимент на грани здравого смысла: разложить фильм на пиксели, превратить кадры в строки и посмотреть, что получится, если к видео применить привычный SQL. Без обещаний пользы и универсальности — зато с честным разбором того, где такой подход неожиданно работает, а где начинает сопротивляться сама природа данных.

Перейти к материалу

+12

Alrighty 8 янв в 15:37

Как ИИ меняет работу системного аналитика: большой обзор на возможности моделей, советы для новичков и немного прогнозов

Простой

20 мин

16K

Блог компании НетологияПроектирование API * Карьера в IT-индустрииИскусственный интеллектАнализ и проектирование систем *

Заходишь на Хабр.Карьеру, открываешь вакансии системных аналитиков, а в требованиях всё как обычно: построение информационных систем, понимание архитектуры, ТЗ, BPMN, базовый SQL. Нигде ни слова о знании GPT или умении промптить. Формально профессия как будто не изменилась.

Тем временем в свежем отчёте OpenAI о корпоративном применении ИИ опубликовали статистику: использование ChatGPT в корпоративной среде за год выросло в 8 раз, а объём запросов от одного человека — в среднем на 30%.

Мы решили выяснить, что происходит в полях, и поговорили с двумя коллегами по цеху: системным архитектором из финтех-продукта и аналитиком с опытом работы и в госсекторе, и в корпоративных продуктах. Спросили их о самом важном: какие задачи быстрее делать с ИИ, где он пока бесполезен и что вообще стоит прокачивать аналитику, чтобы не выпасть из профессии, пока всех грозятся заменить моделями.

Читать далее

+8

parusimore 8 янв в 12:20

Нечеловек, который изменил всё: как эффективно работать с ИИ, на примере создания схем бизнес-процессов в BPMN

Простой

7 мин

9.2K

Искусственный интеллектИсследования и прогнозы в IT * Машинное обучение * Карьера в IT-индустрии

Кейс

Сезон ИИ в разработке

Отношение к ИИ, как к помощнику, у многих людей напоминает отношение суровых сибирских лесорубов к японской лесопилке из старого анекдота. Лесорубы совали в неё всё более толстые брёвна — и машина со всем справлялась. Тогда в неё засунули железный лом. Этого лесопилка уже не пережила. А лесорубы сделали вывод: ничего-то эта заморская техника не может.

С ИИ часто происходит то же самое. Либо «сделай всё и сразу», либо «ну нет, слабоват ты пока для серьёзных задач». А что если ИИ способен решить вашу задачу пусть не полностью, но процентов так на 80–90? И вы сами в этой сфере тоже несовершенны? Но области ваших ошибок с ИИ не совпадают! Что если, грамотно объединив с ним усилия, можно получить результат, близкий к 100% успеха?

Примерно так, как в фильме Moneyball (Человек, который изменил всё). Там три узкоспециализированных (а потому по отдельности посредственных) игрока, играя слаженно, смогли превзойти на поле одного игрока-суперзвезду. Который, разумеется, стоил в разы дороже их троих вместе взятых.

Именно такую технологию я и хочу передать в этой статье — эффективное использование пока ещё несовершенного ИИ-помощника. На примере создания схем бизнес-процессов. Пример выбран не случайно: на получившихся схемах очень наглядно видно наше с ИИ несовершенство по отдельности — и качественный результат, достигнутый совместно.

Читать далее

+2

strannik96 8 янв в 07:00

Цифровой рубль: что это такое и как он изменит платёжную систему

Средний

7 мин

21K

Платежные системы * Финансы в ITБизнес-модели * Криптовалюты

Аналитика

Идея написать эту статью возникла у меня не спонтанно. Проект цифрового рубля привлёк моё внимание ещё в тот период, когда я работал в Федеральной налоговой службе. Теперь, будучи человеком свободным от обязательств госслужащего я решил поглубже разобраться в этой теме и высказать свое мнение и видение того как Цифровой рубль способен трансформировать всю систему денежных расчетов.

В статье я опишу как цифровой рубль встроен в существующую экономическую и управленческую модель, какие задачи он решает для государства и какие последствия может иметь для бизнеса и граждан, в том числе с точки зрения контроля финансовых потоков и через фискальные механизмы.

Я предлагаю рассматривать цифровой рубль не как абстрактную валюту будущего, а как инфраструктурное решение, способное изменить логику платёжных отношений и баланс ролей в финансовой системе.

Читать далее

+2

strannik96 7 янв в 08:00

АУСН: налоговый оазис или цифровой концлагерь для бизнеса?

Простой

6 мин

11K

Бизнес-модели * Финансы в ITIT-компанииАлгоритмы *

Обзор

Автоматизированную упрощённой систему налогообложения (АУСН) подают как максимально простой и удобный режим: никаких деклараций, минимум отчётности, автоматический расчёт налогов. Но с другой стороны, может возникнуть ощущение, что речь идёт не просто о новом специальном налоговом режиме, а о принципиально иной модели налогового контроля.

Я хочу посмотреть на АУСН именно с этой точки зрения: как на систему, к которой государство целенаправленно стремится, и которая, по сути, может стать (а по моим наблюдением уже становится) будущим налогового администрирования для малого бизнеса, а в перспективе и для среднего.

Для тех, кто читает меня впервые: за плечами почти 12 лет работы в ФНС, поэтому обозревать этот налоговый спецрежим я буду с позиции бывшего налоговика.

Читать далее

+6

EvgMich 6 янв в 16:19

Как мы ввели автосертификацию дашбордов в Авито

Средний

7 мин

10K

Блог компании AvitoTechBig Data * Визуализация данных * Анализ и проектирование систем *

Кейс

Привет, Хабр! Меня зовут Евгений Мичурин, я senior BI-разработчик в Авито.

Если у вас BI растёт хаотично — вы наверняка сталкивались с тем же, что и мы: сотни дашбордов, разный стиль, неясные владельцы, дублирующиеся датасеты. В какой-то момент это превращается в хаос, где пользователи не доверяют данным, а self-аналитика становится невозможной.

Мы решили навести порядок и создали фреймворк автосертификации BI‑отчётов. В этой статье рассказываю, как он работает, какие критерии мы выбрали и как мотивировали команды участвовать в процессе.

Читать далее

+31

negrbluad 6 янв в 09:03

Что такое фандинг арбитраж и как сделать автоматический поиск спредов

Средний

10 мин

9.4K

Финансы в ITPython * Алгоритмы * КриптовалютыАнализ и проектирование систем *

Обзор

На крипторынке есть редкий класс стратегий, где не нужно угадывать направление цены. Нет анализа свечей, индикаторов или прочей тяжелой математики.

Одна из таких стратегий - арбитраж ставок финансирования (funding rate arbitrage). Это безопасная стратегия с небольшим количеством рисков, которая доступна каждому. Из навыков тут при наличии автоматической системы тут нужно лишь умение открывать позиции на разных биржах.

Этот материал - не обещание лёгких денег. Это разбор реальной рабочей системы, которую я сначала писал для себя, а позже обернул в Telegram-бота. Итоговый продукт - полноценная рабочая торговая система, которая отслеживает активы на биржах, получает информацию о фандинге и в случае, если расхождение можно отработать и заработать на нём - присылает уведомление с помощью телеграм бота.

Читать далее

+6

datahub 5 янв в 17:15

Выбор статистического метода для A/B-теста: практическое руководство

Средний

4 мин

9.5K

Python * Статистика в IT

Из песочницы

Привет! Меня зовут Денис. Уже юолее 5 лет работаю Senior Product Analyst в крупнейших IT-компаниях России, включая Тинькофф. Разрабатывал системы аналитики с полного нуля, провёл огромное количество A/B тестов и знаю всю внутреннюю кухню больших корпораций изнутри.

Я совершил множество ошибок на своём пути – и теперь здесь, чтобы помочь именно тебе их избежать и пройти этот путь быстрее!

A/B-тесты давно стали стандартным инструментом в продуктовой и маркетинговой аналитике. Но на практике большинство ошибок происходит не на этапе запуска эксперимента, а при анализе результатов. Чаще всего причина в том, что статистический метод выбирается «по привычке», без учёта типа метрики и свойств данных.

В этой статье я собрал практическую логику выбора методов анализа A/B-тестов. Без углубления в теорию, но с пониманием, почему в одном случае работает χ², а в другом t-test может привести к неверным выводам.

Читать далее

+6

koanse 5 янв в 08:41

Особенности ALL как модификатора CALCULATE и как «создателя» новой таблицы в FILTER

6 мин

5.8K

Big Data * SQL * Визуализация данных *

Кейс

DAX содержит гибкие возможности фильтрации, и важными функциями являются ALL и REMOVEFILTERS. При использовании ALL и REMOVEFILTERS в качестве модификатора CALCULATE они ведут себя одинаково, т.к. в этом случае REMOVEFILTERS является псевдонимом ALL, однако ALL в FILTER возвращает «новую таблицу» и очищает влияние всех фильтров, что важно учитывать с точки зрения производительности и результатов.

Интересующимся особенностями ALL и сравнением ALL и REMOVEFILTERS — добро пожаловать под кат :)

Читать далее

+4

GodAdministrator 4 янв в 11:20

Люди! Делайте же нормальные файлы EXCEL! (ч.3)

Средний

5 мин

13K

Microsoft ExcelВизуализация данных * Финансы в ITУдалённая работаУправление проектами *

Туториал

Пойми, что может Excel!

Вот прям как в знаменитом меме «А что, разве так можно было?!!!»

Профессионалы Экселя не знают программу. Они её ПОНИМАЮТ!

Читать далее

+3

1 2 ...

30

31 32 ...