Статьи / Закладки / Профиль Katerina

Екатерина @Katerina_yrs

Аналитик данных

Профиль Публикации Комментарии 12Закладки 34

kzzzr 11 мая 2020 в 11:24

Data Build Tool или что общего между Хранилищем Данных и Смузи

10 мин

26K

Блог компании OTUSBig Data*Data Engineering*SQL*

Технотекст 2020

Из песочницы

На каких принципах строится идеальное Хранилище Данных?

Фокус на бизнес-ценности и аналитике при отсутствии boilerplate code. Управление DWH как кодовой базой: версионирование, ревью, автоматическое тестирование и CI. Модульность, расширяемость, открытый исходный код и сообщество. Дружественная пользовательская документация и визуализация зависимостей (Data Lineage).

Обо всём этом подробнее и о роли DBT в экосистеме Big Data & Analytics — добро пожаловать под кат.

Читать дальше →

+10

Sertakov83 23 мая в 12:11

Гуманизм против «эффективного менеджмента». Почему заботиться о людях выгодно

Простой

22 мин

33K

Управление персоналом*Читальный залБизнес-модели*Научно-популярноеФинансы в IT

Дайджест

Бизнес полон "эффективных менеджеров" и их "лучших практик". Переработки, стресс, политика кнута без пряника, урезания зарплат и премий, обманы и подлоги. Эти практики распространены очень широко, хотя нет никаких доказательств, что они работают. В этой статье я с помощью множества исследований доказываю, что "эффективный менеджмент" серьёзно проигрывает гуманному подходу в управлении людьми.

Буквально: если начать относиться к сотруднику как к взрослому сознательному человеку, заботиться о нём, давать ему адекватную загрузку и дать возможность заниматься интересными для него задачами, платить справедливую зарплату, то и отвечать он будет как взрослый человек: ответственно и старательно иметь высокую производительность труда.

В общей сложности я разбираю 10 самых распространённых ошибок "эффективных менеджеров" и показываю гуманные и более действенные подходы.

Принять выгоды гуманизма в управлении людь

+66

147

itmo_mllab 23 дек 2023 в 18:47

Sparkling: Открытая библиотека для автоматического решения задачи кластеризации табличных и мультимодальных данных

13 мин

8.8K

Блог компании ИТМОМашинное обучение*

Туториал

Если вы полагаете, что фундаментальные исследования всегда скучны и с трудом находят применение на практике, то прочитайте эту статью. Старший научный сотрудник нашей лаборатории Сергей Муравьев, занимающийся автоматизацией решения задач кластеризации, рассказывает о собственном проекте, у которого, кажется, есть всё, что только можно пожелать: научная фундаментальность, хитрые задачи на пути к цели, а также впечатляюще широкие возможности применения.

Источник изображения: commons.wikimedia.org

Почему это круто

Кластерный анализ неформально можно определить как разбиение множества объектов так, чтобы похожие объекты попали в одно и то же подмножество, а объекты из разных подмножеств существенно различались. От обычной классификации по заданным признакам кластерный анализ отличается тем, что не алгоритм, а человек выявляет критерий кластеризации данных. Эта задача относится к классу «обучения без учителя» (англ. unsupervised learning), так как размеченного набора данных или какой-то заведомо известной информации о нём не предоставляется.

У задачи кластеризации нет общепризнанного математически корректного определения. Дело в количестве разнообразных применений: в маркетинге для сегментирования целевой аудитории, в медицине для классификации болезней, в рекомендательных системах при организации баз данных для поисковых запросов, при изучении социальной стратификации, для сегментирования изображений и распознавания образов, при обнаружении и сегментации артефактов различных периодов в археологии и много ещё для чего.

Shmidtk 29 июн 2018 в 20:51

Погружаемся в динамику клиентской базы: когортный анализ и анализ потоков

4 мин

16K

Управление продуктом*Управление продажами*Бизнес-модели*Data Mining*

Из песочницы

Продолжаю цикл статей по анализу продукта (начало)

В прошлой статье я погрузился в анализ выручки и разбил ее на 2 компоненты — MRPU и кол-во клиентов. Сегодня рассмотрим дальнейшие шаги в анализе и разложим на составляющие кол-во клиентов и их динамику.

Теперь общая схема анализа выглядит так:

Когортный анализ позволяет объяснить тенденции, протекающие в клиентской базе и пробрасывает прямой мост в воронку продаж и действия по удержанию и возвращению клиентов.

Читать дальше →

+12

Shmidtk 17 сен 2018 в 21:35

Как и какие кластеры можно выделять в клиентской базе

5 мин

9.8K

Управление продуктом*Бизнес-модели*Аналитика мобильных приложений*Growth Hacking*

Сегодня мы добавим в анализе еще один аспект — сегментацию и кластеризацию клиентской базы. Как я уже не раз писал, анализ клиентской базы остается не полным, если мы смотрим на наших клиентов, как на большую кучу одинаковых людей. Клиенты разделяются на типы и по-разному потребяют продукт. Кто-то покупает часто, но не много, кто-то быстро уходит, кто-то покупает много и часто. Для увеличения эффективности стоит выяснить, какие есть группы клиентов и затем разобраться, как ваши действия позволят вам привлечь нужных вам клиентов. Используют два основных способа разобраться в группам ваших клиентов: эвристики и кластеризация

Метод 1: Эвристики и экспертные оценки

В рамках этого подхода вы на основе опыта, логики использования вашего продукта и клиентских историй, придумываете различные портреты потребителей и затем оцениваете, сколько у вас клиентов попадают под эти определения. Или же можете использовать более численные подходы, основанные на анализе показателей клиентов. Несколько популярных численным эвристик подходов это:

ABC-XYZ

Основная идея разделить клиентов по общему вкладу в вашу выручку и по динамике роста показателей. ABC отвечает за вклад в выручку, XYZ отвечает за стабильность выручки. Это формирует 9 сегментов

Читать дальше →

1 фев в 11:00

Зарплаты IT-специалистов во второй половине 2023: -15% за счет регионов

Простой

5 мин

187K

Блог компании Хабр КарьераИсследования и прогнозы в IT*Управление персоналом*Карьера в IT-индустрииФинансы в IT

Пришло время снова смотреть, сколько зарабатывают IT-специалисты, а точнее — сколько им платили во второй половине 2023.

Напомним, что каждые полгода мы на Хабр Карьере анализируем зарплаты в IT и отслеживаем изменения на рынке. В этот раз мы изучили 34 114 зарплат, приглашаем обсуждать результаты.

Медианная зарплата IT-специалистов сейчас — 141 000 ₽, это на 15% меньше, чем в первом полугодии 2023, когда рост был 10%. В основном на это повлияло снижение зарплат в регионах на 20%, где IT-специалистам сейчас платят в среднем 120 000 ₽. В Москве средняя зарплата — 187 000 ₽, а в Санкт-Петербурге — 150 000 ₽.

Смотреть зарплаты

+110

168

GolovinDS 17 мая 2023 в 14:58

Продуктовая аналитика в Power BI. ABC-XYZ анализ

Средний

7 мин

Блог компании OTUSАнализ и проектирование систем*Управление продуктом*

Туториал

Продуктовая аналитика - это очень важный процесс, который помогает компаниям понимать, как пользователи взаимодействуют с их продуктом или услугой. Этот процесс включает в себя сбор и анализ большого количества данных, которые помогают понять, как пользователи используют продукт, какие функции наиболее популярны, какие маркетинговые кампании наиболее эффективны и многое другое. Благодаря продуктовой аналитике компании могут получить ценные знания, которые помогают улучшить продукт, увеличить количество пользователей и увеличить доходы.

habrahuser 25 фев 2022 в 16:52

ИИ-помощник Copilot от GitHub — как новый инструмент повлияет на работу программистов

5 мин

28K

Блог компании SkillboxПрограммирование*GitHub*Искусственный интеллект

Летом 2021 года Microsoft и GitHub представили нейросетевого помощника программиста Copilot на базе технологий компании Open AI. Авторы проекта научили Copilot премудростям работы с фреймворками и разным языкам программирования. После релиза системы было заявлено, что лучше всего она может работать с такими языками, как Python, JavaScript, TypeScript, Ruby и Go.

Позиционируется Copilot как ассистент разработчика, который помогает найти альтернативные способы решения проблем разработки, улучшить код и изучать новые технологии "на лету", без необходимости погружаться в пучины поисковых систем. Но насколько совершенна эта система и не произойдет ли в один прекрасный момент так, что Copilot заменит большую часть разработчиков? Об этом сегодня и поговорим вместе с Кириллом Кошаевым, старшим тимлидом командных дипломных проектов, а также автором курса “Java-фреймворк Spring” Skillbox.

anastapenko 26 ноя 2023 в 16:30

Сравнение Open Source BI-платформ

Средний

10 мин

20K

Блог компании Axenix (ex-Accenture)Open source*Визуализация данных*Исследования и прогнозы в IT*

Обзор

Привет, Habr!

Меня зовут Остапенко Настя, я лидирую направление BI в компании Axenix. Год назад мы выпустили статью с большим обзором Российского рынка BI. На этот раз мы проведем сравнение трех популярных Open-Source BI-платформ: Apache Superset, Metabase и относительно нового участника - Yandex Datalens, который совсем недавно стал доступен в качестве Open-Source продукта.

+21

it-kod 25 янв 2022 в 13:38

Отправка данных из *.XLSX в Google Sheets

3 мин

9.3K

Google App Engine*Visual Basic for Applications*

Из песочницы

Всем привет! Я обычный пользователь MS Excel и Google Docs, любитель-программист на VBA, App Script и JavaScript.

maovrn 5 ноя 2008 в 10:44

Иерархические (рекурсивные) запросы

10 мин

523K

SQL*

Чтобы понять рекурсию, сначала надо понять рекурсию. Возможно, поэтому рекурсивные запросы применяют так редко. Наверняка вы представляете что такое SQL-запрос, я расскажу, чем рекурсивные запросы отличаются от обычных. Тема получилась объемная, приготовьтесь к долгому чтению. В основном речь пойдет об Oracle, но упоминаются и другие СУБД.

Читать дальше →

+98

159

Clickru 15 июн 2022 в 12:08

Сервисы сквозной аналитики 2022 года

10 мин

14K

Блог компании Click.ruВизуализация данных*Веб-аналитика*Интернет-маркетинг*Повышение конверсии*

Сквозная аналитика – волшебная палочка, которая делает вжух и превращает данные по рекламе, заказам, звонкам и клиентам из разрозненных таблиц в единую связанную систему. Даже если раньше вы работали с электронной коммерцией в счетчиках, сквозная все равно способна удивить. Там, где раньше в конце воронки были бездушные цифры, теперь появляются статусы заказов и конкретные живые клиенты.

Если вы готовы подключать сквозную аналитику и выбираете систему, то читайте нашу подборку. Мы постарались кратко и простым языком расписать особенности популярных в России сервисов.

-1

Xapulc 23 авг 2023 в 11:21

BI-аналитика на коленке: делаем веб-аналитику в DataLens

Средний

4 мин

6.4K

Визуализация данных*Python*Веб-аналитика*

Из песочницы

Привет. Я Витя, продуктовый аналитик в Тинькофф Страховании. Как и многие мои коллеги, я привык работать с готовыми мастер-системами, готовыми ETL-процессами, готовыми инструментами работы с данными. Всё это я уже давно воспринимаю как должное.

Однако что делать, если ты - человек с большим бэкграундом в аналитике, а перед тобой pet-project, где хочется тратить на всё 0 рублей, на проекте пару рук и ещё ничего не настроено?

GromovBI 20 окт 2020 в 19:25

Рейтинг знаков зодиака среди Великих людей мира

3 мин

25K

Big Data*Визуализация данных*Занимательные задачки

Recovery Mode

Однажды мы размышляли о рейтинге знаков зодиака среди Великих людей. Задачу выполнили и представляю результаты на ваш суд.

Со скорбью замечу, что Весы (ЭТО Я!) на последнем месте… Хотя что-то по данным мне кажется, что есть аномалии. Как-то подозрительно мало Весов!

Читать дальше →

MaxRokatansky 21 окт 2022 в 14:26

Дерево метрик — как построить, с чего начать?

3 мин

25K

Блог компании OTUSУправление продуктом*

Самый популярный вопрос у моих учеников — «как построить дерево метрик и с чего начать?», а следом за ним — можно ли сформировать бэклог продукта без дерева метрик.

Дерево метрик — это декомпозированная цель компании.

pvdubinin 26 сен 2023 в 11:00

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

7 мин

53K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureOpen source*Визуализация данных*

✏️ Технотекст 2023

Сегодня мы опубликовали на GitHub под открытой лицензией Apache 2.0 исходный код Yandex DataLens — сервиса для анализа и визуализации данных. Теперь использовать опенсорс-версию DataLens может любой желающий и в любой инфраструктуре.

Меня зовут Павел Дубинин, вместе с Гаджи Гаджиевым мы в Yandex Cloud занимаемся развитием DataLens. Сегодня расскажем, какие задачи он помогает решать разным пользователям, какие возможности открываются с выходом в опенсорс и что можно развернуть у себя прямо сейчас.

+113

maxim_babenko 20 мар 2023 в 13:57

YTsaurus: основная система для хранения и обработки данных Яндекса теперь open source

14 мин

59K

Блог компании ЯндексOpen source*C++*Big Data*

✏️ Технотекст 2023

Привет! Меня зовут Максим Бабенко, я руковожу отделом технологий распределённых вычислений в Яндексе. Сегодня мы выложили в опенсорс платформу YTsaurus — одну из основных инфраструктурных BigData-систем, разработанных в Яндексе.

YTsaurus — результат почти десятилетнего труда, которым нам хочется поделиться с миром. В этой статье мы расскажем историю возникновения YT, ответим на вопрос, зачем нужен YTsaurus, опишем ключевые возможности системы и обозначим область её применения.

В Github-репозитории находится серверный код YTsaurus, инфраструктура развёртывания с использованием k8s, а также веб-интерфейс системы и клиентский SDK для распространённых языков программирования — C++, Java, Go и Python. Всё это — под лицензией Apache 2.0, что позволяет всем желающим загрузить его на свои серверы, а также дорабатывать его под свои нужды.

+217

Sergey_Kardashev 8 сен 2022 в 16:21

Как не завести врагов, разрабатывая гайдлайны дэшбордов

17 мин

3.5K

Блог компании t2Визуализация данных*Дизайн

Спойлер: превратив потенциальных врагов в своих союзников.

Привет. Меня зовут Сергей Кардашев, я менеджер по продуктам и инструментам управления данными в Tele2.

Я расскажу, как в большой компании максимально безболезненно внедрить стандарты визуализации данных.

kullfar 15 мар 2016 в 09:29

ScribeJava — даже ваша бабушка сможет работать с OAuth

10 мин

30K

Блог компании hh.ruJava*Open source*Веб-разработка*Программирование*

Именно этой фразой нас приветствует библиотека для работы с OAuth — ScribeJava (https://github.com/scribejava/scribejava). Если быть точнее, то фраза звучит так: “Who said OAuth/OAuth2 was difficult? Configuring ScribeJava is so easy your grandma can do it! check it out:”.

И это действительно похоже на правду:

OAuth20Service service = new ServiceBuilder().apiKey(clientId).apiSecret(clientSecret)
    .callback("http://your.site.com/callback").grantType("authorization_code").build(HHApi.instance());
String authorizationUrl = service.getAuthorizationUrl();
OAuth2AccessToken accessToken = service.getAccessToken(code);

Готово! Этих трех строчек достаточно, чтобы начать делать OAuth запросы. А сам OAuth запрос можно будет сделать так:

OAuthRequest request = new OAuthRequest(Verb.GET, "https://api.hh.ru/me", service);
service.signRequest(accessToken, request);
String response = request.send().getBody();

Данные о пользователе у нас в руках (в переменной response). И ни капли понимания, как в деталях работает OAuth. Хотим асинхронные http-запросы? Нам хватит тех же трех строчек. Ниже рассмотрим это на примере.

Читать дальше →

+27

shurik2533 14 июн 2016 в 11:26

API hh.ru. Быстрый старт

4 мин

69K

Блог компании hh.ruAPI*Открытые данные*Программирование*Веб-разработка*

Туториал

Полагаю, некоторые из вас знают, что у hh.ru есть открытый API (мы рассказывали о нем тут и тут), который используем не только мы, но и сторонние разработчики. С его помощью, например, можно очень детально анализировать рынок на больших объемах актуальных данных.

Я задумал серию из двух статей: в этой покажу, как можно быстро и просто начать использовать API, а в следующей сделаю небольшой проект, рекомендующий актуальные вакансии по вашему резюме.

Читать дальше →

+14

Data Build Tool или что общего между Хранилищем Данных и Смузи

Гуманизм против «эффективного менеджмента». Почему заботиться о людях выгодно

Sparkling: Открытая библиотека для автоматического решения задачи кластеризации табличных и мультимодальных данных

Погружаемся в динамику клиентской базы: когортный анализ и анализ потоков

Как и какие кластеры можно выделять в клиентской базе

Метод 1: Эвристики и экспертные оценки

ABC-XYZ

Зарплаты IT-специалистов во второй половине 2023: -15% за счет регионов

Продуктовая аналитика в Power BI. ABC-XYZ анализ

ИИ-помощник Copilot от GitHub — как новый инструмент повлияет на работу программистов

Сравнение Open Source BI-платформ

Отправка данных из *.XLSX в Google Sheets

Иерархические (рекурсивные) запросы

Сервисы сквозной аналитики 2022 года

BI-аналитика на коленке: делаем веб-аналитику в DataLens

Рейтинг знаков зодиака среди Великих людей мира

Дерево метрик — как построить, с чего начать?

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

YTsaurus: основная система для хранения и обработки данных Яндекса теперь open source

Как не завести врагов, разрабатывая гайдлайны дэшбордов

ScribeJava — даже ваша бабушка сможет работать с OAuth

API hh.ru. Быстрый старт

Информация

Специализация