Pull to refresh
5
0
Ольга Плюта @Analytique

Product data analyst | Ex-Yandex

Send message

Как объяснить градиентный спуск вашей маме: простое руководство

Level of difficultyEasy
Reading time7 min
Views20K

Градиентный спуск лежит в основе большинства методов AI/ML. Звучит как-то странно и пугающе. Спуск? Блин, надеюсь, мне не придется прыгать с парашютом...😒

Не волнуйтесь, возможно, все же придется прыгнуть, но только если вы этого захотите. Это объяснение способен понять даже ваш 10-летний племянник.

Читать далее
Total votes 24: ↑22 and ↓2+22
Comments13

Многорукие бандиты в задаче ритейла

Reading time9 min
Views4.1K

В настоящее время набирают популярность модели Reinforcement Learning для решения прикладных задач бизнеса. В этой статье мы рассмотрим подмножество этих моделей, а именно многоруких бандитов (multi-armed bandits). Также мы:

- обсудим, какие задачи теоретически могут быть решены с помощью этих моделей;
- рассмотрим некоторые популярные реализации моделей многоруких бандитов;
- опишем симулятор ценообразования, применим эти алгоритмы в нём и сравним их эффективность.

Читать далее
Total votes 11: ↑9 and ↓2+8
Comments5

RFM-сегментация в оптимизации CRM-стратегий

Reading time12 min
Views2.4K

Сегодня мы продолжим погружение в тему оптимизации CRM маркетинга при рассылке промо-предложений и рассмотрим опыт применения RFM-сегментации для решения этой задачи в рамках сервиса доставки еды и продуктов питания Delivery Club, ныне присоединившегося к группе компаний крупного e-com сервиса.

Читать далее
Total votes 4: ↑4 and ↓0+4
Comments2

Эмоциональное восприятие шрифтов. Метод семантического дифференциала

Level of difficultyMedium
Reading time8 min
Views5.2K

Я занимаюсь в Иви UX-исследованиями. Однажды ко мне пришел директор по дизайну с запросом: “Разрабатываем новый шрифт для внешних коммуникаций. Хотим, чтобы вызывал у людей эмоции, соответствующие новой платформе бренда. Сделали несколько вариантов. Помоги понять, действительно ли люди будут испытывать больше эмоций по сравнению с нашим нейтральным шрифтом для интерфейсов, и выбрать наиболее подходящий”. 

С подобной задачей я никогда раньше не сталкивалась, поэтому первая моя мысль была: “Да ладно, эмоции и шрифты? Люди вообще не заметят разницу”. Вторая — про семантический дифференциал. 

В этой статье я поделюсь методикой и результатами исследования шрифтов с точки зрения эмоций методом семантического дифференциала.

Читать далее
Total votes 10: ↑9 and ↓1+10
Comments4

Две цивилизации. Почему пользователи технологий из мегаполисов и небольших городов живут на разных планетах

Level of difficultyEasy
Reading time9 min
Views62K


Этим летом ко мне приезжал погостить дальний родственник из небольшого городка. Полюбоваться на белые ночи и разведенные мосты, а заодно — пообщаться вживую с коллегами по удаленной работе. Мы оба айтишники, и я не был удивлен тем, что у нас отыскалось много общих интересов. Гораздо больше меня поразили различия в нашем отношении к привычным технологиям: порой складывалось ощущение, что мой гость и я — обитатели разных планет. Я решил разобраться в причинах этого явления, и чем больше погружался в изучение вопроса, тем сильнее убеждался: мне очень многое неизвестно о жизни таких же, как я сам, технарей за пределами мегаполисов.
Читать дальше →
Total votes 74: ↑65 and ↓9+80
Comments529

Рекомендации по ведению SQL-кода

Level of difficultyEasy
Reading time8 min
Views21K
В этом материале разберем общие рекомендации по ведению SQL-кода на примере СУБД MS SQL (T-SQL). Однако, многие пункты можно также применить и к другим СУБД.
Читать дальше →
Total votes 35: ↑31 and ↓4+47
Comments382

Бесконечные проверки – к успешному развитию: как мы обеспечиваем качество данных

Reading time5 min
Views3.2K

Привет, Хабр! Меня зовут Яна и я работаю Data Quality в департаменте развития аналитики "Цепочки поставок и поддерживающие функции" X5 Tech. В этой статье мы с моей коллегой Наташей, менеджером по качеству данных, решили рассказать о мониторинге качества данных большинства отчётов нашей команды.

На первый взгляд может показаться, что проверять таблицы – задача рутинная и однотипная, но это не так, ведь все данные имеют свои особенности, а значит и проверки для них зачастую создаются уникальные. Статья, как нам кажется, будет полезна тем, кто интересуется качеством данных, ищет подходы к мониторингу или хочет больше узнать о работе DQ в целом.

Читать далее
Total votes 8: ↑6 and ↓2+4
Comments13

Как дневник эмоций помог мне настроить процессы в рабочей команде

Level of difficultyEasy
Reading time8 min
Views3.5K

Добрый день! На связи Григорий Фрольцов, Senior Product Manager в СберМаркете. Хочу поделиться мыслями, как продакт может прокачать свой эмоциональный интеллект, гармонизировать процессы в команде и тем самым повысить её эффективность.

У меня есть теория: эмоциональный интеллект — это двигатель экстремального новаторства. Дружеская и эмоционально безопасная обстановка гарантирует вовлеченность команды в процесс. И наоборот, когда нет никого, кто мог бы смягчать щекотливые ситуации и поднимать команде настроение, сотрудники не выкладываются на 100% и могут не закрывать ключевые задачи в нужные сроки.

«А причем здесь дневник эмоций?» — спросите вы. Расскажу обо всём по порядку.

Читать далее
Total votes 18: ↑13 and ↓5+8
Comments5

Как выбрать тимлида в команду

Level of difficultyEasy
Reading time7 min
Views12K

Кого обычно ставят тимлидом? По каким правилам и критериям происходит выбор? Как стать именно таким кандидатом, которого назначат на эту позицию?

Это и многое другое в статье. Прошу под кат.

Читать далее
Total votes 27: ↑19 and ↓8+17
Comments11

Как работать со словарями данных и оптимизировать запросы в ClickHouse

Reading time11 min
Views7.4K

Приветствуем! На связи вновь Глеб Кононенко и Алексей Диков — разработчики из Лиги Цифровой Экономики. Ранее мы уже немного рассказывали про наш опыт работы с распределенными таблицами в ClickHouse в этой статье.

Сегодня хотим поделиться опытом оптимизации запросов и работы со словарями данных. Используемая версия ClickHouse: 23.8.7.24

Читать далее
Total votes 6: ↑4 and ↓2+5
Comments3

Чего не знают айтишники? Как мы провели IT-кроссворд и нашли ответы на все вопросы

Reading time3 min
Views4.4K

Прошел почти месяц, как завершился IT-кроссворд Selectel — онлайн-соревнование для любителей разработки и тестирования, ML и Data Science, сетевых и серверных технологий. В нем приняли участие около 200 человек, из которых более половины — пользователи Хабра.

В течение четырех дней участники отвечали на вопросы из разных областей. В каждой номинации нашлись свои победители и призеры. Некоторые из них даже сумели решить кроссворд полностью. Но были и вопросы, омраченные тайной.

Хотим рассказать, как мы запустили первый и самый масштабный IT-кроссворд на Хабре, и поделиться статистикой о том, какие вопросы оказались самыми сложными. Интересно? Тогда добро пожаловать под кат!
Читать дальше →
Total votes 29: ↑26 and ↓3+35
Comments0

Зачем мне пылесос с ананасом или как оценить корректность рекомендательной системы

Level of difficultyEasy
Reading time10 min
Views2.3K

Привет, Хабр!

На связи участница профессионального сообщества NTA Ульянова Дарья.

Каждый день, выполняя рутинные действия, мы сталкиваемся с рекомендательными системами. Их предложения часто попадают прямо в цель, и иногда создается впечатление, что кто‑то читает твои мысли.

Сегодня буду разбираться с тем, как оцениваются рекомендательные системы, какие метрики качества используются, и как затем измеряется эффективность их работы для бизнеса. Это полезно при оценке сервисов с рекомендательными системами, ведь часто нам приходят чисто статистические данные, в которых надо разобраться, и дать объективную оценку проекту.

К метрикам recsys
Total votes 3: ↑3 and ↓0+3
Comments14

Что в коробке: определение цели человека по его действиям

Reading time7 min
Views2.3K


Любое движение, совершаемое человеком, имеет какую-то цель. Чаще всего результатом движения должно быть какое-то изменение в окружающей среде. К примеру, человек может потянуться рукой к чашке, чтобы сделать глоток кофе. Изменение положения чашки в пространстве является прямым результатом осознанного действия человека. Однако есть действия, которые нацелены на сбор информации, т. е. они обладают эпистемическими целями. Наблюдая за действиями человека, мы можем весьма точно предугадать его цель, если она относится к физическому изменению среды. Но можем ли мы узнать по движениям человека, какую информацию он пытается с их помощью получить? Группа ученых из университета Джонса Хопкинса (Балтимор, США) задались этим вопросом и провели ряд экспериментальных наблюдений, в ходе которых испытуемые смотрели видео с людьми, в чьих руках была закрытая коробка. Испытываемые должны были понять, какую информацию пытаются получить обладатели коробки, используя при этом только свои наблюдения. Насколько точными были предсказания испытуемых, как отличались действия людей с коробками, и о чем говорят результаты наблюдений? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →
Total votes 12: ↑11 and ↓1+16
Comments2

HypEx и мэтчинг. Эксперимент без A/B-тестирования?

Level of difficultyEasy
Reading time10 min
Views4.5K

Привет, Хабр! Меня зовут Дмитрий Тихомиров, я работаю в блоке «Финансы» в команде разработки HypEx (Hypotheses and Experiments) — open source-библиотеки для Python. Наша команда хотела придумать ёмкое название для фреймворка, чтобы оно отражало суть происходящего и помогало раскрыть наш инструмент, который буквально помогает работать с гипотезами и проводить эксперименты.

В интернете уже очень много статей и инструментов про А/B-тестирование: как его правильно проводить, какие метрики использовать и всё-всё-всё. Однако что делать, когда забыли провести дизайн пилот необходимо протестировать гипотезу, но применение А/B-тестов невозможно из-за юридических, этических или практических ограничений? Допустим, как узнать, в каких категориях клиенты начинают тратить больше после получения кредита? Провести классическое А/B-тестирование здесь невозможно: мы не можем заставить одних людей брать кредит, а других — нет.

Читать далее
Total votes 12: ↑11 and ↓1+18
Comments1

Планируем путешествие — задача коммивояжера (TSP) для построения оптимального маршрута

Level of difficultyEasy
Reading time14 min
Views4.3K

С вами Алексей Ложкинс, эксперт по анализу данных и машинному обучению в ПГК Диджитал. Мы разрабатываем цифровые продукты для логистической отрасли, в первую очередь, для ж/д перевозок.

В кулуарах московского офиса ПГК мы обсуждаем и нерабочие темы. Топовую строчку в темах неформального общения занимает отпуск. Мы решили рассмотреть задачу планирования отпуска, как задачу оптимизации маршрута по выбранным достопримечательностям. Для этого воспользовались классической постановкой задачи коммивояжера.

Моделирование маршрута в виде задачи коммивояжера позволит построить маршрут по всем запланированным локациям без повторений с заданным критерием качества (время, стоимость). Рассмотрим несколько подходов к решению оптимизационной задачи (TSP) с использованием пакета ORTools.

Читать далее
Total votes 5: ↑5 and ↓0+5
Comments13

Хочу всё знать

Reading time4 min
Views11K

Я с детства испытывал тягу к знаниям. Смотрел шоу "Своя игра" и поражался тому, откуда можно знать о мире настолько широко. Невозможно было игнорировать тот факт, что гроссмейстеры были в основном, пожилыми, а я хотел все знать сейчас, а не когда я выйду на пенсию. Поэтому я много читал и не переставал мечтать о том, чтобы можно было загрузить информацию в голову напрямую.

Последние несколько лет, компания Neuralink, с Илоном Маском в роли сооснователя, активно работает над созданием такого чипа. Этот факт, однако, повлек дискуссии, что именно произойдет, если информация попадет на чип, к которому у вас есть доступ, однако нейронные связи в вашем мозгу не сформировались и вы эту информацию не обдумывали? Чем эта ситуация отличается от того, когда информация находится в книге, на жестком диске, в телефоне или на компьютере, но вы книгу еще не читали? Разве что простотой доступа?

Эта дискуссия заставила меня задуматься над тем, есть ли иной способ ускорить освоение информации, не подвергаясь рискам от установки чипа, которого, в любом случае, не существует и не появится в обозримом будущем? Так я начал изучать технологии обучения.

Методов обучения множество. Часть из них ориентированы больше на усиление запоминания информации, а другая часть на углубление понимания. Однако, меня интересовало то, что увеличило бы именно скорость. Само собой напрашивается скорочтение. Тут хотелось бы остановиться и обсудить этот метод. Есть многочисленные исследования различных вариаций скорочтения и все они показывают, что скорочтение это миф и те, кто его практикуют, просто водят глазами по странице. Более того, если мы говорим не о художественных произведениях или текстах полных воды, а о "нормальных книгах", то очевидно, что прочитать страницу занимает 1 минуту, а обдумать - 10. Если даже за счет техник скорочтения можно было бы научиться прочитывать страницу за секунду, все еще остается потратить 10 минут на обдумывание.

Читать далее
Total votes 15: ↑13 and ↓2+15
Comments29

Манса Муса и инфляция в Египте: как один человек сумел обрушить экономику целой страны

Reading time8 min
Views9.6K
Самый богатый человек всех времён и народов — не царь Соломон, не Илон Маск и не Рокфеллер.

Его звали Муса I, и в XIV веке он был правителем Мали — государства в Западной Африке.

Современные аналитики из Сelebrity Net Worth оценивают его состояние в 400 миллиардов долларов, но большинство историков сходится во мнении: он был настолько богат, что даже посчитать нельзя.

Однажды Манса Муса, как добропорядочный мусульманин, отправился паломничать в Мекку.

По дороге он щедро раздавал милостыню и совершенно случайно, исключительно из добрых побуждений, обрушил экономику Египта и устроил на ближайшее десятилетие жёсткую инфляцию во всём Средиземноморье.

image
Вместе с ним паломничать отправились шестьдесят тысяч человек и около сотни верблюдов, нагруженных золотыми слитками. Зрелище было впечатляющим!

Сегодня поговорим о том, почему раздавать золото нищим (и не только им) — не всегда хорошая идея, про малоизвестную историю Западной Африки и инфляцию.
Читать дальше →
Total votes 31: ↑27 and ↓4+27
Comments44

FineBI-g brother is still watching: как мы усовершенствовали мониторинг

Level of difficultyHard
Reading time7 min
Views1.9K

Привет, Хабр! На связи BI-команда Tele2. Ранее мы уже рассказывали о нашем опыте перехода на Fine BI и подходе к анализу действий пользователей на платформе.

В нашем случае мониторинг пользователей и объектов на платформе – вопрос жизненной необходимости. Fine BI пользуется популярностью у бизнес-пользователей, также мы активно развиваем подход self-service: лицензия Сreator предоставлена 300 сотрудникам, всего опубликовано около 400 дашбордов, а неопубликованных пользовательских ad-hoc дашбордов насчитывается несколько тысяч, доступ к платформе есть более чем у 2,5 тыс человек, а MAU стремится к 2000 пользователей.

Под катом про то, как мы усовершенствовали объединение таблиц из FineDB и LogDB в один датасет, решили проблему потери логов из-за замены уже опубликованных дашбордов и углубили возможности мониторинга действий пользователей и взаимосвязей пользовательских действий с объектами.

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments3

Ликбез по вхождению в Data Science: что для этого нужно и стоит ли пытаться?

Level of difficultyEasy
Reading time9 min
Views30K

Всем привет! Меня зовут Надя, и сейчас я выступаю в роли ментора на программе Mentor in Tech и помогаю людям «войти» в Data Science. А несколькими годами ранее сама столкнулась с задачей перехода в DS из другой сферы, так что обо всех трудностях знаю не понаслышке.

Порог для входа в профессию очень высокий, так как DS стоит на стыке трех направлений: аналитики, математики и программирования. Но освоить специальность — задача выполнимая (хоть и непростая), даже если ты гуманитарий и списывал математику у соседа по парте.

В этой статье я собрала несколько рекомендаций на основе моего личного опыта (как поиска работы, так и найма людей), а также исходя из рассказов знакомых.

Погрузиться в мир Data Science
Total votes 11: ↑8 and ↓3+5
Comments25

Новости с книжных полок: нужно ли программистам читать книги

Level of difficultyEasy
Reading time7 min
Views11K

Опрос показал, что около 60% россиян регулярно читают книги (минимум одну за последние три месяца). Миф о том, что Россия — одна из самых читающих стран, не совсем миф. 

Но так ли привержены чтению программисты, особенно, когда ситуация в IT меняется чуть ли не каждый день? О том, какая литература сегодня востребована у разработчиков, подробнее расскажем в этой статье.

Читать далее
Total votes 15: ↑11 and ↓4+14
Comments11

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Analyst, Product Analyst
Senior
SQL
Python
English
Tableau
Math statistics
Visualization
Jupyter Notebook
Pandas
Yandex DataLens
French