Аналитик
Как мы написали еще один алгоритм RFM-анализа
Недавно мы рассказали, почему придумали свой RFM-сегментатор, который помогает сделать RFM-анализ за 20 секунд, и показали, как использовать его результаты в маркетинге.
Теперь рассказываем, как он устроен.
RFM-анализ одной кнопкой или как мы облегчили клиентам жизнь
С тех пор как в компании Mindbox впервые произнесли Machine Learning, общей целью стала Большая Зеленая Кнопка. Это такая кнопка во весь экран, при нажатии на которую всё работает само и приносит прибыль.
В аналитическом проекте «RFM» цель менее амбициозная — Маленькая зеленая кнопка. Нажимаешь, и база автоматически делится на сегменты, по которым запускается отправка писем (например).
Чтобы добиться цели, мы написали автоматический RFM-сегментатор и разработали специальный отчет, чтобы наглядно представлять результаты.
Рассказываем, как это все случилось и почему теперь можно обойтись без аналитиков уделять больше времени менее тривиальным задачам .
Доступное объяснение гипотезы Римана
![image](https://habrastorage.org/getpro/habr/post_images/428/181/b9c/428181b9c9e1e4d4054ca7d18121a3b2.png)
Посвящается памяти Джона Форбса Нэша-младшего
Вы ведь помните, что такое «простые числа»? Эти числа не делятся ни на какие другие, кроме самих себя и 1. А теперь я задам вопрос, которому уже 3000 лет:
- 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, p. Чему равно p? 31. Каким будет следующее p? 37. А следующее p ? 41. А следующее? 43. Да, но… как нам узнать, каким будет следующее значение?
Придумайте суждение или формулу, которые (хотя бы с грехом пополам) прогнозируют, каким будет следующее простое число, (в любом заданном ряду чисел), и ваше имя навечно будет связано с одним из величайших достижений человеческого мозга. Вы встанете в один ряд с Ньютоном, Эйнштейном и Гёделем. Разберитесь в поведении простых чисел, и можете потом всю жизнь почивать на лаврах.
Введение
Свойства простых чисел изучались многими великими людьми в истории математики. С первого доказательства бесконечности простых чисел Евклида до формулы произведения Эйлера, связавшей простые числа с дзета-функцией. От формулировки теоремы о простых числах Гаусса и Лежандра до её доказательства, придуманного Адамаром и Валле-Пуссеном. Тем не менее, Бернхард Риман до сих пор считается математиком, сделавшим единственное крупнейшее открытие в теории простых чисел. В его опубликованной в 1859 году статье, состоявшей всего из восьми страниц, были сделаны новые, ранее неизвестные открытия о распределении простых чисел. Эта статья по сей день считается одной из самых важных в теории чисел.
После публикации статья Римана оставалась главным трудом в теории простых чисел и на самом деле стала основной причиной доказательства в 1896 году теоремы о распределении простых чисел. С тех пор было найдено несколько новых доказательств, в том числе элементарные доказательства Сельберга и Эрдёша. Однако до сих пор остаётся загадкой гипотеза Римана о корнях дзета-функции.
Непаханое поле бигдаты в медицине и фармацевтике
Под катом видео доклада и его текстовая версия.
![](https://habrastorage.org/webt/qb/ok/s0/qboks0j4ihcjkjuxsty6ltznrii.png)
Как тестировать гипотезы и кратно расти? Теория. Практика. Инструмент
![](https://habrastorage.org/files/f97/b0e/e5f/f97b0ee5fa114c42ae90c7797a3f7a2f.png)
Как перезагрузить отдел маркетинга за 7 дней и получить первый значимый рост уже через 30 дней?
Сервис кратного роста hopox позволит наладить работу Growth Team и тестировать гипотезы роста непрерывно.
В статье теория, практика и интрумент собраны в единую Технологию кратного роста.
Использование вычислительных возможностей R для проверки гипотезы о равенстве средних
Возникла недавно потребность решить вроде бы классическую задачу мат. статистики.
Проводится испытание определенного push воздействия на группу людей. Необходимо оценить наличие эффекта. Конечно, можно делать это с помощью вероятностного подхода.
Но рассуждать с бизнесом о нулевых гипотезах и значении p-value совершенно бесполезно и контрпродуктивно.
Как можно по состоянию на февраль 2019 года сделать это максимально просто и быстро имея под руками ноутбук «средней руки»? Заметка реферативная, формул нет.
Является продолжением предыдущих публикаций.
Как оценить качество системы A/B-тестирования
![](https://habrastorage.org/files/8df/c7a/fcc/8dfc7afcc7ec41efb04cae962810f50b.png)
Вот уже более полугода в компании используется единая система для проведения A/B-экспериментов. Одной из самых важных частей этой системы является процедура проверки качества, которая помогает нам понять, насколько мы можем доверять результатам A/B-тестов. В этой статье мы подробно опишем принцип работы процедуры проверки качества в расчете на тех читателей, которые захотят проверить свою систему A/B-тестирования. Поэтому в статье много технических деталей.
Что не так с A/B тестированием
![](https://habrastorage.org/webt/9w/xl/-5/9wxl-5mbovbszw0qgzlqjjsxxxi.jpeg)
Мы подготовили для читателей Хабры перевод статьи Майкла Камински, бывшего директора по аналитике в Harry’s. Он рассуждает о том, что не так с A/B тестированием. Комментирует материал Глеб Сологуб, директор по аналитике Skyeng.
Понятие A/B-тестирования основано на в корне неверном предположении, что существует единственное решение, которое в среднем лучше для всех клиентов. Аналитикам стоит отказаться от предположения об однородности их аудитории и начать разрабатывать системы, которые позволяют использовать (и поощряют) результаты иных тестов, кроме бинарных.
Как у нас устроено A/Б-тестирование. Лекция Яндекса
Сергей:
— Я попробую упрощенно описать задачу A/Б-тестирования. Есть абстрактная система с пользователями, в нее мы вносим какие-то изменения, и нужно уметь измерять в ней пользу. Пока все просто, но слишком абстрактно. Пример. Есть веб-сервис по сравнению пары фотографий котов. Пользователь должен выбрать наиболее понравившуюся фотографию. При этом он может выбрать не только левый или правый снимок, но и «против всех». Значит, мы подобрали картинки не очень хорошо. Наша задача — обоснованно улучшать сервис, доказывая это цифрами.
Снижение объёма выборки экспериментальных данных без потери информации
![](https://habrastorage.org/webt/ru/0z/0n/ru0z0ni-nk7qsjxzvmmrnveds4i.jpeg)
В чем проблема гистограмм экспериментальных данных
Основой управления качеством продукции любого промышленного предприятия является сбор экспериментальных данных с последующей их обработкой.
Первичная обработка результатов эксперимента включает сопоставление гипотез о законе распределения данных, описывающем с наименьшей погрешностью случайную величину по наблюдаемой выборке.
Для этого выборка представляется в виде гистограммы, состоящей из столбцов, построенных на интервалах протяженностью .
Идентификации формы распределения результатов измерений требует также ряд задач, эффективность решения которых отличается для различных распределений (например, использование метода наименьших квадратов или вычисление оценок энтропии).
Кроме того, идентификация распределения нужна ещё и потому, что рассеяние всех оценок (среднеквадратичного отклонения, эксцесса, контрэксцесса и др.) также зависит от формы закона распределения.
От объема выборки зависит успешность идентификации формы распределения экспериментальных данных и, если он мал, особенности распределения оказываются замаскированными случайностью самой выборки. На практике обеспечить большой объем выборки, например больше 1000, не представляется возможным в силу разных причин.
В такой ситуации важно наилучшим образом распределить выборочные данные по интервалам, когда для дальнейшего анализа и расчетов интервальный ряд необходим.
Паттерны Визуализации Информации
Ниже я попытался показать, почему визуализация информации важна, рассказать о ее базовых принципах и показать несколько классных примеров. Заранее прошу прощения за парочку скучных определений и отсутствие шуток в статье. Это сделано намеренно. Статья дэдли сериоус.
И, как обычно, прощу прощения за объем статьи. Но, надеюсь, вам будет интересно дочитать до конца.
![](https://habrastorage.org/storage2/752/49a/5f1/75249a5f1efd0626e8b7db1333dece66.png)
Наивно. Супер. Рецензия на книгу Джина Желязны «Говори на языке диаграмм»
![image](https://habrastorage.org/web/337/c69/81e/337c6981e6e64af184779f9a5b7e387d.jpg)
Книга "Say It With Chart" (дословно «Скажи это с помощью диаграммы») написана более 30-ти лет назад (в 1985 году!), однако и сегодня пользуется интересом. Она переведена на главные мировые языки, переиздается вновь и вновь, бизнесмены, маркетологи, аналитики считают её настольной книгой и в 2017-м.
Книгу интересно читать, в ней много полезного, но это было ожидаемо. Неожиданностью стал недостаток информации о её авторе в сети (которому принадлежит еще несколько мировых бестселлеров). О Джине Желязны нет статьи в Википедии (ни на английском, ни на русском), на запросы типа «биография Дж. Желязны» или «кто такой Дж. Желязны» выдаются бесчисленные сайты с одним и тем же текстом — аннотацией к книге «Говори на языке диаграмм». А это, согласитесь, только усиливает интерес, поэтому рецензия будет состоять из двух частей: «О книге» и «Кто такой Джин Желязны?».
В России начнет работать единая система учета онлайн-просмотров фильмов
![](https://habrastorage.org/getpro/habr/post_images/045/2ca/7b4/0452ca7b40a477d8f4cf88b6608f9a2d.jpg)
Ассоциация продюсеров кино и телевидения (АПКиТ), объединяющая большинство производителей контента в РФ, попросила в связи со сложившейся ситуацией помощи у Минкомсвязи. 16 ноября замминистр связи Алексей Волин провел совещание по этому вопросу с медиакомпаниями и онлайн-сервисами. В совещании принимали участие такие компании, как СТВ, Art Pictures, Yellow, Black & White (YBW), StarMedia, холдингов «СТС Медиа» и «Национальная медиа группа», прокатчиков «Вольга» и «Централ партнершип», онлайн-кинотеатров Ivi, Megogo, Okko и «Яндекса».
Какие свидетельства могут убедить математиков, если строгого доказательства нет?
Новая статистическая модель, кажется, подрывает давно принятые предположения из теории чисел. Насколько ей можно доверять, если на самом деле имеет значение только строгое доказательство?
Какие точки на эллиптической кривой y2 = x3 – 4x + 1 рациональные? Чтобы их найти, нужно провести прямые через пары рациональных точек. Все точки, через которые проходят прямые, также будут рациональными.
Недавно четверо исследователей придумали модель, переворачивающую с ног на голову весь здравый смысл их области исследований. Они использовали данные вычислений, позволяющие предположить, что преобладающее несколько десятилетий мнение об одной из фундаментальных концепций было ошибочным.
И это не биологи, климатологи или физики. В их научной области эмпирические модели не имеют права голоса касательно истины. Они – математики, представители дисциплины, чья стандартная валюта – неоспоримое логичное доказательство – обычно избавляет их от дебатов, поражающих другие области. И всё же вот они, со своей моделью, говорящей, что, вероятно, пришло время пересмотреть некоторые давнишние представления.
Где Agile ужасен, особенно Scrum
Я видел, как множество вариантов Agile, называемых Scrum, реально убивают компанию. Под «убивают» я имею в виду не «ухудшение культуры», а скорее когда акции компании падают почти на 90% за два года.
Что такое Agile?
Agile вырос из среды веб-консалтинга, где он приносил определённую пользу: при работе с привередливыми клиентами, которые не знают, чего они хотят, обычно приходится выбирать из двух вариантов. Или одолеть клиента: установить ожидания, соответствующую оплату за переделки и поддерживать отношения равенства, а не подчинения. Или принять некорректное поведение клиента (как, скажем, приходится многим дизайнерам) и ориентировать рабочий поток вокруг клиентской дисфункции.
Первый лазер в истории: каким он был
![image](https://habrastorage.org/webt/xs/rp/12/xsrp123zaz9tkrtsrgc96422sy4.jpeg)
Суровая действительность: Ваши стейкхолдеры не хотят анализ бизнеса
Потихоньку развиваем спектр охватываемых областей обучения. Вот запускаем новый тип для нас — «Аналитик бизнес-процессов», четвёртый в пуле курсов «Маркетинг и бизнес». Поэтому начинаем обычный для нас цикл интересных статей и заметок по этой теме.
Поехали!
Уверен, с этой мыслью читатели сайта согласятся — качественный анализ бизнеса может значительно повысить его ценность на протяжении всего жизненного цикла проекта. Но позвольте задать вопрос. Встречались ли вам когда-нибудь стейкхолдеры, которые “не понимают” бизнес-анализ? Они просто хотят внедрить тактическое, небрежное решение, даже не понимая первопричину, оперативные потребности и возможности.
Слышали ли вы когда-нибудь подобное от стейкхолдеров:
- “У нас нет времени на предварительный анализ предприятия… давайте просто начнем!”
- “Зачем мне нужны требования? Все очень просто, мне нужна система xyz. Это мое требование. А теперь идите и делайте, и чтобы до вторника было готово, пожалуйста.”
- “Зачем нам понимать систему “как есть” — нас должны волновать только изменения!”
- “Почему вы продолжаете спрашивать про бизнес-цели? Это вас не должно волновать.”
![](https://habrastorage.org/webt/de/cx/tg/decxtgsdyh3y85wupy7o-ffmnd8.png)
Финтех-дайджест: роботизация ЦБ, Ethereum 2.0, контроль криптовалют со стороны Росфинмониторинга и тренды в финтехе
![](https://habrastorage.org/webt/y4/c0/gy/y4c0gymx3up0mx1jtzhfgxa-7os.jpeg)
На этой неделе сразу несколько интересных новостей и не только.
- Центробанк России собирается увольнять сотрудников в связи с роботизацией.
- Виталик Бутерин запускает Ethereum 2.0 с новым названием.
- Росфинмониторинг будет контролировать эту вашу крипту.
- 5 трендов в финтехе конца уходящего года.
Роботизация Центробанка
На днях стало известно о том, что Центробанк России планирует к концу 2019 года сократить численность персонала с 50 тысяч до 43,5 тысяч человек. Об этом рассказал заместитель председателя ЦБ Руслан Вестеровский.
Когда запрашивается PIN-код при оплате?
![пластиковые карты](https://habrastorage.org/files/a59/05e/6ae/a5905e6ae82a4141b816ca5105d3cc35.jpg)
Заметил, что люди часто рассуждают о причинах не запроса PIN-кода, либо наоборот удивляются, почему вдруг он потребовался. Пытаясь объяснить, в каких ситуациях необходим PIN-код, я запутался и решил собрать данные и написать статью.
Information
- Rating
- Does not participate
- Location
- Москва, Москва и Московская обл., Россия
- Date of birth
- Registered
- Activity