Комментарии 7
Спасибо. Может напишете о своем опыте аналитики в e-commerce? Интересны применяемые методики и достигнутые результаты.
Интересно за что минус) Отпишитесь хоть — прокомментирую, подискутируем.
Пришел сюда по ссылке из статьи про импортозамещение. Интересная задачка — я бы её решал одним запросом в SQLite. Но это потому что я с ним имел больше дела, чем с Excel'ем :-)
Посмею себе только не согласиться с утверждением про формулу в колонке Frequency:
Вы делите всю совокупность на 3 промежутка: где значение Frequency меньше, равно, и больше медианы — в этом мы с Вами согласны. Однако неверно утверждать, что эти три промежутка равны. Если 6 клиентов совершили 1, 2, 3, 4, 5, 6 покупок, то медиана равна 3.5, и во втором промежутке нет клиентов. Но, конечно, в реальности распределение будет ровнее, так что несколько клиентов в медиану все равно попадут.
Посмею себе только не согласиться с утверждением про формулу в колонке Frequency:
мы разделили всю совокупность на 3 равных по количеству членов совокупности промежутка и смотрим к какому из этих промежутков относится значение в колонке С
Вы делите всю совокупность на 3 промежутка: где значение Frequency меньше, равно, и больше медианы — в этом мы с Вами согласны. Однако неверно утверждать, что эти три промежутка равны. Если 6 клиентов совершили 1, 2, 3, 4, 5, 6 покупок, то медиана равна 3.5, и во втором промежутке нет клиентов. Но, конечно, в реальности распределение будет ровнее, так что несколько клиентов в медиану все равно попадут.
Вы, наверное, 10-й, кто мне сообщает, что это можно сделать не в Excel))) Сделайте (ссылка на условия для Вашего предшественника), напишите статью об этом и обещаю дать ссылку на нее в своей.
Только не забудьте главное — нужно не просто повторить вычисления (тут ума много не надо), но необходимо создать готовый под ключ инструмент для тех, кто не имеет большого IT-бэкграунда. Т.е. бэкенд+фронтэнд+инструкция по разворачиванию всего этого для пользователя. Вангую, что времени вы потратите и сил сильно больше, чем я на создание всего этого. Каждой задаче — свой инструмент. И для задач ad-hoc аналитики на массивах до сотен тысяч строк лучше и распространеннее Excel еще не придумали. А спорят с этим выводом только те, ктошурупы микроскопом забивает никогда не работал аналитиком данных.
Только не забудьте главное — нужно не просто повторить вычисления (тут ума много не надо), но необходимо создать готовый под ключ инструмент для тех, кто не имеет большого IT-бэкграунда. Т.е. бэкенд+фронтэнд+инструкция по разворачиванию всего этого для пользователя. Вангую, что времени вы потратите и сил сильно больше, чем я на создание всего этого. Каждой задаче — свой инструмент. И для задач ad-hoc аналитики на массивах до сотен тысяч строк лучше и распространеннее Excel еще не придумали. А спорят с этим выводом только те, кто
Не-не-не, я ни в коем случае не соревнуюсь — сам непрограммист, у меня бы в той задаче час ушел бы только на то, чтобы input'ы по форме разбросать да подписать :-) Про SQLite — это мысли вслух о том, что те, кто ничего кроме микроскопа в руках не держал — и шурупы будет им забивать ;-)
Корректности ради следовало бы спросить читателей, сколько времени им потребовалось бы, чтобы реализовать то же самое в том же самом Excel'е. Как бы Вы отреагировали на возражение вроде: «я попробовал повторить то же самое, но за час не успел. Следовательно, Вы всё врёте!»? :-D
А теперь вопрос по сути — от человека, не пользовавшегося Excel со школы: вот в одном месяце Вам дали xls-файл с исходными данными, Вы (видимо, в нём же) ввели все эти формулы и получили красивый результат. Хорошо. Но что Вы будете делать, если через месяц Вам принесут новый файл с исходными данными? Заново будете вводить все формулы или скопируете исходные данные в файл с формулами? Наверное, второе. Но что делать с количеством строк в исходных данных (на скриншотах в формулах много где присутствует волшебное число 592), и списка клиентов ("копируем с первого листа список клиентов оставляем только уникальные записи при помощи стандартного функционала (Данные — Удалить дубликаты)" — это вряд ли «само пересчитается»)? Или это делается "при помощи вычисляемых объектов сводной таблицы, чтобы было красиво"?
Корректности ради следовало бы спросить читателей, сколько времени им потребовалось бы, чтобы реализовать то же самое в том же самом Excel'е. Как бы Вы отреагировали на возражение вроде: «я попробовал повторить то же самое, но за час не успел. Следовательно, Вы всё врёте!»? :-D
А теперь вопрос по сути — от человека, не пользовавшегося Excel со школы: вот в одном месяце Вам дали xls-файл с исходными данными, Вы (видимо, в нём же) ввели все эти формулы и получили красивый результат. Хорошо. Но что Вы будете делать, если через месяц Вам принесут новый файл с исходными данными? Заново будете вводить все формулы или скопируете исходные данные в файл с формулами? Наверное, второе. Но что делать с количеством строк в исходных данных (на скриншотах в формулах много где присутствует волшебное число 592), и списка клиентов ("копируем с первого листа список клиентов оставляем только уникальные записи при помощи стандартного функционала (Данные — Удалить дубликаты)" — это вряд ли «само пересчитается»)? Или это делается "при помощи вычисляемых объектов сводной таблицы, чтобы было красиво"?
На мой комментарий об ad-hoc задачах в Excel вы отвечаете пассажем о целесообразности автоматизации. Ок, уйдем в сторону — любая автоматизация имеет смысл, когда эффект от нее превосходит трудозатраты на нее саму. Базовые экономические понятия: эффект/эффективность. В свете полученных знаний, попробуйте сами ответить на Ваши вопросы)
В своих статьях я четко формулировал целевую аудиторию — малый бизнес. У которого сейчас, по понятным причинам, на автоматизацию ресурсов нет. И четко показывал в какие моменты нет смысла заморачиваться с автоматизацией (см. статью про управленческий учет). Сам, пока не перешел на темную сторону разработки и работал аналитиком, не раз делал руками то, что можно было автоматизировать, но смысла в этом не было.
Засим предлагаю закончить дискуссию не по теме статьи. Пишите в личку, если вопросы остались — без проблем отвечу.
В своих статьях я четко формулировал целевую аудиторию — малый бизнес. У которого сейчас, по понятным причинам, на автоматизацию ресурсов нет. И четко показывал в какие моменты нет смысла заморачиваться с автоматизацией (см. статью про управленческий учет). Сам, пока не перешел на темную сторону разработки и работал аналитиком, не раз делал руками то, что можно было автоматизировать, но смысла в этом не было.
Корректности ради следовало бы спросить читателей, сколько времени им потребовалось бы, чтобы реализовать то же самое в том же самом Excel'е.Любой студент, умеющий в Excel, сможет повторить мои результаты за указанное время. А не студент, имеющий профессиональный опыт аналитика данных, сформулировать и разработать инструменты аналогичной ценности. При этом вне зависимости от уровня квалификации невозможно создать аналогичные инструменты за пределами Excel при вменяемых трудозатратах.
Засим предлагаю закончить дискуссию не по теме статьи. Пишите в личку, если вопросы остались — без проблем отвечу.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
RFM-анализ на коленке (Excel)