
Здравствуйте дорогие хабровчане, в этой статье я сравнил цены трёх известных интернет магазинов wildberries, lamoda и kupivip, которые специализируются на продаже одежды. Я сравнил цены в общем, а также нашёл одинаковые товары и сравнил их. Также сосчитал уникальное количество брендов в каждом магазине. В общем получилась небольшая аналитика, кому это интересно прошу под кат.
Актуальность данных: 20 августа 2020 года
Конечно же я сравнил не все товары во всех магазинах их там сотни тысяч, я выбрал один сегмент — мужские мокасины:
- wildberries — 2545 товаров,
- lamoda — 513 товаров
- kupivip — 669 товаров
Забегая вперёд, скажу, что изначально я старался выбрать сегмент, где будет одинаковое количество товаров в каждом магазине. Мой выбор пал на женские ботильоны, их было примерно по 1000 штук у каждого из продавцов, но (может быть мне просто не повезло) на тот момент я не нашёл ни одного одинакового товара для сравнения, поэтому я остановился на мужских мокасинах (что очевидно можно подметить — в женском сегменте уникальных товаров намного больше, чем в мужском).
Для начала я решил посмотреть к какому сегменту на самом деле относится каждый магазин, для этого я нашёл минимальную, максимальную, медианную и среднюю цены:

Из таблицы видно, что самый дешевый магазин это wildberries, на втором месте lamoda, а самый дорогой — kupivip, такой вывод можно однозначно сделать исходя из данных в колонках медиана и среднее, однако если посмотреть на колонки минимальной и максимальной цен, то можно сделать не верный вывод, что самый дорогой магазин lamoda, но это не так.
Для большей наглядности рассмотрим подробнее ��рафик функции плотности цен каждого магазина (для читабельности из графика были удалены самые дорогие товары, что никак не влияет на выводы):

Чтобы можно было корректно сравнивать между собой графики для каждого магазина данные были нормализованы (графически это значит, что площади под каждым графиком равны между собой, самый простой способ это проверить — подсчитать количество прямоугольников, которые находятся внутри графика). Сразу видно, что половину всех товаров в магазине wildberries можно купить меньше, чем за примерно 3500 руб, и самые дорогие смещены влево по отношению к другим магазинам. По той же логике видно, что kupivip занимает сегмент более дорогих товаров, чем lamoda.
Исходя из этого ещё более интересно посмотреть, будет ли цена на одни и те же товары отличаться в зависимости от того, какой ценовой сегмент занимает магазин.
Чтобы это узнать, необходимо найти бренды, которые представлены во всех трёх магазинах. Рассмотрим подробнее круговую диаграмму, на которой показано количество уникальных и общих брендов:

Стоит заметить, что у wildberries намного больше уникальных брендов, чем у других магазинов, это объясняется тем, что изначально у wildberries было больше товаров (строго говоря wildberries самый большой магазин).
Таким образом рассмотрим более подробно 13 брендов, товары которых представлены во всех трёх магазинах (названия брендов без пробелов и строчных букв из-за возможной разницы написания в различных магазинах):

В таблице выше показано сколько товаров каждого из брендов продается в каждом магазине, исходя из этого найдём одинаковые товары:

Как и следовало ожидать, больше половины самых дешевых товаров можно найти в wildberries, однако, это далеко не всегда так и, например, несмотря на то, что kupivip находится в самом верхнем ценовом сегменте, там можно найти товары дешевле (3 и 5 справа), чем в wildberries или в lamoda. Можно также заметить любопытную деталь: когда товары стоят одинаково в wildberries и/или в kupivip, lamoda накидывает к цене 1 рубль (например, 4 слева).
Для тех, кому эта статья показалась интересной, напишите в комментах, а какие ещё магазины стоит включить для рассмотрения или какую аналитику можно добавить. Спасибо.
