Pull to refresh

Comments 6

Не хватает инфы о том, как собирали данные, какие интересные моменты с этим были

Да, это возможно отдельная большая статья в будущем, использовал python, парсер написал на scrapy.

По данным — написал три парсера для каждого магазина (спарсил артикул, бренд, цену и ссылки на изображения товаров), затем с помощью pandas рассчитал таблички, через matplotlib отрисовал графики. Изображения товаров скачивал отдельно через небольшой скрипт (библиотека requests) и отрисовал их через matplotlib. Одинаковые товары нашел просто открыв три вкладки в браузере для каждого магазина и там по бренду отфильтровывал и глазами смотрел (тут можно было бы написать какой-нибудь алгоритм на opencv для автоматизации поиска похожих изображений).


Как-то так.

Wildberries совершенно точно показывает персональную цену каждому пользователю. Во многом она зависит от выкупаемости заказанных товаров. Возможно, это стоило учесть при сравнении цен. В остальных магазинах не знаю как с этим обстоят дела.

Sign up to leave a comment.

Articles