Комментарии 12
Если уж асинхронный бот, то всё приложение надо асинхронным делать. Соответственно, вместо requests
надо использовать httpx
, aiohttp
или им подобные.
А зачем ссылки на сайт параметризированны?
https_://amvera.ru/?utm_source=habr&utm_medium=article&utm_campaign=bot-parser
Это обычная UTM-метка
Это значит, что статья - реклама. И маркетинг смотрит профит. Автор выбирает свой сервис как будто случайно, без вступления, что вот это Мы, просто пошла история, что лучше бы бота поднять вооот тут (да конечно!)
Не публичные API действительно часто доступны для анализа и использования, но важно помнить, что наличие доступа через DevTools или скрипт не означает, что вы имеете право использовать эти API. Перед тем как использовать данные, лучше уточнить условия их использования и, если необходимо, получить разрешение от владельца сайта.
А как вы решили проблему того, что товар уже встречался на странице(к примеру чтобы одни и те же наушники не присылались по N-раз подряд)? Писал собственного бота ещё полгода назад для подобной темы, однако нормальной идеи кроме создания базы данных и учёта последних 10 товаров придумать не смог
Ну можно просто накачивать set до тех пор, пока в нем не наберётся 10, и затем отправить пачкой в телегу
можно, но если обновления товаров не было, вы просто будете отправлять всё те же 10 товаров(не знаю как часто обновляются товары WB, однако сайт, который я парсил таким методом обновлял товары только когда продавец выложит что-то новое) и поскольку запрос я делал раз в 5 секунд то данным методом вы могли за час отправить 720 одинаковых товаров в бота, что как-то бесполезно, вот я и хочу узнать как подобную проблему решил автор статьи
Бот-парсер маркетплейса на Python