Comments 8
Разработчики веб-сайтов теперь могут запретить боту GPTBot от OpenAI посещать сайт.
любой бот на selenium спотыкается о защиту cloudflare, так что это очень временный парсинг
Я парсеров не много делал, с такой проблемой не сталкивался
Даже интересно будет с Chat GPT обсудить и сделать обход защиты от ботов:)
Чтобы такого не происходило, используют модифицированные драйверы для Selenium, например, undetected-chromedriver. Он перед каждым запуском патчит исполняемый файл драйвера.
Sign up to leave a comment.
Парсинг сайта с помощью Chat GPT: упрощаем создание парсера