Comments 2
А как вы тестировали парсеры?
А если кто-то не хочет, чтобы его сайт парсили, и специально невалидный HTML опубликовал, они продолжат работать?
На пропущенном шаге "Получить html сайта" как передавать заголовки так, чтобы не отличили от настоящего пользователя?
Почему не подошла ни одна из десятка библиотек для парсинга через headless браузер?
Sign up to leave a comment.
server-queryselector aka парсим html в nodejs