Это все хорошо до тех пор, пока не сталкиваешься:
1. С хорошей, нестандартной captcha
1. С защитой от ботов с помощью сервисов типа perimeterX, Netacea, dataDome и прочих.
3. С защитами на основе user fingerprinting.
И тогда порой уже без полноценного браузера на базе chrome не обойтись. Даже headless режим детектируется при известной сноровке (отрисовка определенных картинок с помощью движка, триггер по использованию мышки, подключенные плагины, быстро закрытая вкладка и прочие варианты).
Как итог, приходишь к созданию эдакого фреймворка типа scrapy, который бы позволял работать с удаленными сайтами с помощью различных вариантов подключения: requests, selenium, headless, chrome.
А уж что говорить когда необходимо обеспечивать поиск по данным в реальном времени, тут и каждая секунда дорога, и проблем бывает выше крыши.
zombak, как ты определил что он ничего не удалил? Я тоже не перегружался, однако у меня он удалил.
PS. писал тебе в хабрапочту, чтобы здесь не флудить.
Да, но это не спасает тех файлов, что уже удалены. У меня например файлы Visual C++ 2010 улетели в трубу. Получается что надо проверять работоспособность вообще всех программ. Логичнее сделать бэкап нужных файлов и переставить систему.
А как перенести уже существующие сервера (например контроллер домена установленный на win2k server) на виртуальную платформу без переустановки системы или программ? Описание такого процесса было бы более актуально.
1. С хорошей, нестандартной captcha
1. С защитой от ботов с помощью сервисов типа perimeterX, Netacea, dataDome и прочих.
3. С защитами на основе user fingerprinting.
И тогда порой уже без полноценного браузера на базе chrome не обойтись. Даже headless режим детектируется при известной сноровке (отрисовка определенных картинок с помощью движка, триггер по использованию мышки, подключенные плагины, быстро закрытая вкладка и прочие варианты).
Как итог, приходишь к созданию эдакого фреймворка типа scrapy, который бы позволял работать с удаленными сайтами с помощью различных вариантов подключения: requests, selenium, headless, chrome.
А уж что говорить когда необходимо обеспечивать поиск по данным в реальном времени, тут и каждая секунда дорога, и проблем бывает выше крыши.
PS. писал тебе в хабрапочту, чтобы здесь не флудить.
а еще лучше классический вид бы вернули.
Клиент Telnet.