Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Да, в идеальном мире это так. Но когда у цели навороченный ajax, с авторизацией юзера, хешированными куками, адаптацией под конкретный браузер, то очень часто бывает, что без браузера просто не обойтись. Более того часто даже очень легковесные старички-эмуляторы а ля PhantomJS не вывозят, приходится аж целый chrome с --headless заводить. А если антиддос сайта начнет еще и капчи показывать, то там все вообще весело получается.
Так что для универсальности решения Selenium все же потребуется.
З.Ы. Но Thread.Sleep(5000); — это да, очень криво. Есть же прямо на борту у Selenium намного лучше инструменты для таймингов.
Парсим любой сайт за считанные секунды. Как достать нужную информацию с сайта используя Selenium, XPath и Proxy Sever