Comments 4
В данном конкретном случае проще воспользоваться официальным API. Хотя для аналогичных задач, где таковой отсутствует или непозволительно дорог, приходится таки парсить.
Доступ к официальному API ЕФРСБ стоит порядка 400 тысяч в год, если я правильно помню.
В 2 раза дешевле, 50 т.₽ в квартал. На фоне какой-нибудь картотеки арбитражных дел - копейки :)
Но парсер надо написать и поддерживать (формат страничек-то никто не обещает сохранять неизменным вечно, плюс та же капча может появиться), что тоже денег стóит. Ну и для бизнес-задач простой системы на время, пока Вы исправляете парсер, может быть неприемлем.
P.S. Да, и в комплекте с купленным API получаем всю историю ЕФРСБ с 2011 г. в виде архивов, которые можно выгрузить с FTP. Для некоторых задач, когда нужна аналитика, а не только разовые запросы, это такой важный бонус, т.к. спарсить столько информации физически нереально.
Спасибо за статью. А как победить страницу https://old.bankrot.fedresurs.ru/Messages.aspx ? там нет GET, поиск работает через POST.
Банкрот или не банкрот? Вот в чем вопрос