Комментарии / Профиль zoldaten / Хабр

Так в тексте программы уже этот цикл есть )
Небольшая задержка, к сожалению, не всегда спасает. Ранее писал под старый сервис, там задержку надо было ставить до 15 мин.

Посмотреть

Получить выписки из ЕГРЮЛ на сайте ФНС, используя python

zoldaten 17 июн 2019 в 09:34

по поводу ИНН — только одну компанию можно проверить?

Посмотреть

Проверяем сведения о недостоверности в выписках из ЕГРЮЛ. Склеиваем pdf на python

zoldaten 17 июн 2019 в 09:07

спасибо. но пока не пересесть никак на unix. или есть для windows?

Посмотреть

Получить выписки из ЕГРЮЛ на сайте ФНС, используя python

zoldaten 17 июн 2019 в 09:04

отлично! большой труд.
вставлю свои 5 копеек:
— сравните теперь длину кода;
— requests, которые здесь использованы, к сожалению отваливаются из-за капч в дальнейшем;
— только один ИНН?

Посмотреть

Проверяем сведения о недостоверности в выписках из ЕГРЮЛ. Склеиваем pdf на python

zoldaten 14 июн 2019 в 14:52

Спасибо про «Велосипед...», я читал статью ранее. Она про извлечение данных из pdf. Здесь мы склеиваем pdfы и ищем по ним. Все просто. Не всегда надо собирать велосипед, чтобы поехать.
Про использование памяти я вас не совсем понимаю. Если программу заряжать по всем выпискам из ЕГРЮЛ, возможно она и подвесит комп. Но я обрабатываю порядка 300-400 выписок, все выполняется за секунды.
p.s. про законы действительно обидно прозвучало. напишите свой первый иск, а я потренируюсь в иронии.

Посмотреть

Получить выписки из ЕГРЮЛ на сайте ФНС, используя python

zoldaten 14 июн 2019 в 12:05

Вот именно, и «еще откуда-нибудь». Все существующие системы Спарк, Правобот и т.п. предоставляют какую-то информацию. Эта информация не особо-то и нужна, иногда не релевантна, а иногда вообще вводит в заблуждение. Кроме того, разрабатывать мелкие сервисы такие программные монстры не будут. Здесь и рождается ниша для IT-юристов.

Посмотреть

Проверяем сведения о недостоверности в выписках из ЕГРЮЛ. Склеиваем pdf на python

zoldaten 14 июн 2019 в 11:41

у меня есть реализация такого плана. все выписки перегоняются из pdf в csv сторонней программой, потом они сравниваются построчно с самими собой месячной давности (либо более ранними). такая типа ретроспектива изменений в егрюл. но вряд ли это интересно.

Посмотреть

Получить выписки из ЕГРЮЛ на сайте ФНС, используя python

zoldaten 14 июн 2019 в 10:57

да, у меня есть такая реализация. без pandas, все проще. но ручник нужен для ситуации, если полезли капчи либо отошел, либо интернет отвалился. напишу как-нибудь попозже пост как кидаться запросами, в том числе игнорируя капчи.

Посмотреть

Проверяем сведения о недостоверности в выписках из ЕГРЮЛ. Склеиваем pdf на python

zoldaten 14 июн 2019 в 10:52

а зачем конвертировать? на мой взгляд, самый быстрый способ тот, что в посте.
на счет plain не уверен, но вот, можете проверить — пример выписки.

Посмотреть

Проверяем сведения о недостоверности в выписках из ЕГРЮЛ. Склеиваем pdf на python

zoldaten 14 июн 2019 в 10:45

мне стыдно это признать, но дальше я ищу в общем файле pdf через CTRL+F. перегон с помощью Python из pdf в csv ничего толком не дает, т.к. даже если слово «недост» есть, нельзя понять к какому обществу это относится (понять можно на самом деле, но адреса полей в csv разные каждый раз). Кроме того, «недост» присутствуют в выписках после исправлений сведений о недостоверности в налоговой (так называемая история исправлений), что так же путает.

Посмотреть

Получить выписки из ЕГРЮЛ на сайте ФНС, используя python

zoldaten 13 июн 2019 в 09:46

спасибо за комменты. первый пост, он такой ) тем более, что я юрист, а не программер. порой проще написать «лазерную пушку по воробьям» самому, чем идти в ИТ и объяснять, что это и зачем надо.

Посмотреть

1 2 ...

20 21