Комментарии 9
С сайта ЕГРЮЛ ИТСОФТ скачиваем данные ФНС
А это где?
Хм, а откуда Чекко берёт почту, сайт и телефоны?..
А для чего потом использовать такую базу? Почему сами компании в базы не собираются типа желтых страниц, если им такое внимание может быть полезно?
База Чекко не отличается полнотой. Сейчас сделал тестовые выборки из СПАРКа и из Чекко. По одной и той же выборке в СПАРКе есть контактные данные, а у Чекко - нет.
Контактные данные ИП Чекко вообще не публикует в соответствии со 152-ФЗ (а в СПАРКе - есть).
Всегда! Нет. Никогда! Никогда не используйте актуальный email и телефон, даже в таких шаражках как налоговая. Иначе потом вот такое мудачье соберет вас в базу, а потом другое мудачье будет спамить спамить спамить... бесконечно.
Пользуясь случаем, передаю привет альфа_дно_банку.
Один основной скрытый email и на него делаем редиректы под каждую формочку, которая захочет от вас email. Как только пошел спам - ящик удален.
Аналогично должна быть вторая симка, включать которую только когда надо. Все остальное время - в рельсу.
А для чего поле crc32 в первой таблице, из каких полей составлен хэш? И что за поля min_num, max_num в ней? Есть ли у ИТСОФТ данные по полным адресам ИП (включая улицу и дом), если да то в каких базах?
org2.crc32 — это уникальный ключ crc32(kpp, short_name, full_name, street, house, corpus, apartment). min_num, max_num, cdate_num, update_at_num — это сокращённая форма даты в виде двухбайтового целого.
Можете подробнее прочитать на их ресурсе - https://egrul.itsoft.ru/
Как собрать базу организаций за час