Как стать автором
Обновить
128.67
Рейтинг
HFLabs
Повышаем качество клиентских данных для бизнеса

Пока, ФИАС! Рассказываем, как устроен адресный справочник ГАР

Блог компании HFLabs Анализ и проектирование систем *Data Mining *Открытые данные *Хранение данных *

1 сентября 2021 года ФНС перестала обновлять свой адресный справочник в формате ФИАС. Относительно новый ГАР внезапно стал единственным государственным адресный реестром, доступным общественности. Рассказываем, что из себя представляет новый справочник и чем он отличается от ФИАС.

Та самая историческая новость. До нее в смерть ФИАС особо не верили. В конце концов, ФНС уже 10 лет обновляет КЛАДР — предшественника ФИАС
Та самая историческая новость. До нее в смерть ФИАС особо не верили. В конце концов, ФНС уже 10 лет обновляет КЛАДР — предшественника ФИАС

Чтобы больше знать о справочниках и работе с данными, подписывайтесь на телеграм-канал @hflabs_official. Мы пишем о персданных, качестве данных, открытых данных. А также об MDM, CDI, Big Data в клиентских данных и аналитике.

И два слова для тех, кто еще не отказался от старого ФИАС и страдает без обновлений. Мы в HFLabs выпускаем, поддерживаем и бесплатно раздаем собственный «ФИАС» на базе ГАР. Его можно спокойно использовать как источник данных везде, где требуется оригинальный ФИАС. Описание нашего справочника и ссылка на скачивание — в статье «Сделали „ФИАС“ на основе ГАР…».

А теперь — о ГАР.

Что такое ГАР

ГАР — это государственный адресный реестр, который содержит адреса «объектов налогообложения». То есть всего, с чего ФНС собирает налоги: участков, домов, квартир и тому подобного. Именно поэтому справочником управляет Федеральная налоговая служба. Ведомство собирает, обновляет и выкладывает упорядоченные адреса в общий доступ на своем сайте.

Поскольку налогом облагается почти вся недвижимость и земля, адресный справочник ФНС — самый полный из доступных простым смертным. Поэтому бизнес использует ГАР как эталонный источник адресов. А регуляторы требуют указывать в отчетности адреса по ГАР, потому что это официальный справочник.

Допустим, кредитная организация сдает Центробанку отчетность по банкоматам. Требование регулятора к отчету: адреса указывать строго в формате справочника ФНС.

Или будничный пример: человек заказывает пиццу. Когда он вводит адрес, форма заказа предлагает подсказку-автозаполнение. Надежные подсказки разработчики достают из ГАР, самого полного общедоступного источника.

Подсказки нашего проекта DaData получают адреса как раз из ГАР
Подсказки нашего проекта DaData получают адреса как раз из ГАР

Как жили до ГАР

До января 2012 года в России государственный классификатор адресов вели в формате КЛАДР 4.0. При этом пользователи массово жаловались на неточности: состояние справочника эмоционально характеризовали как «бардак».

Потом появился ФИАС, но изменилась только структура справочника, а не содержание. Вот один из характерных отзывов о ФИАС.

Адреса ведут муниципалитеты. Там и так бардак, и добавление этой функции порядка не добавит. О синхронности действий муниципалитетов говорить вообще не приходится. Для примера — одно шоссе, проходящее через три муниципалитета, будет введено три раза под отдельными номерами. Возможно, это не баг, а фича, но «не плодите сущности без меры» никто не отменял.

Как и КЛАДР 4.0, ФИАС содержал адреса только в административном делении. Это ключевое отличие старых форматов от ГАР, поэтому остановлюсь подробнее.

Административное деление территории России — одна из систем, по которой власти структурируют территорию страны.

  • Страна делится на республики, края, области, города федерального значения, автономные области и автономные округа.

  • Каждый из этих субъектов РФ подразделяется на районы и города областного и республиканского подчинения.

  • Затем — на города районного подчинения, районы в городах, поселки.

Взглянув на такой адрес, видишь административную систему территориального управления. То есть какой субъект какой территорией управляет.

Адрес Новосибирская обл, Новосибирский район, тер. СНТ Яблоневый сад показывает, что управление СНТ Яблоневый сад подчиняется властям Новосибирского района, а те, в свою очередь — правительству Новосибирской области.

До сентября 2021 года бизнес спокойно пользовался адресным справочником в формате ФИАС. Казалось, это навсегда, пока не закончилось. (При этом налоговая все еще выгружает КЛАДР. Правда, обещает, что прекратит в конце 2022 года).

Зачем понадобился новый справочник

ГАР потребовался потому, что российские власти провели реформу местного самоуправления. Они добавили к административной системе управления еще одну — муниципальную.

Так вот, в новый справочник включили адреса в муниципальном делении. Поэтому ГАР хранит адреса в двух типах делений. Это не единственное его отличие от ФИАС и КЛАДР, но самое важное.

В муниципальном делении территории России появились муниципальные образования. Это структуры, которых нет в административной системе управления. Например, муниципальные округа, сельские и городские поселения.

По адресу в муниципальном делении видно, какой орган муниципальной власти какой территорией управляет.

Что характерно, адрес в муниципальном делении порой совершенно не похож на адрес в административном.

Административное деление: Калужская обл, Людиновский район, деревня Кургановка, дом 1.

Муниципальное деление: Калужская обл, муниципальный район Людиновский, сельское поселение деревня Заболотье, деревня Кургановка, ул. Центральная, дом 1.

В административной цепочке у этого адреса нет улицы. Дом принадлежит напрямую населенному пункту.

Адреса разных форматов особенно отличаются, когда границы и названия муниципальных и административных образований сильно разнятся. Например, если административный округ включает в себя несколько муниципальных районов. Или административный район — это несколько муниципальных образований.

Согласно административному делению в Свердловскую область входит Алапаевский район. В муниципальном делении Алапаевский район разбит на муниципальные образования — Алапаевское и Махнёвское.

Поскольку адреса в разных делениях выглядят по-разному, ФИАС утратил универсальность. Его больше нельзя использовать везде. Например, если государство потребует от бизнеса отчеты с адресами в муниципальном делении, административное посчитают ошибкой. Регуляторы за такое наказывают.

Пока адреса в муниципальном делении указывают лишь ведомства, оказывающие муниципальные услуги. Чаще всего МФЦ. Остальным  регуляторы разрешают отчеты в привычном формате. Но как долго это продлится, неясно: требования могут изменить так же резко, как убрали ФИАС. Переходить на ГАР лучше заранее.

Как получить доступ к ГАР

ФНС публикует ГАР на своем сайте в разделе «Федеральная информационная адресная система». Скачать ГАР, как и любой справочник адресов Налоговой, может любой. Доступ бесплатен по закону 443-ФЗ.

ФНС выкладывает полный ГАР и обновления к нему в среднем два раза в неделю. Иногда сначала публикуют только полный справочник или только обновления, а остальное — через день-два. ФНС маркирует такие выгрузки одной датой.

Для обновлений мы рекомендуем полные версии справочника, в дельтах попадались ошибки. В целых базах они тоже есть, но меньше
Для обновлений мы рекомендуем полные версии справочника, в дельтах попадались ошибки. В целых базах они тоже есть, но меньше

Налоговая публиковала ФИАС в двух форматах: xml и dbf. ГАР выгружают только в виде xml-файлов.

Как выглядит структура справочника

Архив с ГАР весит ≈31 Гб, распакованный занимает ≈234 Гб. Справочник потяжелел почти в три раза по сравнению с ФИАС, потому что в него добавили муниципальное деление. А еще изменилась структура. Проще говоря, файлов стало больше.

Распаковав архив, получаем десять файлов в формате xml и 92 папки. Одна папка — один субъект РФ. Номер папки соответствует номеру региона, включая неактуальные — например, Корякский округ. Его в 2007 году власти объединили с Камчатской областью и назвали объединенный регион Камчатским краем. Неактуальные регионы хранятся в папках под номерами 80, 81, 82, 84, 85, 88. В папке номер 99 — Байконур.

В «беспапочные» файлы ФНС выкладывает общую информацию: типы домов, квартир, уровни объектов адресов, виды и типы нормативной документации
В «беспапочные» файлы ФНС выкладывает общую информацию: типы домов, квартир, уровни объектов адресов, виды и типы нормативной документации

В каждой папке лежат 10 xml-файлов. Внутри каждого хранится информация об адресах соответствующего папке субъекта РФ. В папках неактуальных регионов хранятся исторические адресные данные.

Для примера открою папку с Адыгеи — 01.

Еще в папке лежат нормативные документы, машиноместа, комнаты, участки, помещения: нежилые и квартиры
Еще в папке лежат нормативные документы, машиноместа, комнаты, участки, помещения: нежилые и квартиры

Файлы AS_ADM_HIERARCHY* и AS_MUN_HIERARCHY* хранят идентификаторы адресного объекта и его родителя. Благодаря идентификаторам мы можем восстановить соотношения между объектами в разных типах территориального деления.

Например, в *HIERARCHY* хранятся пары записей c ОBJECTID и PARENTОBJID, объект и его родитель.

Пара записей показывает связи между частями адреса в разных типах территориального деления
Пара записей показывает связи между частями адреса в разных типах территориального деления

Адресные данные хранятся в файлах AS_ADDR_OBJ*, AS_HOUSES*.

В файлах AS_ADDR_OBJ лежат компоненты адреса от региона до улицы. LEVEL указывает, к какому уровню относится часть адреса. Сельское или городское поселение — 4, населенный пункт — 6, улица — 8
В файлах AS_ADDR_OBJ лежат компоненты адреса от региона до улицы. LEVEL указывает, к какому уровню относится часть адреса. Сельское или городское поселение — 4, населенный пункт — 6, улица — 8

Каждый элемент xml-файлов описан в документации к ГАР на сайте ФНС. Правда, многие жалуются, что полной ясности это описание не вносит. Надо признать, что это действительно так.

Какие поля предусмотрели в ФИАС, но убрали из ГАР

Вот главные потери в содержании нового справочника.

  1. Из файлов с адресными объектами убрали поля кодов ОКТМО, ОКАТО, ИФНС, КЛАДР и кадастровый номер. Теперь эти данные живут в файлах  *PARAMS*.

  2. Отказались от поля «Состояние дома». Раньше сюда вносили значения «Под снос», «Капремонт» и тому подобные. Но намного чаще — «Без особого состояния». В ФИАС это поле с начала 2020 года и вовсе было пустым. Наверное, поэтому и убрали — за ненадобностью.

  3. Почтовые индексы оставили лишь на уровне домов. То есть только в файлах AS_HOUSE_PARAMS*. Дело в том, что «Почта России» официально присваивает индексы только домам. В новом формате адресного справочника отразили эту норму. Впрочем, начало положила последняя выгрузка ФИАС.

Какие новшества появились в справочнике

Добавили муниципальное деление адресов. Файлы с адресами в административном делении начинаются с AS_ADM_HIERARCHY*, в муниципальном — с AS_MUN_HIERARCHY*. Лежат эти файлы в папках регионов.

Населенные пункты, улицы и дома в муниципальном делении чаще всего выглядят по-прежнему, а вот их родительские объекты изменились.

Административное деление: Тульская обл, Киреевский район, п. Бородинский.

Муниципальное деление: Тульская обл, муниципальный район Киреевский, сельское поселение Бородинское, п. Бородинский.

Ввели три новых уровня адреса: «Муниципальный район», «Сельское/городское поселение», «Машиноместо». Два из них, «Муниципальный район» и «Сельское/городское поселение», чтобы поддержать муниципальное деление.

Теперь список уровней адресных объектов выглядит так:

  1. Субъект РФ.

  2. Административный район.

  3. Муниципальный район.

  4. Сельское/городское поселение.

  5. Город.

  6. Населенный пункт.

  7. Элемент планировочной структуры.

  8. Элемент улично-дорожной сети.

  9. Земельный участок.

  10. Здание (сооружение).

  11. Помещение.

  12. Помещения в пределах помещения.

  13. Уровень автономного округа (устаревшее).

  14. Уровень внутригородской территории (устаревшее).

  15. Уровень дополнительных территорий (устаревшее).

  16. Уровень объектов на дополнительных территориях (устаревшее).

  17. Машиноместо.

Ввели новый уникальный идентификатор компонентов адреса — OBJECTID. По универсальному идентификатору собирают части адреса, которые находятся в разных файлах справочника, но относятся к одному адресному объекту.

Если известен идентификатор объекта, по нему легко собрать полный адрес строкой. Со всеми «родителями», «бабушками» и «прадедушками». А также найти атрибуты — скажем, коды ОКАТО, ОКТМО и почтовый индекс.

GUID, выполнявший функции универсального идентификатора в ФИАС, в ГАР остался. Его значения тоже прежние. Но теперь он называется OBJECTGUID и хранится только в файлах с адресными объектами. Например, в AS_ADDR_OBJ* и AS_HOUSES*. Это серьезное изменение, но проблем оно не принесло: изменилась роль GUID, но не значение. По-прежнему нет проблем определить GUID в ГАР.

Файл AS_ADDR_OBJ* в папке региона подскажет, какой OBJECTID в ГАР соответствует прежнему OBJECTGUID. Работает для объектов уровня от улицы и выше
Файл AS_ADDR_OBJ* в папке региона подскажет, какой OBJECTID в ГАР соответствует прежнему OBJECTGUID. Работает для объектов уровня от улицы и выше

Изменили способ хранения информации о номере дома. Всего в ГАР 14 типов домов, они хранятся в поле HOUSETYPES. По сравнению с ФИАС из нового справочника убрали пустое поле «0» — «Не определено». И добавили четыре типа: «Строение», «Сооружение», «Литера», «Корпус».

  1. Владение.

  2. Дом.

  3. Домовладение.

  4. Гараж.

  5. Здание.

  6. Шахта.

  7. Строение.

  8. Сооружение.

  9. Литера.

  10. Корпус.

  11. Подвал.

  12. Котельная.

  13. Погреб.

  14. Объект незавершенного строительства (ОНС).

Типы дополнительных частей номера дома лежат в файлах AS_ADDHOUSE_TYPES*.

В ФИАС корпус не относился к типу строения. Зато в ГАР литера почему-то числится неактуальной, хотя домов с этой частью адреса более 170 тысяч (Питер, привет!)
В ФИАС корпус не относился к типу строения. Зато в ГАР литера почему-то числится неактуальной, хотя домов с этой частью адреса более 170 тысяч (Питер, привет!)

Значительно изменилась структура хранения номера дома. ФИАС предусматривал пять полей: «Тип дома», «Номер дома», «Номер корпуса», «Тип строения», «Номер строения». Причем в строение записывали или собственно строение, или сооружение.  Если номер здания включал одновременно строение и сооружение, в ФИАС записать их было некуда. Номер дома попросту обрезался.

В ГАР у номера дома не пять частей, а шесть. Причем все называются по-новому.

Дом в первой строке: владение (housetype = 1) 5, корпус (addtype1 = 1) 1, строение (addtype2 = 2) А. Во второй: корпус (housetype = 10) 1, строение (addtype1 = 2) 9/7
Дом в первой строке: владение (housetype = 1) 5, корпус (addtype1 = 1) 1, строение (addtype2 = 2) А. Во второй: корпус (housetype = 10) 1, строение (addtype1 = 2) 9/7

ГАР прекрасно хранит раскидистые номера домов, которые ФИАС обрезал.

Так в разных форматах выглядит адрес с OBJECTGUID 735a8883-751e-4403-aa67-f4ebbe689829.

ФИАС: Томская обл, город Северск, дорога Автодорога, д. 14/11 стр. 1.

ГАР: Томская обл, город Северск, дорога Автодорога, д. 14/11 стр. 1. сооружение 2КАН.

ГАР, предварительные итоги

Главное, что принес новый формат справочника — классификацию адресов в муниципальном территориальном делении. Причем административное деление справочник сохранил.

У ГАР более универсальная структура, чем у ФИАС. Разработчики заложили запас: если данных прибавится, структуру справочника, скорее всего, менять не придется.

В новый справочник добавили три уровня адреса: «Муниципальный район», «Сельское/городское поселение» и «Машиноместо». «Муниципальный район» и «Сельское/городское поселение» — чтобы поддержать муниципальное деление.

Адреса стали точнее, потому что изменилась структура номера дома. Для него добавили полей. Раньше их порой не хватало, адреса не вмещались.

Наконец, мы вышли из кабинета в поля и попросили отзыв у специалиста по ГАР. Человека, который каждый день работает со справочником.

Елена Расторгуева, руководитель продукта HFLabs «Фактор». Ее подразделение готовит ГАР для бизнес-задач

«Работать можно с любой структурой. Структура ФИАС была понятнее, но её меняли при добавлении новой информации об адресах. В ГАР структура универсальнее, но историю переименований и переподчинений а́дреса мы собираем из нескольких мест. В ФИАС эту информацию хранили в одном файле.

Как и в ФИАС, в ГАР нет единообразия в данных, встречаются ошибки. Появились объекты с несколькими «родителями». Скажем, улицы, находящиеся в нескольких городских районах.

Здесь бывают моменты, которые вызывают недоумение.

Например, в Москве принцип заведения длинных улиц в ГАР такой: улица одновременно принадлежит нескольким муниципальным округам, «родителем» которых является город Москва. Разные дома на одной улице относятся к разным районам города. То есть порядок адреса таков: г. Москва, муниципальный район, длинная улица:
— г. Москва, Гагаринский муниципальный район, Ленинский проспект, д. 53 стр. 4;
г. Москва, Ломоносовский муниципальный район, Ленинский проспект, д  91.

В Самаре «московский» принцип неожиданно изменился. Например, длинный проспект Кирова тоже проходит через несколько городских районов. Но здесь город Самара подчинен десяти городским районам. А они — городскому округу Самара: Самарская область, городской округ Самара, внутригородской район Промышленный, город Самара:
— Самарская область, городской округ Самара, город Самара Промышленный внутригородской район, проспект Кирова, д.  62;
— Самарская область, городской округ Самара, город Самара Кировский внутригородской район, проспект Кирова, д. 257.

Внезапно, да? Загадка касается небольшого количества адресов, но все равно странно».

Чтобы больше знать о справочниках и работе с данными, подписывайтесь на телеграм-канал @hflabs_official. Мы пишем о персданных, качестве данных, открытых данных. А также об MDM, CDI, Big Data в клиентских данных и аналитике.

Теги:
Хабы:
Всего голосов 25: ↑22 и ↓3 +19
Просмотры 22K
Комментарии Комментарии 17

Информация

Дата основания
Местоположение
Россия
Сайт
www.hflabs.ru
Численность
51–100 человек
Дата регистрации
Представитель
Максим Пименов