Проблема в том, что много адресов неполные. И парсить их бесполезно.
Думаю, что выделение сущностей из адреса всё-таки полезно, т.к. можно выделить такие объекты как города, улицу, район и т.д. А разобранные на части адреса (и сохраненные в базе) уже можно сравнивать не кусками текста, а по индексам.
Да, спасибо за комментарий. На самом деле все как описали: сначала появилась идея, а потом пытаемся найти применение. Но не совсем: перед началом технической реализации функции мы все-таки делали небольшой опрос потенциальных покупателей, который показал: функция может быть полезной. Наверное это нужно было отразить в статье... Просто охват такого опроса был небольшой. Реализация функции была относительно недолгой, поэтому можно рассматривать новую фунцию этапом создания MVP (хотя и получилось сделать полноценную функцию).
Что касается других преимуществ программы в целом - то это не предмет рассмотрения для текущей статьи, но я обязательно учту замечания, если буду писать статью на эту тему.
Что касается любых платформ - почему они не могут быть клиентами? Ведь мы можем улучшить их функционал! Обитают ли наши клиенты на amoCRM и Bitrix24 ? Это вопрос... Ведь наш SDK расчитан скорее на разработчиков систем, чем на конечных пользователей - они смогут реализовать эти функции только с помощью разработчиков.
Специально не упоминал название CRM, но это был не amroCRM. Значит еще одна функция Pullenti - выделение одинаковых адресов пригодилась бы как минимум двум известным CRM системам )
Справочник Росфинмониторинга не такой уж большой - и его реально "распарсить" на эти самые именованные сущности. А потом легко сравнивать с теми же адресами и ФИО как в справочниках или витринах клиентов, так и в назначениях платежей. При этом SDK Pullenti может работать в закрытом контуре - как это требуется по политике безопасности.
Отдельная функция Pullenti - привязка адресов к ГАР ФИАС. Но если обновление справочника на бою проблематично - можно обойтись и без него (нормализация адресов все равно будет выполнена). Или можно загрузить ФИАС, а потом обновлять данные в нем в закрытом контуре (не добавлять новые записи из ФИАС, а создавать собсвенные новые записи по нормализованным адресам в автоматическом режиме).
Вот именно, город не нарезался по муниципальным районам. Взяли за основу карту доставки роллов одной компании. Потом наложили карту и подобрали под каждый кусок индексы почтовых отделений, которые находятся на территории
Подскажите, попадет ли на контроль такая ситуация? (абстрагируемся от совпадения по другим полям)
в списке контролируемых субъектов адрес в таком виде: Самарская область, г. Самара,Советский р-н, Первый Безымянный пер., д. 144
в базе данных клиентов в таком виде: Самарская область, 1-й Безымянный переулок, дом 144
Думаю, что выделение сущностей из адреса всё-таки полезно, т.к. можно выделить такие объекты как города, улицу, район и т.д. А разобранные на части адреса (и сохраненные в базе) уже можно сравнивать не кусками текста, а по индексам.
если там есть Java или .NET Core, то работает
Хороший вопрос! Обязательно проведем тестирование производительности. По возможности напишу отдельный пост.
Да, спасибо за комментарий. На самом деле все как описали: сначала появилась идея, а потом пытаемся найти применение. Но не совсем: перед началом технической реализации функции мы все-таки делали небольшой опрос потенциальных покупателей, который показал: функция может быть полезной. Наверное это нужно было отразить в статье... Просто охват такого опроса был небольшой. Реализация функции была относительно недолгой, поэтому можно рассматривать новую фунцию этапом создания MVP (хотя и получилось сделать полноценную функцию).
Что касается других преимуществ программы в целом - то это не предмет рассмотрения для текущей статьи, но я обязательно учту замечания, если буду писать статью на эту тему.
Что касается любых платформ - почему они не могут быть клиентами? Ведь мы можем улучшить их функционал! Обитают ли наши клиенты на amoCRM и Bitrix24 ? Это вопрос... Ведь наш SDK расчитан скорее на разработчиков систем, чем на конечных пользователей - они смогут реализовать эти функции только с помощью разработчиков.
Спасибо, отвечу в следующем комменте.
Специально не упоминал название CRM, но это был не amroCRM. Значит еще одна функция Pullenti - выделение одинаковых адресов пригодилась бы как минимум двум известным CRM системам )
Правильно я понимаю, что список террористов-экстремистов не содержит адреса их проживания, обычно там место рождения
Например:
684. АЗИМОВ РИФАТ ЗАГИТОВИЧ*, 03.01.1966 г.р. , Д. СЕДЯШ ОКТЯБРЬСКОГО РАЙОНА ПЕРМСКОЙ ОБЛАСТИ;
Посмотрите демострацию определения именованных сущностей на сайте https://pullenti.ru/Demo
Справочник Росфинмониторинга не такой уж большой - и его реально "распарсить" на эти самые именованные сущности. А потом легко сравнивать с теми же адресами и ФИО как в справочниках или витринах клиентов, так и в назначениях платежей. При этом SDK Pullenti может работать в закрытом контуре - как это требуется по политике безопасности.
Отдельная функция Pullenti - привязка адресов к ГАР ФИАС. Но если обновление справочника на бою проблематично - можно обойтись и без него (нормализация адресов все равно будет выполнена). Или можно загрузить ФИАС, а потом обновлять данные в нем в закрытом контуре (не добавлять новые записи из ФИАС, а создавать собсвенные новые записи по нормализованным адресам в автоматическом режиме).
Pullenti прекрасно справляется, если в адресе нет улицы. Например, первый адрес из примера разбирается так:
Россия, область Тюменская, город Тобольск, микрорайон №4, 41
Вот скнин с сайта, где можно это проверить https://garfias.ru/Demo:
Второй пример разбирает так:
Россия, область Свердловская, муниципальное образование Екатеринбург, поселок Палкинский Торфяник, улица Лесная, д.9
Возможность такого разбора была и до появления функции отображения GPS координат.
Спасибо за комментарий! Цель статьи: показать как можно решить задачу без использования дополнительного продукта. Так что энтропия не увеличилась )
Вот именно, город не нарезался по муниципальным районам. Взяли за основу карту доставки роллов одной компании. Потом наложили карту и подобрали под каждый кусок индексы почтовых отделений, которые находятся на территории
Добавил картинку в статью.
Согласен, на практике так и есть. Но задача не ставилась идеально оптимизированный маршрут, нужно было только разделить город на большие кластеры.
) Нет, на момент написания статьи стояла именно задача доставки документов, никакой сервис не использовался