ИМХО мертворожденное
1. Структурно.
Соответсвует модным подходам в БД, но сама структура российских адресов им не соответсвует, т.е. притянуто за уши и обработка исключительных случаев будет невозможна.
Попытка смешать местоположение и адрес к хорошему не приведет.
Привязать гео координаты к адресу — достойная задача, а вот писать в улицу «31 км 200 м Черлакского тракта» — это полный бред. Конечная цель каждого адреса — доставка.
Вот удивиться почтальон когда поймет что пилить надо 31 км непонятно куда=)
2. Организационно.
Адреса ведут муниципалитеты. Там и так бардак, и добавление этой функции прядка не добавит.
Говорить о синхронности действий муниципалитетов говорить вообще не приходится=)
Для примера — одно шоссе проходящее через 3 муниципалитета будет введено 3 раза под отдельными номерами.
Возможно это не баг, а фича, но «не плодите сущности без меры» никто не отменял.
Ex.
Сдт Березка-2 от КЗАМЭ
и так 8 раз, т.к. введено разными людьми из разных муниципалитетов.
3. Целостность
Множество домов без индекса (~ 7000 записей в среднем от 10 до 500 домов на запись), а от индекса считается стоимость доставки, а это значит что вся автоматическая тарификация по этим домам будет развалена.
в строке улица данные
Гаражи в районе ул.Вокзальная 18г
Гаражи в районе ул.Геологов 52
Гаражи в районе ул.Геологов 28
Гаражи в районе ул.Гоголя 57
Гаражи в районе ул.Гоголя 60а
Звезда-3 5 км от д Сорокино
Серебристый от д Свищево 1км
Л.м. в 1.5 км. от дор. Соликамск-Кунгур
Сдт Автомобилист от ПРЗ
4000м от п.Березовка на восток
1500м от п.Березовка на юго-восток
4700м от п.Березовка на восток
4500м от п Первоманский на юго-запад
Промплощадка ООО Ковдорский торговый дом
Промплощадка ООО Топкинский цемент
СНТ ООО дизайн-студия Маренго
говорит о качестве ввода и его контроле.
Понятия снесенного дома нет в базе, как и дома на реконструкции.
Почта РФ говорит о 40-50 млн объектах почтовой связи
в фиас сейчас по оценкам около 5 млн объектов
Посмотрите на крупные мировые финансовые институты у многих кобол еще в продакшене на ключевых системах. А попасть туда с такими знаниями можно и на удаленную работу.
В профиле же все есть=)
Скрываться не имеет смысла.
про отчества -Ну да.
Тут еще транслитерация имеет значение.
У сбера есть стандарт транслитерации как обычно свой, у гос органов свой, в то же время на карту можно написать свою интерпретацию =)
в общем много вариантов сделать ошибку.
по одной записи вылеплять никто не будет так что дыра есть, но через неё врят ли кто будет много тянуть
Не у всех столь очевидно с отчеством.
да и вариантов множество
Евгвньевна ж
Евгееньевна ж
Евгеневич м
Евгеневна ж
Евгененьевна ж
Евгенеовна ж
Евгенетвна ж
Евгенеывич м
Евгениевич м
Евгениевна ж
Евгениушевна ж
Евгенньевич м
Евгенньевна ж
Евгенович м
Евгентевич м
Евгентевна ж
Евгентьевна ж
Евгеньвич м
Евгеньвна
реальные ЕВГ* из БД и по ним производится валидация при зачислении…
С именем попали скорее всего посмотрев профиль, а это уже совсем другой уровень технологии поиска на них не будут заморачиваться ради 50 центов за запись
Странное решение.
для валидации достаточно 2-3 букв из ФИО.
УТЮ*** АЛЕ*** ЕВГ***
например.
правильность получателя проверяется и мошенникам нет источника информации
Еще хотелось бы задать вопрос про так называемую «обратную ошибку»
Не считали?
Суть примерно такая.
Система распознала адрес и говорит — Все ОК — это вот здесь.
При этом на самом деле имелось в виду совсем другое место.
Понятно что для не персонализированной рекламной рассылки это не сильно критично, а вот получить в свой ящик письмо с обращением «Уважаемая мисс Марпл..» Уже ущерб компании.
А если в письме какие то закрытые данные типа выписки со счета или еще что то — то это уже не ущерб, а судебный убыток…
У них и SAAS по этому делу реализован.
Если мне память не изменяет. Намного удобней его подцепить, а не интегрировать решение.
Одно дело базу прочистить, а другое в процесс встроить
Надеюсь что так.
Просто у меня немного другое представление о этом рынке.
Я всегда думал, что это довольно закрытое сообщество со своими группировками и ярко выраженными предпочтениями и чаще всего при выборе опираются на корпоративные стандарты нежели на тесты в «попугаях».
Да и «попугаи» не всегда показательны, так как «дьявол в мелочах» можно иметь много «попугаев», но не иметь аппаратной поддержки команд определенной БД. И наоборот.
Вообще сравнение таких машин довольно сложно и тонко и требует большой непредвзятости.
Примерно это и имел в виду. Спасибо за инфу. Только не понятно как с лицензиями…
Ну да это проблема Сапа.
Кстати уже появился бенчмарк на описанный сервер на Сапе.
1. Структурно.
Соответсвует модным подходам в БД, но сама структура российских адресов им не соответсвует, т.е. притянуто за уши и обработка исключительных случаев будет невозможна.
Попытка смешать местоположение и адрес к хорошему не приведет.
Привязать гео координаты к адресу — достойная задача, а вот писать в улицу «31 км 200 м Черлакского тракта» — это полный бред. Конечная цель каждого адреса — доставка.
Вот удивиться почтальон когда поймет что пилить надо 31 км непонятно куда=)
2. Организационно.
Адреса ведут муниципалитеты. Там и так бардак, и добавление этой функции прядка не добавит.
Говорить о синхронности действий муниципалитетов говорить вообще не приходится=)
Для примера — одно шоссе проходящее через 3 муниципалитета будет введено 3 раза под отдельными номерами.
Возможно это не баг, а фича, но «не плодите сущности без меры» никто не отменял.
Ex.
Сдт Березка-2 от КЗАМЭ
и так 8 раз, т.к. введено разными людьми из разных муниципалитетов.
3. Целостность
Множество домов без индекса (~ 7000 записей в среднем от 10 до 500 домов на запись), а от индекса считается стоимость доставки, а это значит что вся автоматическая тарификация по этим домам будет развалена.
в строке улица данные
Гаражи в районе ул.Вокзальная 18г
Гаражи в районе ул.Геологов 52
Гаражи в районе ул.Геологов 28
Гаражи в районе ул.Гоголя 57
Гаражи в районе ул.Гоголя 60а
Звезда-3 5 км от д Сорокино
Серебристый от д Свищево 1км
Л.м. в 1.5 км. от дор. Соликамск-Кунгур
Сдт Автомобилист от ПРЗ
4000м от п.Березовка на восток
1500м от п.Березовка на юго-восток
4700м от п.Березовка на восток
4500м от п Первоманский на юго-запад
Промплощадка ООО Ковдорский торговый дом
Промплощадка ООО Топкинский цемент
СНТ ООО дизайн-студия Маренго
говорит о качестве ввода и его контроле.
Понятия снесенного дома нет в базе, как и дома на реконструкции.
Почта РФ говорит о 40-50 млн объектах почтовой связи
в фиас сейчас по оценкам около 5 млн объектов
те кто работал с веревкой (Скалолазы и альпинисты например) чато и провода так же бухтуют
просто и со вкусом. =)
и там не просто регулярка…
Велосипеды они нужны, но не в промышленных масштабах.
Скрываться не имеет смысла.
про отчества -Ну да.
Тут еще транслитерация имеет значение.
У сбера есть стандарт транслитерации как обычно свой, у гос органов свой, в то же время на карту можно написать свою интерпретацию =)
в общем много вариантов сделать ошибку.
по одной записи вылеплять никто не будет так что дыра есть, но через неё врят ли кто будет много тянуть
да и вариантов множество
Евгвньевна ж
Евгееньевна ж
Евгеневич м
Евгеневна ж
Евгененьевна ж
Евгенеовна ж
Евгенетвна ж
Евгенеывич м
Евгениевич м
Евгениевна ж
Евгениушевна ж
Евгенньевич м
Евгенньевна ж
Евгенович м
Евгентевич м
Евгентевна ж
Евгентьевна ж
Евгеньвич м
Евгеньвна
реальные ЕВГ* из БД и по ним производится валидация при зачислении…
С именем попали скорее всего посмотрев профиль, а это уже совсем другой уровень технологии поиска на них не будут заморачиваться ради 50 центов за запись
Есть способы проще и дешевле.
для валидации достаточно 2-3 букв из ФИО.
УТЮ*** АЛЕ*** ЕВГ***
например.
правильность получателя проверяется и мошенникам нет источника информации
Слежение за «лисами» тоже.
Всё уже украдено до нас (с)
=)
Не считали?
Суть примерно такая.
Система распознала адрес и говорит — Все ОК — это вот здесь.
При этом на самом деле имелось в виду совсем другое место.
Понятно что для не персонализированной рекламной рассылки это не сильно критично, а вот получить в свой ящик письмо с обращением «Уважаемая мисс Марпл..» Уже ущерб компании.
А если в письме какие то закрытые данные типа выписки со счета или еще что то — то это уже не ущерб, а судебный убыток…
Вообще в массовом обслуживании 60-75% не результат, так как ручная обработка 5% стоит столько что процесс удорожает в разы.
Если мне память не изменяет. Намного удобней его подцепить, а не интегрировать решение.
Одно дело базу прочистить, а другое в процесс встроить
Просто у меня немного другое представление о этом рынке.
Я всегда думал, что это довольно закрытое сообщество со своими группировками и ярко выраженными предпочтениями и чаще всего при выборе опираются на корпоративные стандарты нежели на тесты в «попугаях».
Да и «попугаи» не всегда показательны, так как «дьявол в мелочах» можно иметь много «попугаев», но не иметь аппаратной поддержки команд определенной БД. И наоборот.
Вообще сравнение таких машин довольно сложно и тонко и требует большой непредвзятости.
Ну да это проблема Сапа.
Кстати уже появился бенчмарк на описанный сервер на Сапе.
www.sap.com/solutions/benchmark/sd2tier.epx
Что ИБМ, что ХП в лицензиях прописывают — «бенчмарк нини»
Если будут найдены ошибки — пишите.
ИМХО РосТелеКом — первоисточник кодов городов.