• ФИАС и семь смертных граблей разработчика

      Чтобы нормально работать с почтовыми адресами, сайты подключают справочник адресов налоговой службы (ФИАС). На dadata.ru это сделали уже пять тысяч интернет-магазинов, CRM и стартапов.

      А мы поглядели на проблемы клиентов, подумали и собрали увесистый комплект граблей, по которым любят ходить разработчики в обнимку с ФИАСом.



      Грабли во всей их красе
    • Подсказываем реквизиты компаний по данным ФНС РФ и бесплатно ищем дубли

        DaData.ru автоматически исправляет ошибки в адресах, ФИО и телефонах. Находит и объединяет одинаковых клиентов в базе. Помогает быстро ввести адрес и ФИО покупателя, а также и реквизиты компании на форме заказа. Есть API и javascript-виджет.

        В предыдущем выпуске Дадата помогала бороться с дублями. А сейчас мы снова причинили добро:
        • бесплатно находим дубликаты в файлах до 100 записей;
        • снизили стоимость сервиса дедупликации до 5-10 копеек за запись;
        • подключили актуальные справочники налоговой службы в подсказках по компаниям.


        Читать дальше →
      • DaData.ru находит и уничтожает одинаковых людей



          DaData.ru — сервис автоматической проверки, исправления и дедупликации контактных данных (ФИО, адресов, телефонов, email, паспортов).

          У меня в телефоне 453 контакта. Среди них встречаются дубли: один и тот же человек записан то как «Леха», то как «Алексей Мегафон», а то и как «Зиновьев, Алексей Иванович». У Лехи указан скайп и день рождения, у «Алексея Николаевича» — емейл и основной мобильный номер, а у «Мегафона» — запасной номер от понятнокакого оператора.

          В телефонных контактах дубли неприятны, но не особо напрягают. Хуже, когда такая чехарда начинается с клиентской базой компании.
          Дубликаты приходят ночами и мучают маркетологов
        • DaData.ru превращает гуиды в адреса и знает всех пацанов на раёне



            DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

            В предыдущем выпуске Дадата прошлась по паспортам и банкам, а за лето взялась помочь интернет-магазинам с доставкой:
            • определять район города;
            • писать районы и города по правилам Почты России;
            • откладывать в сторонку абонентские ящики и адреса «до востребования»;
            • находить адрес до улицы по коду ФИАС.

            Читать дальше →
          • Интернет магазины доставляют правильно с помощью DaData.ru

              Клиентов интернет-магазинов бесят потерянные посылки и формы заказа с десятками полей. Когда клиента что-то бесит, он уходит. Поэтому хороший владелец магазина старается облегчить жизнь и покупателю, и себе самому.

              Владельцы пяти интернет-магазинов рассказали мне, как как они используют Подсказки DaData.ru чтобы отправлять посылки без возвратов, упрощать формы оформления заказов и сегментировать клиентов.

              Читайте, если вы владелец интернет-магазина или причастны к его разработке
            • У семи программистов адрес без дома

                Привет, Хабр!

                Мы в HumanFactorLabs парсим адреса в особо крупных размерах. Наши продукты упрощают ввод контактных данных и работу с ними.

                За 10 лет работы в результате анализа многочисленных исключений в российских адресах мы выработали правила хранения адресов, при соблюдении которых вы не потеряете важную информацию.

                Недавно на Хабре нас попросили привести примеры необычных адресов, в связи с чем и написана эта статья.
                Читать дальше →
              • Dadata.ru проверяет документы и знает все банки

                  DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

                  С предыдущего релиза мы стали еще круче работать с данными:
                  • подсказываем банковские реквизиты,
                  • возвращаем геокоординаты в подсказках по адресам,
                  • проверяем действительность паспорта,
                  • определяем стоимость квартиры.

                  Свежие подробности
                • Пишем почтовый адрес, как человеки

                    Мне совершенно непонятна выгода от удобного интерфейса.

                    Да, он красивый, с ним проще работать. Но как посчитать материальную пользу?

                    Пять лет назад в аэропортах звучал синтезированный голос, объявляя прилёты и вылеты с разорванной интонацией после каждого слова. Иногда даже отличалась скорость речи для разных слов.

                    И вот пару недель назад я заслушивался новыми объявлениями о вылетах. Было чувство, что их целиком записал профессиональный диктор, который всю жизнь учился на эту роль. Интерфейс стал лучше, он стал более натуральным.
                    Стал ли я от этого больше летать? Вряд ли.
                    Может, у меня появилось предпочтение между аэропортами? Не думаю, что это настолько важный момент.
                    Тем не менее, зачем-то люди потратили время и деньги на приведение объявлений к естественному виду. И это очень круто!

                    Мне нравится естественное представление информации автоматизированными системами, как будто с вами общается живой человек. Мне кажется, что это мелкие детали, которые формируют отношение к вашему продукту в целом.
                    И если это отношение положительное, то вас будут выбирать в дальнейшем и рекомендовать друзьям.

                    В статье я расскажу, как показывать адрес одной строкой так, будто его написал человек. Я не могу с уверенностью сказать, что, прочитав статью, вы увеличите прибыль.
                    Но мне бы очень хотелось, чтобы как можно больше систем писали адреса красиво.

                    Все правила, описанные ниже, мы выработали сами. Большинство из них используем или скоро подключим на dadata.ru.
                    Итак...
                  • DaData.ru подсказывает email и определяет город по IP

                      DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО и организации.

                      С предыдущего выпуска Дадата научилась:
                      • подсказывать email при вводе,
                      • определять город по IP-адресу,
                      • распознавать модели автомобилей.

                      Фичи доступны через пользовательский интерфейс и HTTP API.
                      Интересно, что там у вас
                    • Формы в интернет-магазинах проектируют следователи угро

                        Каждую неделю я заказываю в интернете. Стиральные машинки, книги, посуду — большая часть моего дома куплена в интернете. А приехало всё это с курьерами, которые ругались на отсутствие сдачи, попадали не по адресу и по сто раз уточняли, как доехать.

                        Я это воспринимаю довольно болезненно, потому что занимаюсь разбором и нормализацией контактных данных и знаю, что данные пользователя можно собрать с первого раза правильно.

                        Как-то в очередной раз решила заказать блендер.
                        Выбирала его в пяти магазинах и записала по ходу свои впечатления.

                        Сразу скажу, что большую часть форм я не осилила.



                        Обычно магазину нужно имя, чтобы завести клиента в CRM. Здесь требуют и фамилию, и отчество. Отчество-то зачем? Они со мной собираются официально разговаривать?

                        Также мне кажется, что почтовый адрес «8 Марта, 1-12» точно потребует уточнения оператором. В Москве есть улица «8 Марта», «8 Марта 1-я» и «8 Марта 4-я». А еще «8 Марта» есть в поселке Внуково, который тоже в Москве.

                        В чем еще не правы интернет-магазины
                      • DaData.ru вычисляет координаты, а парсер адресов виляет хвостом

                          DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email).

                          На дворе ноябрь, а на DaData.ru — новые возможности:
                          • определение геокоординат,
                          • SMS в дневное время,
                          • новый адресный алгоритм,
                          • оптимизация под смартфоны,
                          • статистика в личном кабинете, 
                          • модуль для iOS.


                          Хочу узнать больше
                        • Как выбрать алгоритм для адресного фильтра


                            Довольно часто на Хабре появляются статьи с новыми алгоритмами автоматического разбора адресов, записанных одной строкой. Кроме этого, услуги по обработке адресов предоставляют различные it-компании. В статье мы расскажем как использовать свою адресную базу для выбора алгоритма автоматического разбора адресов, и на что стоит обратить внимание при тестировании и разработке алгоритмов адресных фильтров.

                            Эта статья для всех, кто хранит данные клиентов и хочет решить одну из следующих задач:
                            1. убедиться, что адрес существует, чтобы не отправить посылку или письмо в никуда;
                            2. разбить адрес на компоненты, чтобы понять, где идут лучше продажи;
                            3. дополнить адрес недостающей информацией, чтобы оптимизировать план работы курьеров;
                            4. стандартизовать адреса, чтобы найти дублирующие записи одного и того же клиента;
                            5. актуализировать и привести адреса к формату справочника, чтобы пройти проверки регуляторов.

                            Задача автоматического разбора почтовых адресов кажется довольно простой на первый взгляд — бери да сопоставляй адресному справочнику (например, ФИАСу) слова из входной строки. Но все, кто за неё берутся, утопают в большом количестве особенностей адресов…
                            Читать дальше →
                          • ФИАС или КЛАДР: выбираем справочник адресов

                              1 июля 2014 года произошло одно из самых значимых событий в истории государства Российского: с этого момента у нас в стране наконец появилась эталонная база адресов по всем, даже самым малым населённым пунктам! Имя этой базе — ФИАС. Собственно, сам по себе справочник ФИАС появился гораздо раньше, но именно 1 июля вступил в силу ФЗ 443, согласно которому все государственные и муниципальные структуры теперь должны опираться на него как на единственно верную базу адресов. Мы решили исследовать, стоит ли переходить на ФИАС, и с какими подводными камнями столкнутся те, кто решит это делать.

                              Прочитав статью, вы узнаете:
                              • Чем отличается ФИАС от КЛАДР
                              • Можно ли уже использовать ФИАС вместо КЛАДР
                              • Стоит ли беспокоиться о переходе на ФИАС тем, кто уже работает с КЛАДР
                              • Решит ли ФИАС текущие проблемы с адресами
                              • Что ждёт тех, кто только начинает использовать адресные справочники
                              • Какие есть самые заметные и важные проблемы при работе с ФИАС и КЛАДР

                              Читать дальше →
                            • Перекодер — другой взгляд на НСИ

                                С годами компания обычно доходит до того, что много справочников на одну тему (например, «Хобби» или «Пол») хранятся в совершенно невообразимых форматах в различных системах, препятствуя эффективной интеграции и обмену данными.

                                Традиционный подход для решения этой проблемы рекомендует создавать единую версию справочника «Хобби» и настраивать потоки обмена в него (и из него) для всех информационных систем. Мы же решили пойти другим путем и создать децентрализованную опенсорсную НСИ — Перекодер.

                                Хотите знать, что именно мы сделали, и какую роль в нашем продукте играют Lucene и Apache CXF?
                                Читать дальше →
                              • Занимательная статистика от HFLabs

                                  Каждый день мы сталкиваемся с интересными случаями в КЛАДР, справочниках фамилий и иных ресурсах. Сегодня хотим вспомнить самые забавные из них.

                                  TOP интересных фамилий


                                  У Вас необычная фамилия? Поверьте, Вы далеко не одни. Вот, например, частота появлений в небольшой выборке в одном нашем проекте:

                                  Как видим, Ленин и Есенин стоят на первых местах по популярности среди клиентов, а вот Сталин нынче не в тренде. И ещё тут не указан Пушкин, который встречается в 2.5 раза чаще, чем все выше вместе взятые.
                                  Что же у нас есть ещё?
                                • Делаем адресные формы более привлекательными



                                    Одно из основных направлений работы нашей компании — очистка и стандартизация клиентских данных. Наш софт может привести в порядок любую базу данных с информацией о клиентах: исправить ошибки и опечатки, восполнить недостающую информацию, обогатить данные дополнительными сведениями, устранить дубликаты.

                                    К сожалению, однократной очистки часто бывает недостаточно: нужно не допустить попадания плохих и неполных данных в базу в будущем. Именно для решения этой задачи был разработан сервис подсказок, о котором мы писали ранее. Изначально подсказки предназначались для операторов, которым приходится вводить большое количество адресов, и были призваны ускорить их работу и сократить количество ошибок.

                                    Однако, позже мы поняли, что сервис может быть полезен всем, кто так или иначе работает с клиентскими данными. Ниже я постараюсь показать, что могут подсказки, и как с их помощью сделать ввод адресов на вашем сайте удобным и очень простым процессом.

                                    Итак, приступим!
                                  • Подсказки: API для ввода почтовых адресов и ФИО одной строкой

                                      Если вам когда-нибудь приходилось разрабатывать форму регистрации или оформления заказа, то вы знаете, что для получения из формы качественных данных нужно прикрутить множество проверок для ФИО, почтовых адресов, e-mail, телефонов. При этом так уж исторически сложилось, что разработчики пишут код валидации информации каждый раз заново. Ну а потом эти проверки приходится еще и поддерживать, а на поддержку, как известно, приходится 80% усилий.

                                      Кроме того, чем сложнее форма для ввода, и чем больше в ней валидируется информации, тем больше вероятность, что она будет глючить, и как результат — будет неудобна для пользователя.

                                      Так не должно быть.

                                      Читать дальше →

                                    Самое читаемое