Как стать автором
Обновить
HFLabs
Повышаем качество клиентских данных для бизнеса
Сначала показывать

У семи программистов адрес без дома

Время на прочтение4 мин
Количество просмотров98K
Привет, Хабр!

Мы в HumanFactorLabs парсим адреса в особо крупных размерах. Наши продукты упрощают ввод контактных данных и работу с ними.

За 10 лет работы в результате анализа многочисленных исключений в российских адресах мы выработали правила хранения адресов, при соблюдении которых вы не потеряете важную информацию.

Недавно на Хабре нас попросили привести примеры необычных адресов, в связи с чем и написана эта статья.
Читать дальше →
Всего голосов 104: ↑101 и ↓3+98
Комментарии211

Dadata.ru проверяет документы и знает все банки

Время на прочтение1 мин
Количество просмотров16K
DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

С предыдущего релиза мы стали еще круче работать с данными:
  • подсказываем банковские реквизиты,
  • возвращаем геокоординаты в подсказках по адресам,
  • проверяем действительность паспорта,
  • определяем стоимость квартиры.

Свежие подробности
Всего голосов 30: ↑26 и ↓4+22
Комментарии52

Пишем почтовый адрес, как человеки

Время на прочтение8 мин
Количество просмотров80K
Мне совершенно непонятна выгода от удобного интерфейса.

Да, он красивый, с ним проще работать. Но как посчитать материальную пользу?

Пять лет назад в аэропортах звучал синтезированный голос, объявляя прилёты и вылеты с разорванной интонацией после каждого слова. Иногда даже отличалась скорость речи для разных слов.

И вот пару недель назад я заслушивался новыми объявлениями о вылетах. Было чувство, что их целиком записал профессиональный диктор, который всю жизнь учился на эту роль. Интерфейс стал лучше, он стал более натуральным.
Стал ли я от этого больше летать? Вряд ли.
Может, у меня появилось предпочтение между аэропортами? Не думаю, что это настолько важный момент.
Тем не менее, зачем-то люди потратили время и деньги на приведение объявлений к естественному виду. И это очень круто!

Мне нравится естественное представление информации автоматизированными системами, как будто с вами общается живой человек. Мне кажется, что это мелкие детали, которые формируют отношение к вашему продукту в целом.
И если это отношение положительное, то вас будут выбирать в дальнейшем и рекомендовать друзьям.

В статье я расскажу, как показывать адрес одной строкой так, будто его написал человек. Я не могу с уверенностью сказать, что, прочитав статью, вы увеличите прибыль.
Но мне бы очень хотелось, чтобы как можно больше систем писали адреса красиво.

Все правила, описанные ниже, мы выработали сами. Большинство из них используем или скоро подключим на dadata.ru.
Итак...
Всего голосов 25: ↑20 и ↓5+15
Комментарии60

DaData.ru подсказывает email и определяет город по IP

Время на прочтение1 мин
Количество просмотров15K
DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО и организации.

С предыдущего выпуска Дадата научилась:
  • подсказывать email при вводе,
  • определять город по IP-адресу,
  • распознавать модели автомобилей.

Фичи доступны через пользовательский интерфейс и HTTP API.
Интересно, что там у вас
Всего голосов 18: ↑16 и ↓2+14
Комментарии26

Формы в интернет-магазинах проектируют следователи угро

Время на прочтение3 мин
Количество просмотров25K
Каждую неделю я заказываю в интернете. Стиральные машинки, книги, посуду — большая часть моего дома куплена в интернете. А приехало всё это с курьерами, которые ругались на отсутствие сдачи, попадали не по адресу и по сто раз уточняли, как доехать.

Я это воспринимаю довольно болезненно, потому что занимаюсь разбором и нормализацией контактных данных и знаю, что данные пользователя можно собрать с первого раза правильно.

Как-то в очередной раз решила заказать блендер.
Выбирала его в пяти магазинах и записала по ходу свои впечатления.

Сразу скажу, что большую часть форм я не осилила.



Обычно магазину нужно имя, чтобы завести клиента в CRM. Здесь требуют и фамилию, и отчество. Отчество-то зачем? Они со мной собираются официально разговаривать?

Также мне кажется, что почтовый адрес «8 Марта, 1-12» точно потребует уточнения оператором. В Москве есть улица «8 Марта», «8 Марта 1-я» и «8 Марта 4-я». А еще «8 Марта» есть в поселке Внуково, который тоже в Москве.

В чем еще не правы интернет-магазины
Всего голосов 36: ↑24 и ↓12+12
Комментарии54

DaData.ru вычисляет координаты, а парсер адресов виляет хвостом

Время на прочтение2 мин
Количество просмотров21K
DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email).

На дворе ноябрь, а на DaData.ru — новые возможности:
  • определение геокоординат,
  • SMS в дневное время,
  • новый адресный алгоритм,
  • оптимизация под смартфоны,
  • статистика в личном кабинете, 
  • модуль для iOS.


Хочу узнать больше
Всего голосов 30: ↑23 и ↓7+16
Комментарии26

Как выбрать алгоритм для адресного фильтра

Время на прочтение8 мин
Количество просмотров19K

Довольно часто на Хабре появляются статьи с новыми алгоритмами автоматического разбора адресов, записанных одной строкой. Кроме этого, услуги по обработке адресов предоставляют различные it-компании. В статье мы расскажем как использовать свою адресную базу для выбора алгоритма автоматического разбора адресов, и на что стоит обратить внимание при тестировании и разработке алгоритмов адресных фильтров.

Эта статья для всех, кто хранит данные клиентов и хочет решить одну из следующих задач:
  1. убедиться, что адрес существует, чтобы не отправить посылку или письмо в никуда;
  2. разбить адрес на компоненты, чтобы понять, где идут лучше продажи;
  3. дополнить адрес недостающей информацией, чтобы оптимизировать план работы курьеров;
  4. стандартизовать адреса, чтобы найти дублирующие записи одного и того же клиента;
  5. актуализировать и привести адреса к формату справочника, чтобы пройти проверки регуляторов.

Задача автоматического разбора почтовых адресов кажется довольно простой на первый взгляд — бери да сопоставляй адресному справочнику (например, ФИАСу) слова из входной строки. Но все, кто за неё берутся, утопают в большом количестве особенностей адресов…
Читать дальше →
Всего голосов 27: ↑24 и ↓3+21
Комментарии19

ФИАС или КЛАДР: выбираем справочник адресов

Время на прочтение9 мин
Количество просмотров183K
1 июля 2014 года произошло одно из самых значимых событий в истории государства Российского: с этого момента у нас в стране наконец появилась эталонная база адресов по всем, даже самым малым населённым пунктам! Имя этой базе — ФИАС. Собственно, сам по себе справочник ФИАС появился гораздо раньше, но именно 1 июля вступил в силу ФЗ 443, согласно которому все государственные и муниципальные структуры теперь должны опираться на него как на единственно верную базу адресов. Мы решили исследовать, стоит ли переходить на ФИАС, и с какими подводными камнями столкнутся те, кто решит это делать.

Прочитав статью, вы узнаете:
  • Чем отличается ФИАС от КЛАДР
  • Можно ли уже использовать ФИАС вместо КЛАДР
  • Стоит ли беспокоиться о переходе на ФИАС тем, кто уже работает с КЛАДР
  • Решит ли ФИАС текущие проблемы с адресами
  • Что ждёт тех, кто только начинает использовать адресные справочники
  • Какие есть самые заметные и важные проблемы при работе с ФИАС и КЛАДР

Читать дальше →
Всего голосов 63: ↑62 и ↓1+61
Комментарии75

Перекодер — другой взгляд на НСИ

Время на прочтение6 мин
Количество просмотров10K
С годами компания обычно доходит до того, что много справочников на одну тему (например, «Хобби» или «Пол») хранятся в совершенно невообразимых форматах в различных системах, препятствуя эффективной интеграции и обмену данными.

Традиционный подход для решения этой проблемы рекомендует создавать единую версию справочника «Хобби» и настраивать потоки обмена в него (и из него) для всех информационных систем. Мы же решили пойти другим путем и создать децентрализованную опенсорсную НСИ — Перекодер.

Хотите знать, что именно мы сделали, и какую роль в нашем продукте играют Lucene и Apache CXF?
Читать дальше →
Всего голосов 14: ↑9 и ↓5+4
Комментарии13

Занимательная статистика от HFLabs

Время на прочтение2 мин
Количество просмотров8.5K
Каждый день мы сталкиваемся с интересными случаями в КЛАДР, справочниках фамилий и иных ресурсах. Сегодня хотим вспомнить самые забавные из них.

TOP интересных фамилий


У Вас необычная фамилия? Поверьте, Вы далеко не одни. Вот, например, частота появлений в небольшой выборке в одном нашем проекте:

Как видим, Ленин и Есенин стоят на первых местах по популярности среди клиентов, а вот Сталин нынче не в тренде. И ещё тут не указан Пушкин, который встречается в 2.5 раза чаще, чем все выше вместе взятые.
Что же у нас есть ещё?
Всего голосов 22: ↑17 и ↓5+12
Комментарии9

Делаем адресные формы более привлекательными

Время на прочтение6 мин
Количество просмотров50K


Одно из основных направлений работы нашей компании — очистка и стандартизация клиентских данных. Наш софт может привести в порядок любую базу данных с информацией о клиентах: исправить ошибки и опечатки, восполнить недостающую информацию, обогатить данные дополнительными сведениями, устранить дубликаты.

К сожалению, однократной очистки часто бывает недостаточно: нужно не допустить попадания плохих и неполных данных в базу в будущем. Именно для решения этой задачи был разработан сервис подсказок, о котором мы писали ранее. Изначально подсказки предназначались для операторов, которым приходится вводить большое количество адресов, и были призваны ускорить их работу и сократить количество ошибок.

Однако, позже мы поняли, что сервис может быть полезен всем, кто так или иначе работает с клиентскими данными. Ниже я постараюсь показать, что могут подсказки, и как с их помощью сделать ввод адресов на вашем сайте удобным и очень простым процессом.

Итак, приступим!
Всего голосов 73: ↑61 и ↓12+49
Комментарии108

Подсказки: API для ввода почтовых адресов и ФИО одной строкой

Время на прочтение2 мин
Количество просмотров28K
Если вам когда-нибудь приходилось разрабатывать форму регистрации или оформления заказа, то вы знаете, что для получения из формы качественных данных нужно прикрутить множество проверок для ФИО, почтовых адресов, e-mail, телефонов. При этом так уж исторически сложилось, что разработчики пишут код валидации информации каждый раз заново. Ну а потом эти проверки приходится еще и поддерживать, а на поддержку, как известно, приходится 80% усилий.

Кроме того, чем сложнее форма для ввода, и чем больше в ней валидируется информации, тем больше вероятность, что она будет глючить, и как результат — будет неудобна для пользователя.

Так не должно быть.

Читать дальше →
Всего голосов 42: ↑40 и ↓2+38
Комментарии62

Информация

Сайт
www.hflabs.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Максим Пименов