Как стать автором
Обновить
HFLabs
Повышаем качество клиентских данных для бизнеса
Сначала показывать

Задача со звездочкой: как мы перекодировали ФИАС в КЛАДР

Время на прочтение8 мин
Количество просмотров16K


С 1 января ФНС перестанет обновлять адресный справочник КЛАДР. Он официально устареет, останется один ФИАС. Но многие промышленные системы до сих пор работают с КЛАДР. Поставщики не собираются их обновлять, а переделывать своими руками бизнесу выходит долго и дорого.

Мы послушали клиентов и придумали решение: взять ФИАС, который живее всех живых, и написать перекодировщик в КЛАДР.

Со стороны задача кажется легкой. Нам так и говорили: «То есть вы просто берете ФИАС и переделываете в КЛАДР?». На деле никакого «просто» нет. У справочников совсем разные структуры и непонятно, как из подкачанного ФИАС раскидать данные в неказистый КЛАДР. При этом общей документации для справочников нет.

Это было веселье, которым мы сейчас щедро поделимся.
Читать дальше →
Всего голосов 41: ↑39 и ↓2+37
Комментарии11

Как «Дадата» ищет дубли в списках торговых точек. Разбираем алгоритм

Время на прочтение4 мин
Количество просмотров6.3K


Наши клиенты хранят списки из тысяч компаний, и обычно там первозданный хаос.

Возьмем список торговых точек, через которые сельхозпроизводитель продает товары по всей стране. Названия магазинов пишут как хотят, поэтому типичный список выглядит так:

  1. Евразия.
  2. «САКУРА» Японская кухня.
  3. Доминант.
  4. Магазин-бутик «Евразия».
  5. Милениум, ООО, продуктовый магазин.
  6. Киви/ООО/Челябинск.
  7. Супермаркет эко-продуктов «Доминант».

Точки № 1 и № 4 — дубли, № 3 и № 7 — тоже, но поди разберись.

А разобраться надо: когда в списке из 1000 торговых точек 300 дублей, у производителя начинаются проблемы.
Что за проблемы и как мы их решаем
Всего голосов 24: ↑22 и ↓2+20
Комментарии14

Как вычислить (город пользователя) по IP

Время на прочтение8 мин
Количество просмотров113K
Зная местоположение человека, можно сделать тысячу полезных и не очень вещей: предложить правильный товар и заранее назвать цену доставки, показать ареал обитания покемонов, вывести локальные новости или посоветовать кафе неподалеку.

Местоположение — это важно.


Читать дальше →
Всего голосов 40: ↑35 и ↓5+30
Комментарии40

Что можно узнать о квартире из открытых справочников

Время на прочтение6 мин
Количество просмотров59K


Госструктуры выкладывают в интернет справочники с десятками гигабайтов информации. Если знать где искать, можно легально собрать данные о квартирах в промышленных масштабах.

Базы с индексами и районами городов тоже открыты. Бонусом я расскажу, как найти эти части адреса, если их не хватает.

Все справочники из этой статьи бесплатны и открыто лежат в интернете. Ни один не украли из ФСБ таинственные хакеры.
Шагнуть в мир открытых справочников
Всего голосов 62: ↑61 и ↓1+60
Комментарии24

Как перейти от КЛАДР к ФИАС и ничего себе не сломать

Время на прочтение7 мин
Количество просмотров107K
ГНИВЦ ФНС сообщает, что с начала 2018 года КЛАДР перестанет существовать и скачать его будет нельзя.

Дисклеймер:
Если вы совсем не поняли, что означают эти наборы букв, ничего страшного. Ниже мы расскажем о реалиях работы с адресами в России. Если вам это неинтересно, почитайте про топографические каламбуры.

Правильные адреса нужны компаниям, которые любят своих клиентов. Знакомые банки, страховые и интернет-магазины, которые сейчас используют справочник КЛАДР, спрашивают нас, что же делать дальше. Поэтому мы запарились и написали пошаговое руководство по переходу с одних букв на другие от КЛАДР к ФИАС.


Поехали!
Всего голосов 24: ↑24 и ↓0+24
Комментарии26

Как поддержка помогает «Дадате» получать новых клиентов и выгодно выделяться на фоне конкурентов

Время на прочтение4 мин
Количество просмотров5.2K
Привет! Меня зовут Лена Журавлёва, я основательница «Дадаты». «Дадата» исправляет ошибки в адресах — её используют интернет-магазины, службы доставки и автосалоны. Всего у «Дадаты» более 15 тысяч пользователей, платных и бесплатных.

Большая часть нашей работы — это поддержка, которая кроме обычной своей функции, является для нас еще и:

  • конкурентным преимуществом,
  • каналом привлечения клиентов с помощью поиска,
  • каналом привлечения клиентов через рекомендации.

Расскажу о том, как это у нас работает — это будет полезно основателям небольших сервисов.
Читать дальше →
Всего голосов 20: ↑19 и ↓1+18
Комментарии7

Топограф был пьян

Время на прочтение2 мин
Количество просмотров30K

Год назад мы публиковали на Хабре статью о необычных адресах. С тех пор мы в «Дадате» собираем коллекцию городов и улиц со странными названиями. Покажем вам любимые экспонаты.



В Люберцах есть улица 3-е Почтовое отделение. Посмотрите, кстати, на её форму — она трижды сама себя пересекает.


Читать дальше →
Всего голосов 52: ↑44 и ↓8+36
Комментарии127

Почему мы в «Дадате» тратим 2 млн долларов в год на 99,99% точность обработки данных

Время на прочтение6 мин
Количество просмотров13K

Вы когда-нибудь задумывались, почему вообще возможно исправить ошибки и опечатки в текстовых данных, например, в адресах и именах? Почему мы думаем, что «Терская» — это, скорее всего, Тверская улица, а не какая-нибудь фантастическая улица Василиятёрского? А вдруг это Комсомольский проспект, в котором сделано двадцать опечаток?


Наш жизненный опыт говорит о том, что упорядоченные низкоэнтропийные состояния менее вероятны, чем высокоэнтропийные неупорядоченные. То есть «Терская» скорее Тверская с одной опечаткой, чем Комсомольский проспект с двадцатью опечатками. Однако в жизни возникает много спорных случаев, где вероятности не так однозначны.

Читать дальше →
Всего голосов 34: ↑30 и ↓4+26
Комментарии28

Почта России для чайников

Время на прочтение6 мин
Количество просмотров302K
Почта России — это большая, сложная и не очень дружественная структура. На неё принято плеваться в социальных сетях, а поход за письмом или посылкой часто превращается в маленький квест. Про такое говорят: «Жизнь меня к этому не готовила».



Хочешь отправить книжку в подарок другу. Приходишь в отделение, а уставшая женщина спрашивает: «Как отправляем, заказной бандеролью с объявленной ценностью или первым классом?». И ты понимаешь, что это будет посложнее высоконагруженных систем, больших данных и нейросетей.

Мы в «Дадате» сильно связаны с почтой: исправляем адреса и неплохо разбираемся в особенностях её работы. Написали подробный гид по услугам Почты России, для чайников. Автор статьи — Сергей Король, редактор и почтовый гик.

Почта. Инструкция по применению
Всего голосов 68: ↑63 и ↓5+58
Комментарии62

Как улучшить почтовые адреса

Время на прочтение4 мин
Количество просмотров19K
Привет! Мы в «Дадате» хорошо разбираемся в почтовых адресах — исправляем и дополняем их для пяти тысяч интернет-магазинов, CRM и стартапов.

image

Сегодня я расскажу, почему традиционная система почтовых адресов кажется нам ущербной и предложу «облачный» способ её исправления.
Читать дальше →
Всего голосов 53: ↑41 и ↓12+29
Комментарии161

Радар для покемонов

Время на прочтение3 мин
Количество просмотров80K

Помогите, покемоны


Если вы ни разу не слышали об игре Pokemon Go, можно считать, что вам повезло. Новости о покемонах мелькают в новостных лентах, толпы людей бродят в ночи по кладбищам и воюют за сферы влияния. Только в Москве по данным МТС в Pokemon Go играет 180 000 человек, притом что в России официального запуска еще не было.


Мы в DaData.ru решили посмотреть, чем можем помочь любителям покемонов.

Кое-что получилось
Всего голосов 61: ↑49 и ↓12+37
Комментарии47

ФИАС и семь смертных граблей разработчика

Время на прочтение4 мин
Количество просмотров75K
Чтобы нормально работать с почтовыми адресами, сайты подключают справочник адресов налоговой службы (ФИАС). На dadata.ru это сделали уже пять тысяч интернет-магазинов, CRM и стартапов.

А мы поглядели на проблемы клиентов, подумали и собрали увесистый комплект граблей, по которым любят ходить разработчики в обнимку с ФИАСом.



Грабли во всей их красе
Всего голосов 25: ↑21 и ↓4+17
Комментарии15

Подсказываем реквизиты компаний по данным ФНС РФ и бесплатно ищем дубли

Время на прочтение1 мин
Количество просмотров9.4K
DaData.ru автоматически исправляет ошибки в адресах, ФИО и телефонах. Находит и объединяет одинаковых клиентов в базе. Помогает быстро ввести адрес и ФИО покупателя, а также и реквизиты компании на форме заказа. Есть API и javascript-виджет.

В предыдущем выпуске Дадата помогала бороться с дублями. А сейчас мы снова причинили добро:
  • бесплатно находим дубликаты в файлах до 100 записей;
  • снизили стоимость сервиса дедупликации до 5-10 копеек за запись;
  • подключили актуальные справочники налоговой службы в подсказках по компаниям.


Читать дальше →
Всего голосов 11: ↑9 и ↓2+7
Комментарии13

DaData.ru находит и уничтожает одинаковых людей

Время на прочтение4 мин
Количество просмотров21K


DaData.ru — сервис автоматической проверки, исправления и дедупликации контактных данных (ФИО, адресов, телефонов, email, паспортов).

У меня в телефоне 453 контакта. Среди них встречаются дубли: один и тот же человек записан то как «Леха», то как «Алексей Мегафон», а то и как «Зиновьев, Алексей Иванович». У Лехи указан скайп и день рождения, у «Алексея Николаевича» — емейл и основной мобильный номер, а у «Мегафона» — запасной номер от понятнокакого оператора.

В телефонных контактах дубли неприятны, но не особо напрягают. Хуже, когда такая чехарда начинается с клиентской базой компании.
Дубликаты приходят ночами и мучают маркетологов
Всего голосов 31: ↑24 и ↓7+17
Комментарии40

DaData.ru превращает гуиды в адреса и знает всех пацанов на раёне

Время на прочтение2 мин
Количество просмотров50K


DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

В предыдущем выпуске Дадата прошлась по паспортам и банкам, а за лето взялась помочь интернет-магазинам с доставкой:
  • определять район города;
  • писать районы и города по правилам Почты России;
  • откладывать в сторонку абонентские ящики и адреса «до востребования»;
  • находить адрес до улицы по коду ФИАС.

Читать дальше →
Всего голосов 44: ↑34 и ↓10+24
Комментарии56

Интернет магазины доставляют правильно с помощью DaData.ru

Время на прочтение3 мин
Количество просмотров12K
Клиентов интернет-магазинов бесят потерянные посылки и формы заказа с десятками полей. Когда клиента что-то бесит, он уходит. Поэтому хороший владелец магазина старается облегчить жизнь и покупателю, и себе самому.

Владельцы пяти интернет-магазинов рассказали мне, как как они используют Подсказки DaData.ru чтобы отправлять посылки без возвратов, упрощать формы оформления заказов и сегментировать клиентов.

Читайте, если вы владелец интернет-магазина или причастны к его разработке
Всего голосов 16: ↑11 и ↓5+6
Комментарии6

У семи программистов адрес без дома

Время на прочтение4 мин
Количество просмотров97K
Привет, Хабр!

Мы в HumanFactorLabs парсим адреса в особо крупных размерах. Наши продукты упрощают ввод контактных данных и работу с ними.

За 10 лет работы в результате анализа многочисленных исключений в российских адресах мы выработали правила хранения адресов, при соблюдении которых вы не потеряете важную информацию.

Недавно на Хабре нас попросили привести примеры необычных адресов, в связи с чем и написана эта статья.
Читать дальше →
Всего голосов 104: ↑101 и ↓3+98
Комментарии211

Dadata.ru проверяет документы и знает все банки

Время на прочтение1 мин
Количество просмотров15K
DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

С предыдущего релиза мы стали еще круче работать с данными:
  • подсказываем банковские реквизиты,
  • возвращаем геокоординаты в подсказках по адресам,
  • проверяем действительность паспорта,
  • определяем стоимость квартиры.

Свежие подробности
Всего голосов 30: ↑26 и ↓4+22
Комментарии52

Пишем почтовый адрес, как человеки

Время на прочтение8 мин
Количество просмотров77K
Мне совершенно непонятна выгода от удобного интерфейса.

Да, он красивый, с ним проще работать. Но как посчитать материальную пользу?

Пять лет назад в аэропортах звучал синтезированный голос, объявляя прилёты и вылеты с разорванной интонацией после каждого слова. Иногда даже отличалась скорость речи для разных слов.

И вот пару недель назад я заслушивался новыми объявлениями о вылетах. Было чувство, что их целиком записал профессиональный диктор, который всю жизнь учился на эту роль. Интерфейс стал лучше, он стал более натуральным.
Стал ли я от этого больше летать? Вряд ли.
Может, у меня появилось предпочтение между аэропортами? Не думаю, что это настолько важный момент.
Тем не менее, зачем-то люди потратили время и деньги на приведение объявлений к естественному виду. И это очень круто!

Мне нравится естественное представление информации автоматизированными системами, как будто с вами общается живой человек. Мне кажется, что это мелкие детали, которые формируют отношение к вашему продукту в целом.
И если это отношение положительное, то вас будут выбирать в дальнейшем и рекомендовать друзьям.

В статье я расскажу, как показывать адрес одной строкой так, будто его написал человек. Я не могу с уверенностью сказать, что, прочитав статью, вы увеличите прибыль.
Но мне бы очень хотелось, чтобы как можно больше систем писали адреса красиво.

Все правила, описанные ниже, мы выработали сами. Большинство из них используем или скоро подключим на dadata.ru.
Итак...
Всего голосов 25: ↑20 и ↓5+15
Комментарии60

DaData.ru подсказывает email и определяет город по IP

Время на прочтение1 мин
Количество просмотров15K
DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО и организации.

С предыдущего выпуска Дадата научилась:
  • подсказывать email при вводе,
  • определять город по IP-адресу,
  • распознавать модели автомобилей.

Фичи доступны через пользовательский интерфейс и HTTP API.
Интересно, что там у вас
Всего голосов 18: ↑16 и ↓2+14
Комментарии26

Информация

Сайт
www.hflabs.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Максим Пименов