Как стать автором
Обновить
HFLabs
Повышаем качество клиентских данных для бизнеса
Сначала показывать

Подсказки «Дадаты» помогают заполнить любые формы ввода. Теперь заживем

Время на прочтение4 мин
Количество просмотров6.6K


«Подсказки» помогают быстро и без ошибок заполнить поля ввода на сайтах и в CRM.

Данные для подсказок мы берем из разных справочников, раньше их было всего пять: ФИО, емейлы, почтовые адреса, реквизиты компаний и банков. С самого первого релиза нас просили добавить в «Подсказки» то один справочник, то другой. Мы бы и рады были, да не могли. Зато теперь можем!

С июля «Подсказки» понимают любые датасеты в формате CSV: марки автомобилей, валюты, торговые точки, хоть имена близких.

Теперь пользователи быстро и без ошибок вводят что угодно.
Читать дальше →
Всего голосов 22: ↑22 и ↓0+22
Комментарии11

Как интернет-магазины теряют деньги из-за адреса в форме заказа

Время на прочтение3 мин
Количество просмотров44K


Давненько мы не разбирали формы заказа. В этом выпуске — две ошибки, из-за которых интернет-магазины и службы доставки постоянно теряют деньги. А клиенты при этом вообще раскаляются.
Читать дальше →
Всего голосов 60: ↑55 и ↓5+50
Комментарии203

Боремся с ошибками и «костылями» в ЕГРЮЛ — госреестре юридических лиц

Время на прочтение6 мин
Количество просмотров11K


На прошлой неделе мы выпустили статью про устройство ЕГРЮЛ — госреестра с данными 10 миллионов компаний. Тот материал рассказывает о базовых вещах, поэтому начать лучше с него.

Здесь же мы раскроем богатую и благодатную тему — проблемы ЕГРЮЛа, которые не дают нашим разработчикам заскучать.
Продолжаем разговор
Всего голосов 21: ↑21 и ↓0+21
Комментарии13

Как устроен ЕГРЮЛ — единый госреестр юридических лиц

Время на прочтение5 мин
Количество просмотров31K


ЕГРЮЛ — это государственный реестр юридических лиц, в котором хранятся данные 10 миллионов российских компаний. Управляет справочником ФНС.

Из ЕГРЮЛ мы берем данные организаций для «Подсказок», «Единого клиента» и «Фактора». В статье расскажем, как мы жили до справочника, как получаем к нему доступ и как с ним работаем.
Читать дальше →
Всего голосов 31: ↑31 и ↓0+31
Комментарии24

Как устроены адресные подсказки «Дадаты»

Время на прочтение6 мин
Количество просмотров17K


«Дадата» с 2014 года пилит «Подсказки». Они помогают быстро и без ошибок вводить контактные данные: адреса, реквизиты банков и компаний, емейлы — вот это все.


Штука устроена затейливо, и мы решили о ней рассказать. Возьмем подсказки по адресам, потому что они самые сложные.


Справочники и индексация


«Подсказки» знают, что подсказывать, потому что у них есть гигантские справочники. Хоть статья эта о подсказках по адресам, для пользы дела перечислю и другие справочники «Дадаты».


Читать дальше →
Всего голосов 37: ↑37 и ↓0+37
Комментарии10

Пошел ты на три веселых слова! Новое геокодирование и what3words.com

Время на прочтение4 мин
Количество просмотров24K


В 2013 году два айтишника и музыкант собрались и подумали: давайте разобьем всю Землю на квадраты, а потом пометим каждый квадрат тремя словами. И разбили. И пометили.

Получился бесплатный сервис what3words.com, который замахнулся на революцию в геокодировании. Ребята уверяют, что почтовые адреса и координаты не годятся для повседневной жизни. Пора от них отказываться там, где возможно.
Почтовый адрес GPS-координаты Адрес What3words
Россия, Москва, Турчанинов переулок,
д 6 стр 2
55.737208, 37.597091 Именины.птичий.туннель
Казалось бы, таких революционеров пруд пруди, но у what3words.com есть важное отличие: сервис взлетел. Им пользуются автопроизводители вроде Land Rover, правительства африканских стран и даже ООН.
Читать дальше →
Всего голосов 45: ↑41 и ↓4+37
Комментарии52

Задача со звездочкой: как мы перекодировали ФИАС в КЛАДР

Время на прочтение8 мин
Количество просмотров16K


С 1 января ФНС перестанет обновлять адресный справочник КЛАДР. Он официально устареет, останется один ФИАС. Но многие промышленные системы до сих пор работают с КЛАДР. Поставщики не собираются их обновлять, а переделывать своими руками бизнесу выходит долго и дорого.

Мы послушали клиентов и придумали решение: взять ФИАС, который живее всех живых, и написать перекодировщик в КЛАДР.

Со стороны задача кажется легкой. Нам так и говорили: «То есть вы просто берете ФИАС и переделываете в КЛАДР?». На деле никакого «просто» нет. У справочников совсем разные структуры и непонятно, как из подкачанного ФИАС раскидать данные в неказистый КЛАДР. При этом общей документации для справочников нет.

Это было веселье, которым мы сейчас щедро поделимся.
Читать дальше →
Всего голосов 41: ↑39 и ↓2+37
Комментарии11

Как «Дадата» ищет дубли в списках торговых точек. Разбираем алгоритм

Время на прочтение4 мин
Количество просмотров6.4K


Наши клиенты хранят списки из тысяч компаний, и обычно там первозданный хаос.

Возьмем список торговых точек, через которые сельхозпроизводитель продает товары по всей стране. Названия магазинов пишут как хотят, поэтому типичный список выглядит так:

  1. Евразия.
  2. «САКУРА» Японская кухня.
  3. Доминант.
  4. Магазин-бутик «Евразия».
  5. Милениум, ООО, продуктовый магазин.
  6. Киви/ООО/Челябинск.
  7. Супермаркет эко-продуктов «Доминант».

Точки № 1 и № 4 — дубли, № 3 и № 7 — тоже, но поди разберись.

А разобраться надо: когда в списке из 1000 торговых точек 300 дублей, у производителя начинаются проблемы.
Что за проблемы и как мы их решаем
Всего голосов 24: ↑22 и ↓2+20
Комментарии14

Как вычислить (город пользователя) по IP

Время на прочтение8 мин
Количество просмотров121K
Зная местоположение человека, можно сделать тысячу полезных и не очень вещей: предложить правильный товар и заранее назвать цену доставки, показать ареал обитания покемонов, вывести локальные новости или посоветовать кафе неподалеку.

Местоположение — это важно.


Читать дальше →
Всего голосов 40: ↑35 и ↓5+30
Комментарии40

Что можно узнать о квартире из открытых справочников

Время на прочтение6 мин
Количество просмотров59K


Госструктуры выкладывают в интернет справочники с десятками гигабайтов информации. Если знать где искать, можно легально собрать данные о квартирах в промышленных масштабах.

Базы с индексами и районами городов тоже открыты. Бонусом я расскажу, как найти эти части адреса, если их не хватает.

Все справочники из этой статьи бесплатны и открыто лежат в интернете. Ни один не украли из ФСБ таинственные хакеры.
Шагнуть в мир открытых справочников
Всего голосов 62: ↑61 и ↓1+60
Комментарии24

Как перейти от КЛАДР к ФИАС и ничего себе не сломать

Время на прочтение7 мин
Количество просмотров109K
ГНИВЦ ФНС сообщает, что с начала 2018 года КЛАДР перестанет существовать и скачать его будет нельзя.

Дисклеймер:
Если вы совсем не поняли, что означают эти наборы букв, ничего страшного. Ниже мы расскажем о реалиях работы с адресами в России. Если вам это неинтересно, почитайте про топографические каламбуры.

Правильные адреса нужны компаниям, которые любят своих клиентов. Знакомые банки, страховые и интернет-магазины, которые сейчас используют справочник КЛАДР, спрашивают нас, что же делать дальше. Поэтому мы запарились и написали пошаговое руководство по переходу с одних букв на другие от КЛАДР к ФИАС.


Поехали!
Всего голосов 24: ↑24 и ↓0+24
Комментарии26

Как поддержка помогает «Дадате» получать новых клиентов и выгодно выделяться на фоне конкурентов

Время на прочтение4 мин
Количество просмотров5.3K
Привет! Меня зовут Лена Журавлёва, я основательница «Дадаты». «Дадата» исправляет ошибки в адресах — её используют интернет-магазины, службы доставки и автосалоны. Всего у «Дадаты» более 15 тысяч пользователей, платных и бесплатных.

Большая часть нашей работы — это поддержка, которая кроме обычной своей функции, является для нас еще и:

  • конкурентным преимуществом,
  • каналом привлечения клиентов с помощью поиска,
  • каналом привлечения клиентов через рекомендации.

Расскажу о том, как это у нас работает — это будет полезно основателям небольших сервисов.
Читать дальше →
Всего голосов 20: ↑19 и ↓1+18
Комментарии7

Топограф был пьян

Время на прочтение2 мин
Количество просмотров30K

Год назад мы публиковали на Хабре статью о необычных адресах. С тех пор мы в «Дадате» собираем коллекцию городов и улиц со странными названиями. Покажем вам любимые экспонаты.



В Люберцах есть улица 3-е Почтовое отделение. Посмотрите, кстати, на её форму — она трижды сама себя пересекает.


Читать дальше →
Всего голосов 52: ↑44 и ↓8+36
Комментарии127

Почему мы в «Дадате» тратим 2 млн долларов в год на 99,99% точность обработки данных

Время на прочтение6 мин
Количество просмотров13K

Вы когда-нибудь задумывались, почему вообще возможно исправить ошибки и опечатки в текстовых данных, например, в адресах и именах? Почему мы думаем, что «Терская» — это, скорее всего, Тверская улица, а не какая-нибудь фантастическая улица Василиятёрского? А вдруг это Комсомольский проспект, в котором сделано двадцать опечаток?


Наш жизненный опыт говорит о том, что упорядоченные низкоэнтропийные состояния менее вероятны, чем высокоэнтропийные неупорядоченные. То есть «Терская» скорее Тверская с одной опечаткой, чем Комсомольский проспект с двадцатью опечатками. Однако в жизни возникает много спорных случаев, где вероятности не так однозначны.

Читать дальше →
Всего голосов 34: ↑30 и ↓4+26
Комментарии28

Почта России для чайников

Время на прочтение6 мин
Количество просмотров306K
Почта России — это большая, сложная и не очень дружественная структура. На неё принято плеваться в социальных сетях, а поход за письмом или посылкой часто превращается в маленький квест. Про такое говорят: «Жизнь меня к этому не готовила».



Хочешь отправить книжку в подарок другу. Приходишь в отделение, а уставшая женщина спрашивает: «Как отправляем, заказной бандеролью с объявленной ценностью или первым классом?». И ты понимаешь, что это будет посложнее высоконагруженных систем, больших данных и нейросетей.

Мы в «Дадате» сильно связаны с почтой: исправляем адреса и неплохо разбираемся в особенностях её работы. Написали подробный гид по услугам Почты России, для чайников. Автор статьи — Сергей Король, редактор и почтовый гик.

Почта. Инструкция по применению
Всего голосов 68: ↑63 и ↓5+58
Комментарии62

Как улучшить почтовые адреса

Время на прочтение4 мин
Количество просмотров19K
Привет! Мы в «Дадате» хорошо разбираемся в почтовых адресах — исправляем и дополняем их для пяти тысяч интернет-магазинов, CRM и стартапов.

image

Сегодня я расскажу, почему традиционная система почтовых адресов кажется нам ущербной и предложу «облачный» способ её исправления.
Читать дальше →
Всего голосов 53: ↑41 и ↓12+29
Комментарии161

Радар для покемонов

Время на прочтение3 мин
Количество просмотров80K

Помогите, покемоны


Если вы ни разу не слышали об игре Pokemon Go, можно считать, что вам повезло. Новости о покемонах мелькают в новостных лентах, толпы людей бродят в ночи по кладбищам и воюют за сферы влияния. Только в Москве по данным МТС в Pokemon Go играет 180 000 человек, притом что в России официального запуска еще не было.


Мы в DaData.ru решили посмотреть, чем можем помочь любителям покемонов.

Кое-что получилось
Всего голосов 61: ↑49 и ↓12+37
Комментарии47

ФИАС и семь смертных граблей разработчика

Время на прочтение4 мин
Количество просмотров75K
Чтобы нормально работать с почтовыми адресами, сайты подключают справочник адресов налоговой службы (ФИАС). На dadata.ru это сделали уже пять тысяч интернет-магазинов, CRM и стартапов.

А мы поглядели на проблемы клиентов, подумали и собрали увесистый комплект граблей, по которым любят ходить разработчики в обнимку с ФИАСом.



Грабли во всей их красе
Всего голосов 25: ↑21 и ↓4+17
Комментарии15

Подсказываем реквизиты компаний по данным ФНС РФ и бесплатно ищем дубли

Время на прочтение1 мин
Количество просмотров9.5K
DaData.ru автоматически исправляет ошибки в адресах, ФИО и телефонах. Находит и объединяет одинаковых клиентов в базе. Помогает быстро ввести адрес и ФИО покупателя, а также и реквизиты компании на форме заказа. Есть API и javascript-виджет.

В предыдущем выпуске Дадата помогала бороться с дублями. А сейчас мы снова причинили добро:
  • бесплатно находим дубликаты в файлах до 100 записей;
  • снизили стоимость сервиса дедупликации до 5-10 копеек за запись;
  • подключили актуальные справочники налоговой службы в подсказках по компаниям.


Читать дальше →
Всего голосов 11: ↑9 и ↓2+7
Комментарии13

DaData.ru находит и уничтожает одинаковых людей

Время на прочтение4 мин
Количество просмотров21K


DaData.ru — сервис автоматической проверки, исправления и дедупликации контактных данных (ФИО, адресов, телефонов, email, паспортов).

У меня в телефоне 453 контакта. Среди них встречаются дубли: один и тот же человек записан то как «Леха», то как «Алексей Мегафон», а то и как «Зиновьев, Алексей Иванович». У Лехи указан скайп и день рождения, у «Алексея Николаевича» — емейл и основной мобильный номер, а у «Мегафона» — запасной номер от понятнокакого оператора.

В телефонных контактах дубли неприятны, но не особо напрягают. Хуже, когда такая чехарда начинается с клиентской базой компании.
Дубликаты приходят ночами и мучают маркетологов
Всего голосов 31: ↑24 и ↓7+17
Комментарии40

Информация

Сайт
www.hflabs.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Максим Пименов