Как стать автором
Обновить
HFLabs
Повышаем качество клиентских данных для бизнеса
Сначала показывать

Как мы находим, адаптируем и сохраняем IT-специалистов в кровавом энтерпрайзе

Время на прочтение11 мин
Количество просмотров12K

Раньше мы сходили с ума от количества откликов, когда размещали вакансии на популярных площадках. Людей привлекали условия, а на требования они закрывали глаза. Просеять вагоны откликов было невозможно. Кадровые агентства не помогали: мы строго оцениваем специалистов и часто отвергаем предложенные варианты. Агентствам это не нравится.

Но постепенно мы нащупали четкие критерии отбора и теперь находим людей с меньшими затратами. Об этом я и расскажу. И еще немного — о том, как мы онбордим новичков и страхуемся от текучки (обидно терять людей, найденных с огромным трудом).

Читать далее
Всего голосов 38: ↑31 и ↓7+24
Комментарии50

Челленджи, лысые головы и вино. Как мы в HFLabs переживаем самоизоляцию

Время на прочтение7 мин
Количество просмотров4.5K


В HFLabs работают 82 человека — из них ≈70 [было] в московских офисах. Самоизолировались, конечно. Но дома скучно или, наоборот, чересчур суетно — например, когда ты заперт в однушке с детьми. Работать так днями напролет — тяжеловато.

Уже на вторую неделю карантина главные бодряки компании задумались, как разнообразить трудовые будни. И накидали решений. Расскажу, что нового появилось в корпоративной, не побоюсь этого слова, культуре HFLabs за последнее время.

Методы HFLabs подойдут не каждой компании. Если у вас принято застегиваться на все пуговицы, быть подчеркнуто серьезным и деловым, развлечения из этой статьи не зайдут.
Читать дальше →
Всего голосов 24: ↑20 и ↓4+16
Комментарии5

Как определить оператора и регион по номеру телефона

Время на прочтение6 мин
Количество просмотров139K


Полезно знать, какого телефонного оператора выбрал клиент и в каком регионе. Тогда можно разбить клиентскую базу географически и не звонить ночами. Или проводить промоакции вместе с операторами. А некоторые наши заказчики экономят: для каждого оператора выбирают самого дешевого СМС-агрегатора.

Поэтому «Дадата» с давних пор находит оператора по номеру телефона. Алгоритм простой — сделай и пользуйся. Разве что в 2013 году, когда отменили «мобильное рабство», пришлось чуть скорректировать процесс. В этой статье расскажу, как у нас все работает.

В процессе есть большая сложность — получить доступ к базе перенесенных номеров. Частным лицам его не выдают, да и компаниям придется тяжело. Об этом — в отдельном разделе.
Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии33

Как посчитать «похожесть» номеров в паспортах. И найти одинаковые даже с опечатками

Время на прочтение5 мин
Количество просмотров10K


Продукты HFLabs ищут дублированных клиентов в базах федеральных компаний. Очевиднейший способ найти одинаковые клиентские карточки — сравнить паспорта или другие документы, удостоверяющие личность.

Раньше мы сравнивали номера документов строго: одинаковые — отлично, нет — извините. На ручной разбор из-за опечатки в номере уходили даже те карточки, у которых совпадали ФИО и адреса́ проживания. Такой подход излишне нагружал персонал заказчиков.

Поэтому мы с головой залезли в данные, изучили статистику и вывели критерии — когда разные номера действительно разные, а когда дело в опечатках. Рассказываю, как работает алгоритм.
Читать дальше →
Всего голосов 16: ↑15 и ↓1+14
Комментарии22

Как проверить паспорт на действительность

Время на прочтение6 мин
Количество просмотров201K


Реквизиты паспорта — не просто набор цифр, в них закодирован вагон информации. Если правильно расшифровывать и сопоставлять реквизиты, подозрительные документы мгновенно всплывут на поверхность. Продукты HFLabs уже 14 лет проверяют клиентские данные в банках, страховых, телекомах и другом крупном бизнесе. Расскажу, как мы распознаем ошибки в российских паспортах.
Читать дальше →
Всего голосов 134: ↑132 и ↓2+130
Комментарии258

Хакатон в небольшой компании: как устроить, не вваливая вагон ресурсов

Время на прочтение10 мин
Количество просмотров3.3K


Это статья о том, как я впервые провел хакатон для команды. Прокачанным организаторам материал наверняка покажется слишком простым, а история — наивной. Я ориентировался на тех, кто только знакомится с форматом и думает, устраивать ли такое мероприятие.

HFLabs делает сложные штуки с данными: мы чистим и обогащаем контакты клиентов для больших компаний и строим клиентские базы на сотни миллионов записей. В московских офисах трудятся 65 человек, еще около десятка — удаленно из других городов.

Любая работа порой не то чтобы надоедает, но становится пресноватой. В этот момент полезно сменить фокус, попробовать что-то новое. Поэтому мы с полгода присматривались к хакатонам.

Хакатон — это такое состязание для айтишников: несколько команд собираются и два дня подряд решают сложные задачи. Обычно соревнуясь за приз, который присуждает жюри.

Нам хотелось опробовать формат и развлечься, но классический хакатон — довольно масштабная, хлопотная и дорогая затея. Поэтому мы провели лайт-версию почти без бюджета. А в итоге остались довольны и даже сделали кое-что полезное.
Читать дальше →
Всего голосов 13: ↑13 и ↓0+13
Комментарии4

Как наладить поиск адреса по координатам (и где взять нужный справочник)

Время на прочтение10 мин
Количество просмотров39K


Весной мы добавили в API DaData.ru фичу «Обратное геокодирование», она же «Адрес по координатам». Название намекает: метод принимает геокоординаты и отдает данные об адресе.

Солидный продукт с той же функциональностью предлагает «Яндекс» — он называется «Геокодер». Но сервис «Яндекса» бесплатен только для открытых некоммерческих проектов. Стандартный же тариф — от 120 000 ₽ в год — подходит не всем.

Мы подумали — если сделать бесплатную или недорогую альтернативу «Геокодеру», разработчики наверняка скажут спасибо. И сделали. В статье расскажу, как устроен «Адрес по координатам»: как мы наладили поиск, собрали справочник и упаковали в готовый метод.
Читать дальше →
Всего голосов 31: ↑31 и ↓0+31
Комментарии33

Собрали всем «Хабром» справочник «Кем выдан…» для паспортов. Качайте на здоровье

Время на прочтение5 мин
Количество просмотров52K


С пару месяцев назад мы поэкспериментировали: получится ли на «Хабре» собрать годный справочник подразделений, выдавших российские паспорта. Дело полезное: эти данные нужны много кому, канонического источника нет, а существующие — очень так себе.

И знаете, все получилось. Пригодный к использованию справочник готов, можно качать и пользоваться. А еще мы сделали подсказки, которые ускоряют ввод подразделений в электронные формы.
Читать дальше →
Всего голосов 57: ↑56 и ↓1+55
Комментарии99

Эксперимент: собираем справочник подразделений, выдавших паспорт

Время на прочтение2 мин
Количество просмотров23K


Самое утомительное поле при вводе паспорта — «Кем выдан». Вбивать в форму какое-нибудь «Отделом внутренних дел Медведевского района республики Марий Эл» муторно. Люди злятся, сокращают название как придется, ошибаются.

Было бы здо́рово подсказывать варианты по коду подразделения.
Читать дальше →
Всего голосов 44: ↑43 и ↓1+42
Комментарии77

Все ругают самописные тестовые фреймворки. А мы своим довольны

Время на прочтение6 мин
Количество просмотров12K


Меня зовут Елена Расторгуева, я отвечаю за продукт «Фактор» в HFLabs. «Фактор» — чертовски сложный алгоритмический enterprise, он обрабатывает данные в промышленных масштабах.

В статье я расскажу, как мы начинали тестировать «Фактор», как развивали автотесты и почему пришли к самописным фреймворкам.
Читать дальше →
Всего голосов 37: ↑34 и ↓3+31
Комментарии15

Данные бывают смешными (и вот примеры)

Время на прочтение4 мин
Количество просмотров23K


Мы в HFLabs перелопачиваем колоссальное количество данных: адреса, ФИО, реквизиты компаний, документы. Весь год писали о сложных и полезных штуках, но пора и честь знать. Перед праздниками — подборка смешных данных, что нам принес 2018-й.
Читать дальше →
Всего голосов 49: ↑49 и ↓0+49
Комментарии69

Редактируем CSV-файлы, чтобы не сломать данные

Время на прочтение5 мин
Количество просмотров237K


Продукты HFLabs в промышленных объемах обрабатывают данные: адреса, ФИО, реквизиты компаний и еще вагон всего. Естественно, тестировщики ежедневно с этими данными имеют дело: обновляют тест-кейсы, изучают результаты очистки. Часто заказчики дают «живую» базу, чтобы тестировщик настроил сервис под нее.

Первое, чему мы учим новых QA — сохранять данные в первозданном виде. Все по заветам: «Не навреди». В статье я расскажу, как аккуратно работать с CSV-файлами в Excel и Open Office. Советы помогут ничего не испортить, сохранить информацию после редактирования и в целом чувствовать себя увереннее.

Материал базовый, профессионалы совершенно точно заскучают.
Читать дальше →
Всего голосов 31: ↑30 и ↓1+29
Комментарии32

Миграция данных в кровавом энтерпрайзе: что анализировать, чтобы не завалить проект

Время на прочтение14 мин
Количество просмотров13K


Типичный проект системной интеграции для нас выглядит так: у заказчика вагон систем для учета клиентов, задача — собрать клиентские карточки в единую базу. И не только собрать, а еще очистить от дублей и мусора. Чтобы на выходе получились чистые, структурированные, полные карточки клиентов.

Для начинающих поясню, что миграция идет по такой схеме: источники → преобразование данных (отвечает ETL или шина) → приемник.

На одном проекте мы потеряли три месяца просто потому, что сторонняя команда интеграторов не изучала данные в системах-источниках. Самое обидное, что этого можно было избежать.
Читать дальше →
Всего голосов 37: ↑36 и ↓1+35
Комментарии26

Помогаем выплыть: как ввести новичков в сложный проект

Время на прочтение8 мин
Количество просмотров20K


Всем привет! Меня зовут Михаил Берёзин, я — тимлид в HFLabs. Мы делаем очень сложный enterprise-софт для банков, сотовых операторов, страховых компаний, ритейлеров.

Полгода назад мы совершили большую ошибку: набрали в команду сразу 8 человек, штат вырос в 2 раза. Раньше никогда не брали так много людей скопом, поэтому забуксовали с онбордингом новичков. Расскажу, как справились с проблемой.
Читать дальше →
Всего голосов 34: ↑27 и ↓7+20
Комментарии9

Подсказки «Дадаты» помогают заполнить любые формы ввода. Теперь заживем

Время на прочтение4 мин
Количество просмотров6.5K


«Подсказки» помогают быстро и без ошибок заполнить поля ввода на сайтах и в CRM.

Данные для подсказок мы берем из разных справочников, раньше их было всего пять: ФИО, емейлы, почтовые адреса, реквизиты компаний и банков. С самого первого релиза нас просили добавить в «Подсказки» то один справочник, то другой. Мы бы и рады были, да не могли. Зато теперь можем!

С июля «Подсказки» понимают любые датасеты в формате CSV: марки автомобилей, валюты, торговые точки, хоть имена близких.

Теперь пользователи быстро и без ошибок вводят что угодно.
Читать дальше →
Всего голосов 22: ↑22 и ↓0+22
Комментарии11

Как интернет-магазины теряют деньги из-за адреса в форме заказа

Время на прочтение3 мин
Количество просмотров44K


Давненько мы не разбирали формы заказа. В этом выпуске — две ошибки, из-за которых интернет-магазины и службы доставки постоянно теряют деньги. А клиенты при этом вообще раскаляются.
Читать дальше →
Всего голосов 60: ↑55 и ↓5+50
Комментарии203

Боремся с ошибками и «костылями» в ЕГРЮЛ — госреестре юридических лиц

Время на прочтение6 мин
Количество просмотров10K


На прошлой неделе мы выпустили статью про устройство ЕГРЮЛ — госреестра с данными 10 миллионов компаний. Тот материал рассказывает о базовых вещах, поэтому начать лучше с него.

Здесь же мы раскроем богатую и благодатную тему — проблемы ЕГРЮЛа, которые не дают нашим разработчикам заскучать.
Продолжаем разговор
Всего голосов 21: ↑21 и ↓0+21
Комментарии13

Как устроен ЕГРЮЛ — единый госреестр юридических лиц

Время на прочтение5 мин
Количество просмотров29K


ЕГРЮЛ — это государственный реестр юридических лиц, в котором хранятся данные 10 миллионов российских компаний. Управляет справочником ФНС.

Из ЕГРЮЛ мы берем данные организаций для «Подсказок», «Единого клиента» и «Фактора». В статье расскажем, как мы жили до справочника, как получаем к нему доступ и как с ним работаем.
Читать дальше →
Всего голосов 31: ↑31 и ↓0+31
Комментарии24

Как устроены адресные подсказки «Дадаты»

Время на прочтение6 мин
Количество просмотров16K


«Дадата» с 2014 года пилит «Подсказки». Они помогают быстро и без ошибок вводить контактные данные: адреса, реквизиты банков и компаний, емейлы — вот это все.


Штука устроена затейливо, и мы решили о ней рассказать. Возьмем подсказки по адресам, потому что они самые сложные.


Справочники и индексация


«Подсказки» знают, что подсказывать, потому что у них есть гигантские справочники. Хоть статья эта о подсказках по адресам, для пользы дела перечислю и другие справочники «Дадаты».


Читать дальше →
Всего голосов 37: ↑37 и ↓0+37
Комментарии10

Пошел ты на три веселых слова! Новое геокодирование и what3words.com

Время на прочтение4 мин
Количество просмотров23K


В 2013 году два айтишника и музыкант собрались и подумали: давайте разобьем всю Землю на квадраты, а потом пометим каждый квадрат тремя словами. И разбили. И пометили.

Получился бесплатный сервис what3words.com, который замахнулся на революцию в геокодировании. Ребята уверяют, что почтовые адреса и координаты не годятся для повседневной жизни. Пора от них отказываться там, где возможно.
Почтовый адрес GPS-координаты Адрес What3words
Россия, Москва, Турчанинов переулок,
д 6 стр 2
55.737208, 37.597091 Именины.птичий.туннель
Казалось бы, таких революционеров пруд пруди, но у what3words.com есть важное отличие: сервис взлетел. Им пользуются автопроизводители вроде Land Rover, правительства африканских стран и даже ООН.
Читать дальше →
Всего голосов 45: ↑41 и ↓4+37
Комментарии52

Информация

Сайт
www.hflabs.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Максим Пименов