Как стать автором
Обновить
HFLabs
Повышаем качество клиентских данных для бизнеса
Сначала показывать

Как писать Release Notes, чтобы их читал и бизнес, и разработчики

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.8K

Привет, Хабр! Меня зовут Иван Арискин, я занимаюсь развитием продукта «Единый адрес» в HFLabs. Поскольку компания сравнительно небольшая, иногда приходится самостоятельно писать и редактировать Release Notes (RN). Они же — новости продуктов, или changelog. За одни меня благодарили, за другие — троллили, но я научился смещать баланс в сторону положительных реакций. 

В статье разберу, что и зачем писать в Release Notes и как заинтересовать бизнес техническими обновлениями. Пригодится всем, кто ведет документацию по продукту и хочет, чтобы она приносила реальную пользу. 

Читать далее

Великий и могучий: как мы учим нашу систему находить нецензурную лексику в ФИО

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.8K

Привет, Хабр! Меня зовут Макс Траулько, я занимаюсь анализом данных и проработкой новый фичей в команде RnD в HFLabs. Прямо сейчас я работаю над нетривиальной задачей — учу наши алгоритмы распознавать в именах и фамилиях русский мат и прочие ругательства.

Как появилась эта задача? В одной крупной компании клиенты могут оставить обращения во фронт-системе. И иногда пишут в полях ФИО, прямо скажем, черт знает что. А у бизнеса риски: если при ответе на обращение автоматически использовать данные из поля «Имя», можно стать героем насмешливых или гневных постов. 

Чуть раньше с такой же проблемой к нам пришел другой клиент, из ретейла. У того клиенты вообще большие выдумщики — придумывают составные и сложные имена и фамилии с обсценной лексикой. Даже жаль, что показать эти примеры не можем. 

В статье расскажу, как мы решаем эту задачу.

Читать далее

Разбор и стандартизация имен, адресов и других типов пользовательских данных в миллионных базах

Время на прочтение14 мин
Количество просмотров1.7K

Во всевозможных заявлениях, анкетах и обращениях пользователи вводят свои ФИО, адреса и прочие персональные данные в настолько разном формате, что даже человеку бывает сложно понять, где ошибки, а где правильное написание. Например, «Саша Петрович» — это имя с отчеством или фамилия с именем? А, может, это сокращённая форма имени? И кто перед нами — мужчина или женщина?

Такие же сложности возникают и с другими данными: адресами, телефонами, названиями компаний. В этом посте расскажем о наших методах разбора и стандартизации клиентских данных, разговор про которые начали в статье про поиск дубликатов при объединении огромных клиентских баз.

Читать далее

Как мы наводили порядок в документации. От ручного привода к полноценной автодоке

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4.2K

Привет, Хабр! Меня зовут Паша Абдюшев, я занимаюсь развитием продуктов в HFLabs. А где продукты, там и документация. С одной стороны, её ведение — вопрос явно не первостепенный. А с другой — неактуальная  информация не только бесит печалит, но и влечёт за собой дополнительные траты. 

Не спешите кидаться тапками, если тема кажется слишком очевидной. Иногда чужой пример — лучший стимул взять и наконец сделать это у себя. 

Наш путь по приведению в порядок накопившейся документации можно разделить на две части. Сначала мы прошлись по ней в ручном режиме, потом запустили автодокументацию. Я расскажу, что и зачем мы делали вручную, поскольку без этой части работы автоматизацию запускать смысла нет. Во второй части статьи будет непосредственно про автодоку. 

Читать далее

Где эта улица, где этот дом?.. Какие несостыковки и почему можно найти в ГАР и других адресных сервисах

Время на прочтение5 мин
Количество просмотров1.4K

Привет, Хабр! Мы в HFLabs не унываем продолжаем исследовать тему российских адресов. Уже рассказывали о том, почему нельзя просто взять и выгрузить список городов из Государственного адресного реестра (ГАР), и разбирались, что представляет собой нормативка по адресам. 

А сегодня я расскажу, как один и тот же объект может иметь различные написания адреса. Такие разночтения заставляют делать ручной разбор адресов, а в некоторых случаях и вовсе рушат аналитику. Дальше будет о том, в чём причина и что с этим делать. 

Читать далее

Поиск дубликатов в клиентском MDM на миллиард записей

Время на прочтение15 мин
Количество просмотров3.7K

Представьте, что вам нужно объединить две базы данных с информацией о клиентах, каждая из которых содержит несколько миллионов записей. В них есть ФИО, паспортные данные, СНИЛС, даты рождения, адреса и другие данные. Ваша задача — найти все похожие записи и не допустить ошибочных объединений. 

Причем данные могут содержать ошибки, опечатки операторов или неверные транскрипции. Для полной сверки каждого с каждым потребуются триллионы операций сравнения. И вишенка на торте — братья-близнецы с редкими, но созвучными именами. Даже оператор может решить, что это дубль, и объединить их записи.

Цена ошибки неверного объединения или дублирования выражается в репутации компании и конкретных суммах на счетах клиентов, к которым могут получить доступ посторонние люди.

В этом посте расскажу о работе нашей системы обработки данных, которую мы применяем и адаптируем под такие сложные случаи.

Читать далее

Что представляет собой нормативная база по адресам в России: краткий обзор

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.9K

Эта история началась с того, что мы обнаружили, что типа «литера» нет в нормативке типов домовых частей. Но, согласно справочнику ГАР, у многих домов в Питере литеры есть. Мы решили спросить у ФНС, как так получилось. 

И ФНС нам ответила (что именно — читайте в статье). А дальше мы решили разобраться, какие ещё нормативные документы по адресам существуют и чем они могут быть полезны.

Читать далее

Как перейти на многонодовую архитектуру без боли. Или почти без боли

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров3.8K

Есть у нас флагманский продукт под названием «Единый клиент», с которым работают десятки энтерпрайз-клиентов, оперирующих в нем сотнями миллионов записей. Продукт массивный, обвешанный аналитикой и различными сложными сервисами. В какой-то момент большая часть клиентов захотела получить общий uptime в 99,9%, чего сложно достичь без резервирования решения. И мы начали погружаться в эту тему практически с нуля.

В этом материале хочу поделиться нашим опытом перехода с одной ноды на 10+, расскажу о технических нюансах и решениях, которые мы использовали, а также про всякие боли в процессе перехода.

Читать далее

«Тесла» на минималках, или За какими изобретениями из прошлого охотились шпионы

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.4K

В начале XX века в Москве только зарождалось электрическое общественное транспортное сообщение. Но по городу уже бегали омнибусы с электродвигателями — своего рода предшественники нынешней «Теслы». Позже их изобретатель Ипполит Романов уехал в Европу, где тоже строил свои электрокары — сначала в Австрии, а потом в Британии. 

О технических изобретениях первой половины прошлого века московским айтишникам рассказала Инна Крылова — историк, культуролог, куратор проекта «МосПромАрт», старший научный сотрудник Музея Москвы, член Экспертного совета по промышленному наследию. Лекция прошла в рамках закрытого проекта HFLabs Club, на который мы приглашаем в качестве лекторов ученых и популяризаторов науки, а в качестве гостей — постоянных клиентов HFLabs. В этот раз мероприятие было организовано совместно с экскурсионным бюро «Москва, которой нет».

Именно эту лекцию провели не в офисе, а в пабе. В паузах были ещё и дегустации пива, щедро сдобренные историями о разных его сортах. А все потому, что наша лектор оказалась не только историком, но и сомелье с 15-летним стажем, членом Российской ассоциации сомелье! 

Всё, о чём рассказывала Инна Крылова, пересказывать не будем — просто приходите сами на её лекции. Сегодня с разрешения Инны публикуем часть доклада — о том, над чем работали московские изобретатели транспортных средств и что у них в итоге получилось.

Читать далее

Почему нельзя взять и просто выгрузить список городов из адресной системы?

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров3.9K

Под словом «город» люди представляют определенный тип населённого пункта. Но у адресных систем своё мнение на этот счёт. Поэтому когда к нам пришёл заказчик и попросил выгрузить список всех городов в РФ, мы сильно напряглись и попросили уточнить, что он имеет в виду. Если думаете, что наш вопрос — странный, значит, вы никогда не имели дела с адресными системами. 

Читать далее

Как сделать форму согласия на обработку персональных данных на сайте. Справится даже школьник

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.9K

Привет, Хабр! Меня зовут Тимур уже два года я развиваю в HFLabs продукт «Центр управления согласиями» для энтерпрайза. Тема эта интересная, болезненная и острая одновременно, ведь персональные данные собирает не только крупный бизнес, а вообще все. Любой сайт — от продажи крафтового печенья до крупного автодилера и страховой компании — имеет если не форму регистрации, то анкету для подписки на новости уж точно. 

Когда-то я уже делал разбор форм ввода персональных данных на разных сайтах. Выяснил, что часто они сделаны «как исторически сложилось», а не как требуется. Грешат этим не только небольшие компании, но и крупные игроки — например, банки.

Если сайт сделан N лет назад и на CMS (а такое встречается сплошь и рядом), то нередко используется стандартный инструментарий самой CMS. Плюс фантазия заказчика, умноженная на осведомленность разработчика о том, как сделать эти самые формы регистрации. Получается, как смогли, так и сделали. 

Мы подготовили инструкцию, как самостоятельно настроить формы ввода. Для примера взяли CMS «1С-Битрикс: Управление сайтом» и в основном ту самую стандартную функциональность CMS. Материал будет полезен web-студиям и отдельным web-мастерам, а также всем, кто так или иначе работает с согласиями — пусть и в других системах. Расскажем, как формы должны выглядеть и как объяснить заказчику, почему предпроставленная галочка — это не очень хорошо. 

Читать далее

Как мы обезличиваем ПДн, сохраняя их смысл и качество. Чтобы тестовый стенд был полезным, будто там данные с прода

Уровень сложностиСредний
Время на прочтение18 мин
Количество просмотров6.2K

Год назад мы выпустили «Маскировщик» — промышленный софт, который обезличивает персональные данные, сохраняя их качество и смысл. То есть гендерный баланс; социально‑демографическую структуру; родственные связи; страну и оператора в телефоне; валидность паспортов, ИНН, СНИЛС. В общем, «Маскировщик» делает так, чтобы вы тестировали продукты и обучали ML‑модели будто бы на «живых» ПД.

В этой статье пролью свет на методы изменения состава и семантики, которые использует продукт. Для простоты буду называть их «алгоритмами маскирования». Расскажу, по какой логике меняем одни данные другими, какие ограничения и как учитываем.

Разобраться в алгоритмах маскирования

Ты пожалеешь, но будет поздно: как я участвовала в единственном в России экстремальном триатлоне

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров18K

После выхода из озера Чейбеккель, температура воды в котором не больше 9 градусов, слышу крики организаторов: «Переодевайте её, у вас несколько минут, чтобы уложиться в лимит на беговую транзитку до велосипеда».

Плачу. Просто рыдаю. Это не слезы радости или боли, нет, просто выход эмоций после «терпёжки» — двух часов в холодной воде. Вижу свои руки, кто-то мажет их вонючей мазью красного цвета, и они начинают гореть. Кричу: «У меня руки в крови!». И смех, и слёзы. 

Это только один из эмоциональных моментов многочасового экстремального триатлона в горах Алтая. Серия экстремальных триатлонов куда менее популярна в спортивном сообществе, чем классические старты Ironstar и Ironman. Расскажу и покажу, как это было. 

Погнали!

Разыскиваются единороги, или Как я съездил в Astana Hub

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.7K

Привет, Хабр! Меня зовут Тимур, и прямо сейчас я живу в Казахстане. После того, как пробыл тут несколько месяцев, обнаружил, что ИТ-сообщество в стране на подъёме, и есть довольно интересное место — Astana Hub. А когда я загуглил, как оно всё выглядит, забыть уже не смог. 

В Сколково был, в Иннополисе был — пора расширять географию, подумал я. Тем более, что уже давно хотелось познакомиться с местными специалистами, получить нетворкинг и оценить потенциал для сотрудничества. 

Думаю, что многие задумывались если не о релокации целых команд, то хотя бы о личном переезде в соседнюю страну. Этот текст поможет понять, что может предложить Казахстан и Astana Hub и что тут есть интересного. 

Читать далее

Ближайшие события

Как мы продукт на PostgreSQL переводили

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров8.9K

Все побежали, и я побежал… Строго говоря, историю о том, как мы научили наше приложение работать с СУБД PostgreSQL и провели первую миграцию боевой системы одного из наших заказчиков, можно было рассказать ещё три года назад. Именно тогда мы это сделали впервые. Сейчас за нашими плечами уже 11 внедрений «Единого клиента» на PostgreSQL. Две миграции на эту СУБД с Oracle пройдут в этом году. 

В статье поделюсь нашими наработками. Будет полезно тем, кто только собирается пойти по такому пути. Если тема интересна, можете посмотреть и выступление моего коллеги Вадима Зайцева на CDI Tech Conf.

Итак, поехали!

Что у CDI под капотом? Расскажем на конференции по клиентским данным

Время на прочтение2 мин
Количество просмотров1.2K

Привет, Хабр! Я Никита Назаров, технический директор HFLabs. 4 апреля мы проводим конференцию CDI Tech Conf. На ней поговорим о том, как устроены энтерпрайз-приложения для работы с клиентскими данными и что нужно учесть при их интеграции с другими системами. Расскажем, почему нашу поддержку обожают заказчики и как наш CDI (Customer Data Integration) переехал с Oracle на PostgreSQL.

Узнать больше про конференцию

Почему компании продолжают звонить и писать отказавшимся от коммуникаций клиентам

Время на прочтение14 мин
Количество просмотров5.5K

Заказчики все чаще спрашивают нас, как работать с клиентскими согласиями так, чтобы блюсти законы и не злить клиентов. «Красный флаг» для компании — клиенту продолжают писать и звонить, когда тот просил прекратить.

Чтобы ответить точнее, сначала мы расспросили компании, что болит:
как хотят, где не получается. Затем разобрались, почему не выходит и нашли, как починить.
Ответ разделили на два текста. В один не поместился — уж очень объемный.

В этой статье рассказываем, из-за каких ошибок со сбором, обработкой и хранением согласий происходят факапы. И чем рискует бизнес — а то, может, и нет смысла наводить порядок.

В следующем тексте опубликуем удачные организационные и технические практики работы с согласиями для маленьких, средних и больших компаний.

Поехали

«Кто согласовал такую фигню?» — будни переговорщиков из IT

Время на прочтение8 мин
Количество просмотров14K

Привет, Хабр! Я работаю исполнительным директором в HFLabs, а до того, как им стать, больше восьми лет занимался продажами в B2B. Моя первая сделка началась с того, что меня позвали на переговоры с вице-президентом банка. Я подумал: не с моей же рожей к вице-президентам ходить. И позвал взрослых — генерального. В день встречи утром он мне позвонил и сказал, что я уже готов к таким встречам и могу смело идти один. Было страшно.

Так вот, лето, жара, погода изматывающая. Приходит вице-президент и начинает разговор примерно так: «Вот видите во дворе Audi стоят? Я их все купил со скидкой 60%. Так что и вам придется нас услышать». Но вся штука была в том, что я уже успел по этому проекту дать скидку 30%. И это был хороший жизненный урок: скидку я дал вообще не тому человеку — он не был тем самым ЛПР. Я не разобрался в процессе и даже не спросил, кто и как будет решать по сделке. Пришлось в итоге каждый пункт коммерческого предложения объяснять, каждую строчку сметы. Например, написано у нас тестирование 2 дня. А клиент мне в ответ — зачем два, давайте один день будете тестировать!..

Дальше расскажу, какие еще истории у нас случались на переговорах и вокруг них. 

Читать далее

Погружение в IT Узбекистана: о чём говорили и что показывали на форуме в Самарканде

Время на прочтение5 мин
Количество просмотров4.2K

У Узбекистана есть амбиции стать центром развития всего среднеазиатского региона. У страны многое для этого есть: историческое наследие, население в 35 миллионов, неплохое географическое положение. На этом фоне IT и цифровизация в целом — один из официальных приоритетов. Тем интересней было оказаться на недельном айтишном форуме в Самарканде и своими глазами посмотреть, что к чему. 

Об этом и расскажу в посте. Может быть интересно тем, кто еще не уехал присматривается к релокации в Узбекистан или просто хочет узнать больше об этой стране. Все впечатления в тексте личные.  

Читать далее

Как небольшой IT-компании запустить обучающий курс: рассказываем о своём опыте

Время на прочтение7 мин
Количество просмотров2K

Один из мифов по поводу MDM-систем — «ну что там делать-то, данные взяли, записи объединили, вот тебе и готово. А вы, мол, за работу миллионы хотите. Мы сами всё за полгода сделаем». 

Чтобы объяснить, как всё обстоит на самом деле, мы в HFLabs придумали образовательный курс по клиентским данным в энтерпрайзе. Сегодня расскажу о том, как мы создавали курс, где ошибались и что меняли в процессе. Надеюсь, будет полезно небольшим компаниям, которые, несмотря ни на что, всё ещё задумываются о развитии собственных образовательных проектов.  

Читать далее

Информация

Сайт
www.hflabs.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
Максим Пименов