Привет, Хабр! Я работаю в небольшом стартапе в Берлине, занимающимся разработкой автопилотов для автомобилей. Мы заканчиваем проект для сервисных станций одного крупного немецкого автопроизводителя и я бы хотел рассказать о нём: как мы его делали, с какими трудностями столкнулись и что нового открыли для себя. В этой части я расскажу про perception модуль и немного про архитектуру решения в целом. Про остальные модули, возможно, расскажем в следующих частях. Буду очень рад обратной связи и взгляду со стороны на наш подход.
Александр Гечис @AlexGechis
Machine Learning, Self-Driving cars
У семи программистов адрес без дома
4 мин
98KПривет, Хабр!
Мы в HumanFactorLabs парсим адреса в особо крупных размерах. Наши продукты упрощают ввод контактных данных и работу с ними.
За 10 лет работы в результате анализа многочисленных исключений в российских адресах мы выработали правила хранения адресов, при соблюдении которых вы не потеряете важную информацию.
Недавно на Хабре нас попросили привести примеры необычных адресов, в связи с чем и написана эта статья.
Мы в HumanFactorLabs парсим адреса в особо крупных размерах. Наши продукты упрощают ввод контактных данных и работу с ними.
За 10 лет работы в результате анализа многочисленных исключений в российских адресах мы выработали правила хранения адресов, при соблюдении которых вы не потеряете важную информацию.
Недавно на Хабре нас попросили привести примеры необычных адресов, в связи с чем и написана эта статья.
+98
Пишем почтовый адрес, как человеки
8 мин
81K Мне совершенно непонятна выгода от удобного интерфейса.
Да, он красивый, с ним проще работать. Но как посчитать материальную пользу?
Пять лет назад в аэропортах звучал синтезированный голос, объявляя прилёты и вылеты с разорванной интонацией после каждого слова. Иногда даже отличалась скорость речи для разных слов.
И вот пару недель назад я заслушивался новыми объявлениями о вылетах. Было чувство, что их целиком записал профессиональный диктор, который всю жизнь учился на эту роль. Интерфейс стал лучше, он стал более натуральным.
Стал ли я от этого больше летать? Вряд ли.
Может, у меня появилось предпочтение между аэропортами? Не думаю, что это настолько важный момент.
Тем не менее, зачем-то люди потратили время и деньги на приведение объявлений к естественному виду. И это очень круто!
Мне нравится естественное представление информации автоматизированными системами, как будто с вами общается живой человек. Мне кажется, что это мелкие детали, которые формируют отношение к вашему продукту в целом.
И если это отношение положительное, то вас будут выбирать в дальнейшем и рекомендовать друзьям.
В статье я расскажу, как показывать адрес одной строкой так, будто его написал человек. Я не могу с уверенностью сказать, что, прочитав статью, вы увеличите прибыль.
Но мне бы очень хотелось, чтобы как можно больше систем писали адреса красиво.
Все правила, описанные ниже, мы выработали сами. Большинство из них используем или скоро подключим на dadata.ru.
Да, он красивый, с ним проще работать. Но как посчитать материальную пользу?
Пять лет назад в аэропортах звучал синтезированный голос, объявляя прилёты и вылеты с разорванной интонацией после каждого слова. Иногда даже отличалась скорость речи для разных слов.
И вот пару недель назад я заслушивался новыми объявлениями о вылетах. Было чувство, что их целиком записал профессиональный диктор, который всю жизнь учился на эту роль. Интерфейс стал лучше, он стал более натуральным.
Стал ли я от этого больше летать? Вряд ли.
Может, у меня появилось предпочтение между аэропортами? Не думаю, что это настолько важный момент.
Тем не менее, зачем-то люди потратили время и деньги на приведение объявлений к естественному виду. И это очень круто!
Мне нравится естественное представление информации автоматизированными системами, как будто с вами общается живой человек. Мне кажется, что это мелкие детали, которые формируют отношение к вашему продукту в целом.
И если это отношение положительное, то вас будут выбирать в дальнейшем и рекомендовать друзьям.
В статье я расскажу, как показывать адрес одной строкой так, будто его написал человек. Я не могу с уверенностью сказать, что, прочитав статью, вы увеличите прибыль.
Но мне бы очень хотелось, чтобы как можно больше систем писали адреса красиво.
Все правила, описанные ниже, мы выработали сами. Большинство из них используем или скоро подключим на dadata.ru.
+15
Как выбрать алгоритм для адресного фильтра
8 мин
19KДовольно часто на Хабре появляются статьи с новыми алгоритмами автоматического разбора адресов, записанных одной строкой. Кроме этого, услуги по обработке адресов предоставляют различные it-компании. В статье мы расскажем как использовать свою адресную базу для выбора алгоритма автоматического разбора адресов, и на что стоит обратить внимание при тестировании и разработке алгоритмов адресных фильтров.
Эта статья для всех, кто хранит данные клиентов и хочет решить одну из следующих задач:
- убедиться, что адрес существует, чтобы не отправить посылку или письмо в никуда;
- разбить адрес на компоненты, чтобы понять, где идут лучше продажи;
- дополнить адрес недостающей информацией, чтобы оптимизировать план работы курьеров;
- стандартизовать адреса, чтобы найти дублирующие записи одного и того же клиента;
- актуализировать и привести адреса к формату справочника, чтобы пройти проверки регуляторов.
Задача автоматического разбора почтовых адресов кажется довольно простой на первый взгляд — бери да сопоставляй адресному справочнику (например, ФИАСу) слова из входной строки. Но все, кто за неё берутся, утопают в большом количестве особенностей адресов…
+21
ФИАС или КЛАДР: выбираем справочник адресов
9 мин
185K 1 июля 2014 года произошло одно из самых значимых событий в истории государства Российского: с этого момента у нас в стране наконец появилась эталонная база адресов по всем, даже самым малым населённым пунктам! Имя этой базе — ФИАС. Собственно, сам по себе справочник ФИАС появился гораздо раньше, но именно 1 июля вступил в силу ФЗ 443, согласно которому все государственные и муниципальные структуры теперь должны опираться на него как на единственно верную базу адресов. Мы решили исследовать, стоит ли переходить на ФИАС, и с какими подводными камнями столкнутся те, кто решит это делать.
Прочитав статью, вы узнаете:
Прочитав статью, вы узнаете:
- Чем отличается ФИАС от КЛАДР
- Можно ли уже использовать ФИАС вместо КЛАДР
- Стоит ли беспокоиться о переходе на ФИАС тем, кто уже работает с КЛАДР
- Решит ли ФИАС текущие проблемы с адресами
- Что ждёт тех, кто только начинает использовать адресные справочники
- Какие есть самые заметные и важные проблемы при работе с ФИАС и КЛАДР
+61
Занимательная статистика от HFLabs
2 мин
8.5KКаждый день мы сталкиваемся с интересными случаями в КЛАДР, справочниках фамилий и иных ресурсах. Сегодня хотим вспомнить самые забавные из них.
У Вас необычная фамилия? Поверьте, Вы далеко не одни. Вот, например, частота появлений в небольшой выборке в одном нашем проекте:
Как видим, Ленин и Есенин стоят на первых местах по популярности среди клиентов, а вот Сталин нынче не в тренде. И ещё тут не указан Пушкин, который встречается в 2.5 раза чаще, чем все выше вместе взятые.
TOP интересных фамилий
У Вас необычная фамилия? Поверьте, Вы далеко не одни. Вот, например, частота появлений в небольшой выборке в одном нашем проекте:
Как видим, Ленин и Есенин стоят на первых местах по популярности среди клиентов, а вот Сталин нынче не в тренде. И ещё тут не указан Пушкин, который встречается в 2.5 раза чаще, чем все выше вместе взятые.
+12
Информация
- В рейтинге
- Не участвует
- Откуда
- Berlin, Berlin, Германия
- Дата рождения
- Зарегистрирован
- Активность