Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

DaData.ru находит и уничтожает одинаковых людей

Блог компании HFLabs Разработка веб-сайтов *Анализ и проектирование систем *SaaS / S+S *


DaData.ru — сервис автоматической проверки, исправления и дедупликации контактных данных (ФИО, адресов, телефонов, email, паспортов).

У меня в телефоне 453 контакта. Среди них встречаются дубли: один и тот же человек записан то как «Леха», то как «Алексей Мегафон», а то и как «Зиновьев, Алексей Иванович». У Лехи указан скайп и день рождения, у «Алексея Николаевича» — емейл и основной мобильный номер, а у «Мегафона» — запасной номер от понятнокакого оператора.

В телефонных контактах дубли неприятны, но не особо напрягают. Хуже, когда такая чехарда начинается с клиентской базой компании.
Дубликаты приходят ночами и мучают маркетологов
Всего голосов 31: ↑24 и ↓7 +17
Просмотры 20K
Комментарии 40

Что такое «система управления мастер-данными» и зачем она нужна

Терминология IT
Из песочницы
Какие бывают данные

Прежде чем перейти непосредственно к системам управления мастер-данными, давайте определим, какого рода вообще бывают данные.

Ниже представлены 5 ключевых типов:

1. Метаданные (Metadata);
2. Референс-данные (Reference data);
3. Мастер-данные (Master data);
4. Транзакционные данные (Transactional data);
5. Исторические данные (Historical data).
Читать дальше →
Всего голосов 15: ↑14 и ↓1 +13
Просмотры 24K
Комментарии 35

Третий не лишний: как мы сократили цепочку листинга товаров, добавив в нее еще одно звено

Блог компании X5 Group Администрирование баз данных *ERP-системы *
К каждому товару, который попадает в магазин, привязано большое количество мастер-данных, необходимых для системы учета. И каждый отдел — от коммерческого до транспортного — раньше создавал свою форму учета товаров, потом мы мучились с их согласованиями и изменениями. В таких условиях создавать еще один «отдел» по составлению каталогов товаров было бы безумием, но мы рискнули и привлекли к работе экспертную лабораторию. И хотя цепочка ввода товара в ассортимент стала длиннее, общее время листинга сократилось на неделю. В этом посте поделимся подробностями, как мы построили работу с лабораторией и что получили в итоге.


Читать дальше →
Всего голосов 10: ↑9 и ↓1 +8
Просмотры 2.9K
Комментарии 8

Дорогая, мы убиваем бюрократию: как цифровизация меняет диалог поставщиков и X5

Блог компании X5 Group Администрирование баз данных *Хранение данных *
Когда у тебя 5 тысяч поставщиков, огромный документооборот и бизнес в масштабах страны, привычная схема сбора данных отнимает драгоценное время. Время – деньги, как известно, поэтому мы в X5 постоянно думаем над тем, как оптимизировать процесс обмена мастер-данных с поставщиками, и уже добились хорошего результата. В прошлый раз мы рассказывали как оптимизировали листинг товаров, добавив в цепочку еще одно подразделение. Сегодня мы расскажем о новом портале для поставщиков и почему мы видим за этим будущее.


Читать дальше →
Всего голосов 12: ↑10 и ↓2 +8
Просмотры 4.6K
Комментарии 10

Создаём компанию мечты: мастер-данные и интеграция

Анализ и проектирование систем *Хранилища данных *Управление проектами *
Recovery mode
Есть легенда, что когда Билл Гейтс с коллегами продумывали архитектуру будущей Windows 3.1, они рисовали её от руки на склеенных ватманах. Маленькие квадратики обозначали блоки и модули системы, а стрелочки между ними — потоки данных из одной системы в другую (каждая система общалась с каждой напрямую). Эта схема поместилась целиком на полу в кабинете у самого Гейтса, правда, пришлось вынести в коридор стол и стулья.

Год спустя, при проектировании новой операционки Windows 95, ребята “вынесли” целую столовую. Но через пару месяцев работы стало понятно, что и в ней места уже не хватит. И если позволить приложениям и дальше общаться с операционной системой и друг с другом по-старому, получится истинный ад бесконечных взаимосвязей и зависимостей. Нужен был принципиально другой подход…

image
Что получилось в итоге, и что сейчас с интеграцией в больших компаниях
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 3.4K
Комментарии 2

Создаём компанию мечты: управление качеством данных

Анализ и проектирование систем *Big Data *Хранилища данных *Управление проектами *
Recovery mode
Самой дорогой ошибкой в истории, вызванной неправильными исходными данными, считается авария ракеты Ариан-5. Суммарный урон по итогу этого случая оценивают в 0.5 миллиардов долларов в ценах начала 1996 года.

Ещё одной, возможно, самой курьёзной, стала ошибка в огромном заказе от французских железных дорог SNCF на 2 тыс. поездов в 2014 году. Команда, которая формировала технические требования, собственноручно провела замеры габаритов перронов на нескольких десятках станций. Желая увеличить комфорт, они задали ширину составов впритык к максимальной. Измерения они проводили в окрестностях Парижа — и о том, что в регионах на многих станциях перроны находятся ближе к путям, узнали уже при испытаниях. Цена ошибки — модернизация всей инфраструктуры на сотни миллионов евро. Им бы там MDM с характеристиками станций…

image
Кто же должен нести ответственность за качество данных и как им управлять?
Рейтинг 0
Просмотры 4.1K
Комментарии 7

Создаём компанию мечты: нет хайпу

Анализ и проектирование систем *Big Data *Хранилища данных *Управление проектами *
Recovery mode
Наверняка в вашей компании уже не раз появлялись ребята в дорогих костюмах и с хорошо подвешенным языком, увлекательно рассказывающие, что без современных айти-штучек компания не проживет и несколько лет!

Все эти data lake (болото данных), КХД (корпоративное кладбище данных), data mining (смотри, не подорвись), data governance (стань рабом своих данных) и им подобные не исчезают из их рассказов, периодически сменяя друг друга. Срок жизни очередного хайпа редко превышает год-два, но при желании для вас с большим удовольствием откопают любую почти забытую технологию.

При этом биг-дату продают как такой волшебный сундук, из которого можно доставать разные чудеса: то ковер-самолёт, то сапоги-скороходы, а то и шамаханскую царицу (кому что актуально). Вот только, как правило, ковёр-самолёт проеден волшебной же молью — и больше не летает, у сапог отвалилась подошва — и пешком-то в них ходить неудобно, а про дряхлую царицу и говорить нечего.

В этой статье я постараюсь рассказать о старых-добрых технологиях, которые всё ещё работают. О том, что можно извлечь из перечисленных выше хайповых технологий — и как всем этим пользоваться простым смертным, типа нас, не нанимая толпу дата-сайентологов с зарплатами >10 тысяч $ в месяц.

image
Подробнее
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 3.4K
Комментарии 13