Как стать автором
Поиск
Написать публикацию
Обновить

Комментарии 7

можно пояснить вот это

6. Если есть новая запись для хеша — заменяем ее на слое DWH.

Это запись новая, а хеш старый?

Ты не понимаешь, это "разработа"!

P. S. Автор, поправьте, пожалуйста, эаголовок.

Спасибо за вопрос! Да, действительно – мы получаем две строки с одинаковым хешем, но на слое DWH оставляем только ту, где у хеша более свежая дата записи в БД

Диплом что ли писали? Ключи из систем источников называются - натуральный ключ. Ключи в dwh называются - соррогатный ключ.

Хотелось бы почитать на базе каких инструментов это реализовалось, были ли нюансы интеграций, как делали разграничение прав на всех слоях, а то выглядит как пустая теория какая то.

Про МДМ вообще непонятно. Ну, например, есть у нас справочник номенклатур на 1.5 млн позиций. Как заводить меппинг для него? Или про сырой слой DWH. Загружаются к нам данные в виде девятиэтажных вложенных массивов, как их разбираем по объектам и проводим дедубликацию, какой тут подход?

Добрый день. А можно узнать про DE pipeline часть - чем данные гоняли? Спасибо.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации