Pull to refresh

Comments 2

Очень доступно изложено о том, какие подводные камни надо прощупать перед проектированием DWH. Я бы добавила телеграм как способ оповещения (уже много где поддерживается).

Также стоит учитывать при выборе и проектировании, как сильно может вырасти система (горизонтальное масштабирование). Пример: в известном банке загрузка дневного регламента была реализована сначала в одном управляющем workflow (потоке) в Информатике. Т.е. отдельные процессы, конечно, были реализованы как отдельные workflow, а в управляющий встраивались "ссылки", которые вызывали загрузки в правильном порядке. Управляющий поток буквально за год так разросся, что при любых действиях с ним интерфейс Информатики зависал минут на 30-40 – и при запуске, и при открытии, и при любом изменении, даже банальном “протягивании стрелочки”. В общем, переделывать потом пришлось на несколько маленьких потоков и костылить прикручивать между ними взаимосвязи.

Также интересный вопрос, как решение будет работать с несколькими процессами над одним объектом. Например, я возьму и запущу две загрузки в одну и ту же таблицу за разные периоды (инициирующую/исправляющую и регламентную, например) - по идее, система не должна такого позволять вообще или должна выстраивать их в очередь (вторая не стартует, пока первая не добежит).

Мы у себя выбрали смешанное решение - ETL-инструмент (Datastage, да, то еще г, так уж вышло) выступает как движок, умеющий выполнять операции разного рода. А логика уже на нашей системе. Описание, если интересно, тут

Дельные дополнения.
И да, скорее публикация ориентирована на маленькие-средние компании. С крупными предприятиями всегда есть нюансы. Читая, вспомнил и свой опыт работы с Informatica PC, кажется, в том же Банке :)
Спасибо за то, что делитесь опытом!

Sign up to leave a comment.