Статьи / Профиль KlimenkoIv / Хабр

Иван Клименко @KlimenkoIv

Архитектор

Профиль Публикации 6Комментарии 23Закладки 104

KlimenkoIv 1 мар 2023 в 02:10

Apache NiFi. Запуск Pipeline тогда, когда надо

Простой

5 мин

Open source*Data Engineering*Визуальное программирование*

Кейс

Добрый день. Меня зовут Иван, я дата‑инженер, основной профиль — доставка данных от источников до целевых систем DWH. Чаще всего работаю с Apache NIFI.

В данной статье я расскажу о вариантах старта PipeLine обработки данных в требуемое время. Статья подойдет новичкам, опытные коллеги могут дополнить в комментариях.

Интересующимся - читать дальше.

KlimenkoIv 2 июн 2022 в 00:26

Apache NiFi. Быстрый доступ к логам

2 мин

5.2K

Apache*Data Engineering*Визуальное программирование*

Рассмотрим простой способ получить информацию из лога Nifi с помощью самого Nifi. Это может быть полезно при разработке, тестировании, отладке потоков. А также, поможет организовать получение событий, если у вас еще не готова инфраструктура мониторинга и логирования.

KlimenkoIv 22 мар 2022 в 15:37

Загрузка stage слоя DWH. Часть 3

7 мин

3.8K

Open source*Apache*Data Engineering*Визуальное программирование*

Каждый разработчик потоков Nifi сталкивается с тем, что через некоторое время потоки начинают повторятся. Бизнес хочет получать данные не по одному расписанию, а к определённым моментам времени. И возникает ситуация, когда управлять большим разросшимся потоком становится неудобно и сложно. Устранять ошибку проектирования приходится в десятках процессоры группах. И так далее...

Рассмотрим подход к параметризованному потоку загрузки, универсальному в сложившемся окружении, при обкатанных правилах формирования DWH, выполнения запросов к источникам, интервалам загрузки.

KlimenkoIv 19 янв 2022 в 02:48

Загрузка stage слоя DWH. Часть 2

5 мин

4.5K

Open source*Apache*Data Engineering*Визуальное программирование*

Всем доброго дня. Я Иван Клименко, и я разработчик потоков данных в компании Аскона. Данная статья посвящена параметризации NIFI-потока и информированию СУБД об окончании загрузки.

Продолжаю рассказывать о разработке потоков ETL на Apache NIFI. Первая статья была более общей, в текущей я более подробно остановлюсь на параметрах процессоров в основных шагах, о применил атрибутов, как средства параметризации выполнения потока, и о применил для внесения в целевую систему с процессора PutDatabaseRecord.

KlimenkoIv 10 янв 2022 в 14:45

Загрузка stage слоя DWH. Часть 1

5 мин

7.6K

Open source*Data Engineering*Визуальное программирование*

Из песочницы

Доброго дня. Меня зовут Иван Клименко, я разработчик потоков обработки данных в компании Аскона. В этом цикле статей я расскажу опыт внедрения инструмента Apache Nifi для формирования DWH.

Данная статья посвящена первому этапу внедрения Apache NIFI - начальным потокам выгрузки, внедрению инкрементальной загрузки, и описанию существующей архитектуры.

Apache NiFi. Запуск Pipeline тогда, когда надо

Apache NiFi. Быстрый доступ к логам

Загрузка stage слоя DWH. Часть 3

Загрузка stage слоя DWH. Часть 2

Загрузка stage слоя DWH. Часть 1

Информация

Специализация