Как стать автором
Обновить
9
0
Иван Клименко @KlimenkoIv

Архитектор

Отправить сообщение

Apache NiFi. Запуск Pipeline тогда, когда надо

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4K

Добрый день. Меня зовут Иван, я дата‑инженер, основной профиль — доставка данных от источников до целевых систем DWH. Чаще всего работаю с Apache NIFI.

В данной статье я расскажу о вариантах старта PipeLine обработки данных в требуемое время. Статья подойдет новичкам, опытные коллеги могут дополнить в комментариях.

Интересующимся - читать дальше.
Всего голосов 5: ↑5 и ↓0+5
Комментарии1

Apache NiFi. Быстрый доступ к логам

Время на прочтение2 мин
Количество просмотров5.2K

Рассмотрим простой способ получить информацию из лога Nifi с помощью самого Nifi. Это может быть полезно при разработке, тестировании, отладке потоков. А также, поможет организовать получение событий, если у вас еще не готова инфраструктура мониторинга и логирования.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Загрузка stage слоя DWH. Часть 3

Время на прочтение7 мин
Количество просмотров3.8K

Каждый разработчик потоков Nifi сталкивается с тем, что через некоторое время потоки начинают повторятся. Бизнес хочет получать данные не по одному расписанию, а к определённым моментам времени. И возникает ситуация, когда управлять большим разросшимся потоком становится неудобно и сложно. Устранять ошибку проектирования приходится в десятках процессоры группах. И так далее...

Рассмотрим подход к параметризованному потоку загрузки, универсальному в сложившемся окружении, при обкатанных правилах формирования DWH, выполнения запросов к источникам, интервалам загрузки.

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Загрузка stage слоя DWH. Часть 2

Время на прочтение5 мин
Количество просмотров4.5K

Всем доброго дня. Я Иван Клименко, и я разработчик потоков данных в компании Аскона. Данная статья посвящена параметризации NIFI-потока и информированию СУБД об окончании загрузки.

Продолжаю рассказывать о разработке потоков ETL на Apache NIFI. Первая статья была более общей, в текущей я более подробно остановлюсь на параметрах процессоров в основных шагах, о применил атрибутов, как средства параметризации выполнения потока, и о применил для внесения в целевую систему с процессора PutDatabaseRecord.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии4

Загрузка stage слоя DWH. Часть 1

Время на прочтение5 мин
Количество просмотров7.6K

Доброго дня. Меня зовут Иван Клименко, я разработчик потоков обработки данных в компании Аскона. В этом цикле статей я расскажу опыт внедрения инструмента Apache Nifi для формирования DWH. 

Данная статья посвящена первому этапу внедрения Apache NIFI - начальным потокам выгрузки, внедрению инкрементальной загрузки, и описанию существующей архитектуры.

Читать далее
Всего голосов 8: ↑6 и ↓2+6
Комментарии5

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Data Engineer, Data Engineer
Lead
От 350 000 ₽
Git
Java
Docker
Database
ETL
Apache Airflow
Apache Kafka
Python
High-loaded systems