Как стать автором
Обновить

DesktopETL — кросс-платформенный прототип ETL-системы, или как регулярно загружать XML/JSON и сохранять в XLS/CSV

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.2K
Всего голосов 4: ↑3 и ↓1+2
Комментарии4

Комментарии 4

Вот уж чего-чего, а ETL всякого, казалось бы... в т.ч. с графическим интерфейсом, где все возможные фичи уже реализованы. NiFi, Pentaho чем не подошли? Если отбросить странные требования типа "должно работать в корпоративной сети, где от сотрудника требуют выполнять такие задачи, но не дают ему прав установить программу или добавить задание в планировщик" (хотя и для этого случая онлайн-сервисы есть, коих тоже с избытком)

я описал этот момент, возможно не так подробно. ETL надо разворачивать (ну или они уже должны присутствовать в инфраструктуре), если речь идет о корпоративной сети. Даже если эти системы уже присутствуют и используются - регулярно встречаю ситуацию, когда потребность в добавлении своего дага - это достаточно трудоемкий процесс. Идея проекта - использование ETL - здесь и сейчас. Запустил, внес параметры и работает. Возможно для отладки чего-то серьезного, возможно для выполнения каких-то разовых задач или регулярных задач в течение дня, не более того.

Ну я поэтому и привёл в пример не Airflow, про который Вы упомянули, - а именно NiFi и Pentaho, у которых:

  • всё "разворачивание" - это распаковать архив с дистрибутивом (оба на Java, так что кроссплатформенность из коробки) и запустить;

  • после этого нам не надо ничего писать, а надо в веб-интерфейсе (NiFi) или GUI (Pentaho) мышкой накидывать ETL pipeline из готовых блоков.

Talend ещё есть, да и наверняка по запросу "GUI ETL Tools" найдётся ещё десяток вариантов...

Александр, спасибо большое за полезную информацию, не знал что NiFi и Pentaho разворачиваются так просто. Talend нет, не зашел в свое время, правда пробовал его около двух лет назад.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий