Комментарии 4
Вот уж чего-чего, а ETL всякого, казалось бы... в т.ч. с графическим интерфейсом, где все возможные фичи уже реализованы. NiFi, Pentaho чем не подошли? Если отбросить странные требования типа "должно работать в корпоративной сети, где от сотрудника требуют выполнять такие задачи, но не дают ему прав установить программу или добавить задание в планировщик" (хотя и для этого случая онлайн-сервисы есть, коих тоже с избытком)
я описал этот момент, возможно не так подробно. ETL надо разворачивать (ну или они уже должны присутствовать в инфраструктуре), если речь идет о корпоративной сети. Даже если эти системы уже присутствуют и используются - регулярно встречаю ситуацию, когда потребность в добавлении своего дага - это достаточно трудоемкий процесс. Идея проекта - использование ETL - здесь и сейчас. Запустил, внес параметры и работает. Возможно для отладки чего-то серьезного, возможно для выполнения каких-то разовых задач или регулярных задач в течение дня, не более того.
Ну я поэтому и привёл в пример не Airflow, про который Вы упомянули, - а именно NiFi и Pentaho, у которых:
всё "разворачивание" - это распаковать архив с дистрибутивом (оба на Java, так что кроссплатформенность из коробки) и запустить;
после этого нам не надо ничего писать, а надо в веб-интерфейсе (NiFi) или GUI (Pentaho) мышкой накидывать ETL pipeline из готовых блоков.
Talend ещё есть, да и наверняка по запросу "GUI ETL Tools" найдётся ещё десяток вариантов...
DesktopETL — кросс-платформенный прототип ETL-системы, или как регулярно загружать XML/JSON и сохранять в XLS/CSV