Привет! На связи как всегда Артемий Козырь, Analytics Engineer в Wheely.
Если вопросы о том, зачем нужна интеграция данных, в чем различия ETL и ELT, как правило уже не требуют пояснений и ответов, и очевидны почти всем, то вопросы о том, какой именно Extract - Load сервис использовать, в чем различия между разными решениями, и как не прогадать в долгосрочной перспективе я слышу гораздо более часто.
В этой публикации попробую резюмировать свои знания:
— Каталог поддерживаемых источников и приемников данных
— Метод чтения данных из источников (Extract)
— Способы репликации в целевое Хранилище (Load)
— Работа с изменениями структуры данных (Schema Evolution)
— Трансформации перед загрузкой данных (EtLT)
— Тип развертывания решения (Deployment)
Буду объянять и показывать примеры на сервисах, которые использовал сам: Hevo Data, Fivetran, Airbyte. Однако критерии униварсальны и применимы для любых других систем подбного класса.