Pull to refresh
7
0
Send message

Как мы не выбрали Airbyte, или почему собирать данные лучше по старинке

Level of difficultyMedium
Reading time7 min
Views3.9K

Привет, Хабр! Меня зовут Илья, я работаю инженером данных в компании Selectel. В отделе BI мы собираем информацию из внутренних и внешних источников и предоставляем аналитикам.

У нас достаточно большой набор внешних ресурсов, данные из которых нужно собирать и обрабатывать. Среди них — различные SMM-площадки вроде VK и Telegram, платформы лидогенерации, инструменты таргетированной рассылки писем, системы автоматизации и многое-многое другое.

Так как компания развивается, мы спрогнозировали, что число источников тоже будет только расти. И назрела мысль, что нам нужно подобрать специализированное ПО, которое будет отвечать за доставку данных из внешних ресурсов в DWH. Время прошло, идея воплощена: мы используем Airflow и самописные коннекторы на Python. Но могло сложиться все иначе — и мы бы использовали Airbyte, если бы не одно но…
Читать дальше →
Total votes 30: ↑29 and ↓1+35
Comments5

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Engineer
Senior
SQL
Database
PostgreSQL
DWH
ETL
Python