Pull to refresh

ETL и коннекторы к источникам данных: российские реалии

Reading time3 min
Views3.2K

За время работы над аналитическими отчетами по рынку отечественных BI-систем, о которых я уже рассказывал, мы поняли, что есть потребность в обзоре еще одного компонента – а вернее, даже двух связанных с BI. Речь про ETL и коннекторы. Им и посвящено наше новое исследование ETL-круг Громова.

Зачем?

Сейчас есть насущная необходимость в агрегированной информации о российских решениях. Да, в какой-то степени этот вопрос может закрыть всем известный реестр отечественного софта. Но, во-первых, там есть далеко не все решения. А во-вторых, информация о ПО там далеко не полная. Ведь кроме технических параметров нужно разобраться со многими другими, причем желательно в сравнении – реестр этого не позволяет сделать.

Вторая причина запуска исследования в том, что не все BI-платформы имеют собственные встроенные ETL, а значит, выбор ETL тесно связан с выбором BI-платформы. И раз уж последние мы регулярно изучаем, то и первым необходимо уделить определенное внимание.

Ну и третье: рынок российских ETL и коннекторов хоть, на наш взгляд, пока недостаточно развит, но он уже сформировался. Есть ряд сильных и сравнительно известных продуктов, но есть и быстро развивающиеся и весьма перспективные, потенциально способные изменить расклад на рынке. И сейчас, когда многим приходится искать замены для ранее используемых решений, информация о наличии российских предложений весьма актуальна.

Что сделано?

Мы пошли тем же путем, что и с обзором BI-платформ: в первом исследовании мы собрали максимум информации о тех продуктах, которые представлены на рынке. Ни пользовательское тестирование, ни сравнение и ранжирование решений в этот раз мы не проводили – это дело будущего.

Мы собрали максимум информации по каждому продукту, причем постарались систематизировать ее в соответствия с едиными параметрами. Анализировали мы не только техническую сторону, но и такие важные для бизнес-пользователей параметры, как стоимость, наличие плана развития и пр. Вот полный список критериев:

  • Общие технические особенности системы: здесь мы изучали технологический стек, масштабируемость и многопоточность, возможность интеграции с другими программами, пакетный и потоковый контейнер, контроль источников данных и отдельные технические особенности систем.

  • Extract (загрузка данных в платформу): изучали возможности загружать в систему структурированные и неструктурированные данные, находящиеся в источниках различных типов, в частности, в реляционных и нереляционных базах данных, плоских и табличных файлах, различных веб-ресурсах и т.д.

  • Transform (трансформация данных): исследовалось наличие в системе различных инструментов обработки исходных данных для приведения их в вид, пригодный к реализации дальнейших алгоритмов анализа.

  • Load (загрузка): исследовали возможность верификации итоговых данных и автоматической остановки потока в случае некорректных данных, работу с потоками данных, поддержку алертов.

  • Портал: рассматривалась работа интерфейсов системы.

  • Экспорт и шеринг: изучали возможности системы реализовывать экспорт данных готовых аналитических отчетов в различные файловые форматы.

  • Затраты на внедрение: собирали данные о стоимости владения решением, о наличии экспертизы на рынке и поддержке системы.

  • Продуктовые критерии: изучали наличие плана развития и т.д.

Каков результат?

В обзор "ETL-круг Громова 2022" вошли несколько платформ. Среди них – Loginom, Modus ETL, DataBoring ETL, Almaz ETL, PolyAnalyst ETL, ViXtract. Коннекторы: АТК BiView, Albato, SuccessQui (SQ), Neoflex Datagram и другие продукты.. По каждому мы представили агрегированную информацию, а также сводные таблицы по каждому из параметров, где можно увидеть отличия решения.

Наше исследование ориентировано как на тех, кто работает в этом сегменте (ведь всегда полезно увидеть свое решение в контексте того, что предлагают конкуренты), так и на потребителей. Поэтому мы предложили несколько рекомендаций относительно того, на что обращать внимание при выборе продукта.

Суммарно вердикт команды аналитиков таков: пусть до высокого уровня зрелости далеко, но есть вполне конкурентоспособные решения, которые могут закрыть текущие потребности пользователей. Также радует, что у большинства разработчиков есть планы по развитию своих продуктов как минимум на среднесрочную перспективу – это означает, что сегмент видится разработчикам весьма интересным и потенциально прибыльным.

В наших планах – развивать исследование, так что мы открыты к конструктивным рекомендациям и предложениям. 

Скачать исследование можно по ссылке в комментариях.

Tags:
Hubs:
Total votes 6: ↑2 and ↓4-1
Comments6

Articles