Как стать автором
Обновить
85.12
ITSumma
Эксперты в производительности

Обновили наше бесплатное решение, которое ускоряет обработку данных

Время на прочтение1 мин
Количество просмотров1.2K

Пару лет назад мы разработали решение spark-greenplum connector. Это многофункциональный коннектор с поддержкой параллельных операций чтения/записи между Apache Spark и базой данных Greenplum. А сейчас обновили его и выложили в открытый доступ.

Решение spark-greenplum connector — это многофункциональный плагин для платформ обработки и анализа больших данных. Используя его, вместо встроенного в Apache Spark коннектора, дата-инженеры смогут увеличить скорость чтения и записи из и в базу данных Greenplum в десятки раз и быстро масштабировать количество подключаемых и обрабатываемых источников.

С помощью коннектора инженеры смогут настроить структурированный стриминг с использованием микропакетной обработки. Эта функциональность помогает получать оперативные обновления требуемых данных, что повышает скорость обработки практически до реального времени.

У spark-greenplum connector имеется ряд дополнительных возможностей. Например, использование анонимного блока или функции PL/pgSQL в качестве источника или поглотителя данных при операциях чтения и записи. Это позволяет делегировать часть обработки данных на сторону БД.

На его основе можно строить ETL-решения и анализировать данные in-memory. Он обладает высокой скоростью передачи данных, большой гибкостью в настройке, а также:

  • автоматически формирует схемы данных;

  • разбивает вычисления на параллельные независимые потоки;

  • и поддерживает push-down операторы.

Apache Spark и Greenplum — это популярные opensource-решения, которые используются в большинстве российских платформ по работе с большими данными. Поэтому разработка пригодится многим компаниям.

Репозиторий доступен по ссылке: https://github.com/itsumma/spark-greenplum-connector

Теги:
Хабы:
Всего голосов 23: ↑22 и ↓1+22
Комментарии4

Другие новости

Информация

Сайт
www.itsumma.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
ITSumma