Как стать автором
Обновить
40
0
Юлия Грызунова @Julia_Gryzunova

Пользователь

Отправить сообщение

Академия Arenadata: How to ADS.NiFi. Базы данных

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров751

Добрый день. Меня зовут Иван Клименко, и я архитектор департамента поддержки продаж компании Arenadata. В основном занимаюсь продуктом Arenadata Streaming (ADS) — это масштабируемая отказоустойчивая система для потоковой обработки данных в режиме реального времени, адаптированная для корпоративного использования и построенная на базе Apache Kafka и Apache NiFi. В продукт входит cервис Arenadata Streaming NiFi, который является LowCode-средством построения интеграционных потоков с возможностью масштабирования.

Сегодня я бы хотел открыть цикл статей практического применения, так называемого «HowTo…», и первой темой выбрано взаимодействие с базами данных в NiFi. Рассмотрим простые заготовки потоков обработки данных, которые извлекают данные из таблиц и помещают данные в другую, либо эту же базу. Разберем, как создавать подключение к базам, какими процессами пользуемся для выборки, а также как оптимизировать эти процессы. Эта статья будет интересна в первую очередь новичкам в NiFi, ну а от опытных разработчиков всегда жду комментариев с дополнениями или с конструктивной критикой.

Читать далее
Всего голосов 12: ↑11 и ↓1+14
Комментарии2

Как реализовать и оптимизировать UPSERT в Greenplum 6

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.9K

Привет! Меня зовут Антон Васильев, я работаю инженером технической поддержки компании Arenadata и нередко сталкиваюсь с довольно каверзными задачами и багами. Одной из них была проблема оптимизации механизма UPSERT в Greenplum 6. В этой статье я хочу рассказать, как эта задача может быть решена.

Читать далее
Всего голосов 12: ↑12 и ↓0+14
Комментарии0

Nifi — когда record-oriented не оправдывает себя

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров1.9K

Добрый день. Меня зовут Иван Клименко, и я архитектор департамента поддержки продаж компании Arenadata. В основном занимаюсь продуктом Arenadata Streaming (ADS) — это масштабируемая отказоустойчивая система для потоковой обработки данных в режиме реального времени, адаптированная для корпоративного использования и построенная на базе Apache Kafka и Apache NiFi. В продукт входит замечательный сервис Arenadata Streaming NiFi, который является low‑code средством построения интеграционных потоков с возможностью масштабирования.

Сегодня хочу показать на одном из практических случаев, что не всегда в NiFi удаётся следовать шаблонному подходу record‑oriented в разработке потоков обработки и трансформации данных.

Будет большой JSON, будет Avro‑схема, будет JOLT‑спецификация.

Интересно?
Всего голосов 14: ↑13 и ↓1+14
Комментарии0

Коннектор ADB-TO-ADB

Время на прочтение14 мин
Количество просмотров2K

По опыту нашей продуктовой команды разработки и поддержки, пользователи, оперирующие большими объемами данных компании часто используют несколько разрозненных кластеров Greenplum. 

Мотивация такого решения может быть разной: организационная - разные команды-владельцы бизнес-данных выстраивают свои модели данных, обрабатывают их нужным для них образом; техническая - распределенные по различным датацентрам кластеры и т.п. Однако, рано или поздно возникает задача использовать данные из "соседних" хранилищ. Это могут быть как разовые сценарии единичных запросов, так и организация более сложных ETL-процессов. Реализация подобных механизмов опять-таки может быть разной со своими достоинствами и недостатками, исходя из возможностей и ограничений.

В этой статье рассматривается детали предлагаемой нами реализации коннектора для выполнения, так называемых,  гетерогенных запросов в рамках разных кластеров ArenadataDB и/или Greenplum - задача, которой наша команда разработки занималась в 2023 году. Этот коннектор позволяет объединять в запросах разные кластеры ADB, но при этом пользоваться возможностями установления соединений между сегментами. 

Но обо всем по порядку.

Читать далее
Всего голосов 17: ↑17 и ↓0+19
Комментарии2

Реализация глобальных индексов в распределённой системе

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров4.9K

В этой статье я опишу наш путь реализации глобальных индексов в шардированной базе данных. Расскажу обо всех проблемах, с которыми столкнулись, и решениях, которые приняли, чтобы их обойти. Мы поговорим про реализацию на основе базы данных Tarantool, но общий подход применим и к другим шардированным базам данных без встроенной поддержки таких индексов, да и встроенная реализация часто строится по похожим принципам. Эта статья поможет разобраться в деталях, компромиссах и ограничениях работы глобальных индексов.

Читать далее
Всего голосов 23: ↑23 и ↓0+27
Комментарии3

Разработка документации в продуктовой IT-компании с нуля

Время на прочтение19 мин
Количество просмотров11K

Наличие хорошо структурированной, подробной и вовремя актуализируемой технической документации — важный индикатор зрелости любой софтверной компании.

Но что, если документация в компании долгие годы велась разработчиками по остаточному принципу и понемногу стала превращаться в хаос? С чего начать разработку своего портала документации и с какими препятствиями можно на этом пути столкнуться?

В этой статье мы поделимся своим опытом создания документации «с нуля» на примере Arenadata.

Подробнее
Всего голосов 28: ↑27 и ↓1+29
Комментарии9

Padding vs SizedBox. Что выбрать для вёрстки отступов Column и Row

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров4.3K

Здравы будьте! С вами на связи руководитель Flutter-направления Mad Brains Николай Омётов. В этой статье я проведу разбор особенностей вёрстки отступов с помощью Padding и SizedBox и расскажу, что выбрала наша команда для создания единого стиля кода.

Читать далее
Всего голосов 6: ↑6 и ↓0+6
Комментарии5

Как реализовать шаринг в социальные сети

Время на прочтение5 мин
Количество просмотров5.3K

Статья про то, как реализовать шаринг в Facebook и ВКонтакте, используя JavaScript. Мы рассказали про собственный опыт, включая все ошибки, которые вы сможете избежать.

Читать далее
Всего голосов 8: ↑4 и ↓4+2
Комментарии2

Погружение во внедрение зависимостей (DI), или как взломать Матрицу

Время на прочтение9 мин
Количество просмотров6.9K

Давным-давно в далекой Галактике, когда сестры Вачовски еще были братьями, искусственный разум в лице Архитектора поработил человечество и создал Матрицу… Всем привет, это снова Максим Кравец из Holyweb, и сегодня я хочу поговорить про Dependency Injection, то есть про внедрение зависимостей, или просто DI. Зачем? Возможно, просто хочется почувствовать себя Морфеусом, произнеся сакраментальное: «Я не могу объяснить тебе, что такое DI, я могу лишь показать тебе правду».  

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии4

«Мамба» запустила собственную платформу для игр и приложений

Время на прочтение2 мин
Количество просмотров8.1K
Платформа Единой системы знакомств и общения — это принципиально новый шаг на рынке социальных игр и приложений. Механика приложений заметно отличается от всех существующих. «Мамба» как никто другой разбирается в знакомствах, именно поэтому основное требование для всех разработок платформы — возможность дейтинга в процессе игры. Сейчас в системе запущены три игровых приложения с интересным сюжетом и системой общения с противоположным полом. Например, «фермерская» тема обыграна соседством с «интернет-земледельцами», с которыми можно построить не только совместный завод, но и романтические отношения.

Проектируя платформу с технической точки зрения, «Мамба» постаралась учесть недочеты, допущенные в разработках крупных социальных сетей. Кроме этого, в наборе методов представлен уникальный функционал поиска пользователей по многочисленным критериям.

Однако, самое весомое достоинство нового проекта «Мамбы» состоит в уникальном предложении по разделению доходов. Лидер российских знакомств готов отдавать разработчикам 90% своего заработка на приложениях. Это позволит привлечь к сотрудничеству лидеров игрового рынка и уже в скором времени наполнить систему новыми, качественными и интересными механиками знакомств.

Исполнительный директор компании «Мамба» Ярослав Сергеев комментирует: «Проделана большая работа для того, что наши пользователи могли знакомиться еще проще и еще интереснее. Теперь над нашим сервисом кроме внутренней команды разработки будут трудиться сотни внешних компаний, что существенно обогатит функционал системы. Мы планируем обеспечить им максимально комфортные условия сотрудничества и энергично развивать технологическую составляющую платформы».

Информация для разработчиков:

Оферта
Правила размещения приложений
Описание работы с API
Cписок методов API
Всего голосов 39: ↑29 и ↓10+19
Комментарии28

Информация

В рейтинге
Не участвует
Зарегистрирована
Активность