Статьи / Профиль EvgenyVilkov / Хабр

Evgeny Vilkov @EvgenyVilkov

Lead Data Architect

Профиль Публикации 4Комментарии 248Закладки

EvgenyVilkov 2 окт в 23:24

Современная Lakehouse-платформа данных Data Ocean Nova

Средний

15 мин

1.1K

Big Data*Hadoop*Хранилища данных*Open source*Data Engineering*

Обзор

Привет. Меня зовут Евгений Вилков. Я занимаюсь системами управления и интеграции данных с 2002 г., а конкретно системами анализа и обработки данных — с 2007 г. Технологии, с которыми я имел дело на протяжении моего профессионального пути, стремительно развивались. Начиная с решений, основанных на стеке традиционных СУБД, таких как Oracle, MS SQL Server, Postgres, постепенно эволюционируя в ставшие уже классическими (а некоторые даже и закрытыми) MPP-системы, такие как Teradata, GreenPlum, Netezza, Vertica, IQ, HANA, Exadata, ClickHouse, в различные решения на базе экосистемы Hadoop, облачные сервисы и платформы. Меняется мир, меняются технологии, меняются подходы к проектированию, меняются и требования к задачам аналитического ландшафта данных.

Уверен, что многие, кто уже знаком с терминами Data Mesh и Data Lakehouse, задаются вопросом: что может предложить рынок аналитических систем в этих методологиях проектирования и архитектурных подходах. Я хочу рассказать об аналитической платформе данных Data Ocean Nova, владельцем и технологическим идеологом которой я являюсь.

EvgenyVilkov 15 дек 2022 в 18:25

Практический опыт проектирования систем графового анализа

11 мин

4.5K

Блог компании GlowByteАнализ и проектирование систем*Big Data*Хранилища данных*

Наши коллеги из группы компаний ГлоуБайт не так давно публиковали достаточно развернутый материал по графовой аналитике, в котором содержится базовая теория и приведены области практического применения. В этой статье мы бы хотели поделиться опытом проектирования данного класса систем, какие специализированные движки используем, какую типовую архитектуру применяем и как к ней пришли.

+10

EvgenyVilkov 6 мая 2022 в 17:18

Использование Kudu для решения задач в реальном времени в окружении Hadoop

4 мин

2.3K

Блог компании GlowByteBig Data*Хранилища данных*Hadoop*

В предыдущей статье я поделился нашим опытом создания аналитического хранилища полного цикла на базе экосистемы Hadoop. Одним из тезисов той статьи стало утверждение о том, что аналитическую систему можно спроектировать, не прибегая к федерализации разных технологических платформ, предназначенных для решения локальных задач.

В этом материале я попробую подробнее раскрыть, как в нашей системе реализован подход обработки и загрузки данных в реальном времени с использованием технологии Kudu, при котором эти данные сразу доступны для анализа.

EvgenyVilkov 28 апр 2021 в 12:08

Как построить современное аналитическое хранилище данных на базе Cloudera Hadoop

18 мин

15K

Блог компании GlowByteХранилища данных*Hadoop*Big Data*

Привет.

В конце прошлого года GlowByte и Газпромбанк сделали большой совместный доклад на конференции Big Data Days, посвященный созданию современного аналитического хранилища данных на базе экосистемы Cloudera Hadoop. В статье мы детальнее расскажем об опыте построения системы, о сложностях и вызовах с которыми пришлось столкнуться и преодолеть и о тех успехах и результатах, которых мы достигли.

Строить хранилище!

Современная Lakehouse-платформа данных Data Ocean Nova

Практический опыт проектирования систем графового анализа

Использование Kudu для решения задач в реальном времени в окружении Hadoop

Как построить современное аналитическое хранилище данных на базе Cloudera Hadoop

Информация

Специализация