Всем привет!
Меня зовут Дмитрий, я руководитель группы разработки инструментов BI.
![](https://habrastorage.org/getpro/habr/upload_files/880/e58/864/880e5886435a1a7e3cb064a0a2807924.png)
Стоит ли говорить, что данные вокруг нас и, если мы не умеем с ними работать, то мы не можем функционировать как бизнес вообще? Наша команда платформы данных старается обуздать десятки петабайтов аналитических данных и разрабатывает для этого множество новых подходов и инструментов.
И мы готовы ими поделиться. Приглашаем вас на Ozon Tech Community BI Meetup, 31 января в 19:00. Наша команда расскажет про основные сервисы работы с данными, о том, как нам пришёл в голову подход «платформизации», про создание функционала для сжатия данных, а также обсудим феномен data quality в обработке данных.
Обещаю, информации будет много, но все же мы здесь за данными.
В программе:
![](https://habrastorage.org/getpro/habr/upload_files/d9b/f82/e46/d9bf82e466d389c1b11272ed89430428.jpeg)
Марина Самойлова
Руководитель направления платформы данных
Направление платформы данных Ozon
Интро о BI в Ozon: расскажем о трёх сервисах работы с данными – Vertica, Clickhouse и Hadoop.
![](https://habrastorage.org/getpro/habr/upload_files/bf2/f90/e87/bf2f90e87cdc2a9817abc36887e79149.jpeg)
Александр Барановский
Руководитель отдела интеграции данных
Платформизация в данных: как и зачем
В рамках доклада обсудим, как работает платформизация в Ozon, предпосылки внедрения нового подхода, и что использовали до этого. Детально поговорим про роль единой платформы: какие были сложности и какую цель преследуем.
![](https://habrastorage.org/getpro/habr/upload_files/f56/144/68e/f5614468ee57398c34f4cdf0ad8347f0.jpeg)
Евгения Губарева
Руководитель группы автоматизации платформы данных
Как мы строим платформенное решение для транспорта данных от системы-источника до сырого слоя хранилища
Рассмотрим применение платформизации в данных, а именно, как мы автоматизируем поставку стриминговых данных от системы источника и до хранилища. Расскажем, как нам удалось обобщить процесс транспортировки, какие требования к системе мы получили и как их выполняем.
![](https://habrastorage.org/getpro/habr/upload_files/d95/584/90f/d9558490f6b5d46eec4effb374ce6c3c.png)
Дмитрий Еричев
Руководитель группы разработки инструментов BI
Сжатие данных в ClickHouse через функционал выбора лучших кодеков
Расскажу про создание функционала Low Cardinality (LC), который выбирает лучшие кодеки сжатия в зависимости от характера данных.
![](https://habrastorage.org/getpro/habr/upload_files/219/2d7/127/2192d7127c1e4f71533def3a007dbe51.jpeg)
Наталья Журавлёва
Руководитель группы поддержки DWH
Data Quality
Поговорим о том, что представляет из себя наш главный актив (спойлер – BI), а также, как мы следим за качеством данных. Ну и в конце Наташа расскажет о планах на будущее
Встречаемся в офисе Ozon, «Башня на Набережной», 10, блок С, 30 этаж, Москва-Сити. Начинаем собираться в 18:30.
Для участия в событии регистрируйтесь по ссылке и ждите подтверждения в письме. К сожалению, места в зале уже закончились, присоединиться можно только онлайн, в день мероприятия вам придёт ссылка на трансляцию. Трансляция будет на нашем YouTube-канале и в сообществе в VK.