Search
Write a publication
Pull to refresh
11
0
Иван @k0rsakov

Data Engineer

Send message

Инфраструктура для Data-Engineer Liquibase

Level of difficultyEasy
Reading time5 min
Views3.7K

Liquibase — это по сути реализация принципов IaC, но для баз данных, что делает его ключевым инструментом для DataBase as Code (DBaC). Как IaC управляет инфраструктурой, так Liquibase управляет схемами баз данных, обеспечивая автоматизацию, консистентность и версионирование изменений.

Читать далее

Инфраструктура для Data-Engineer виртуальные окружения

Level of difficultyEasy
Reading time5 min
Views3.2K

В современной Python-разработке управление зависимостями и изоляция проектов являются критически важными аспектами. Независимо от того, работаете ли вы над небольшим скриптом или крупным проектом, правильная организация окружений поможет избежать конфликтов между пакетами и обеспечит воспроизводимость вашего кода.

Читать далее

Как должен выглядеть идеальный GitHub для поиска работы

Level of difficultyEasy
Reading time2 min
Views11K

Сколько раз вы слышали совет: "Укажи GitHub в резюме для поиска работы"?

Многие думают, что просто создать аккаунт и запушить пару репозиториев будет достаточно, чтобы работодатели будут выстраиваться в очередь. Но на самом деле это совсем не так.

Сегодня мы разберёмся, почему пустой GitHub не только не помогает в поиске работы, но и может навредить вашим карьерным перспективам.

Читать далее

Инфраструктура для Data-Engineer форматы файлов

Level of difficultyEasy
Reading time6 min
Views1.6K

В современной дата-инженерии работа с данными неразрывно связана с различными форматами файлов. Каждый формат имеет свои особенности, преимущества и области применения. В этой статье мы рассмотрим наиболее популярные форматы, научимся с ними работать и поймем, когда какой формат лучше использовать.

Читать далее

Будь T-shape

Level of difficultyEasy
Reading time4 min
Views2.3K

Сегодня поговорим о T-shape — концепции, которая играет огромную роль для дата-инженеров и профессионалов в работе с данными.

Почему важно быть не только специалистом в своей области, но и понимать, как работают другие направления? Почему T-shape подход лучше узкой специализации или полной универсальности?

Читать далее

Инфраструктура для Data-Engineer BI-tools

Level of difficultyEasy
Reading time7 min
Views2.3K

BI (Business Intelligence) – это инструмент или несколько инструментов, которые помогают собрать данные в нужный вид и посмотреть на бизнес со стороны данных.

Чаще всего BI-инструментами пользуются аналитики. Они строят дашборды (витрины), выполняют Ad hoc задачи и в целом проводят анализ данных в этих инструментах.

В этой статье я хотел бы показать куда уходят данные и что с ними происходит, когда пайплайны дата-инженеров заканчивают работу.

Читать далее

Что такое Data Driven подход

Level of difficultyEasy
Reading time4 min
Views6.9K

В современном мире бизнес сталкивается с необходимостью постоянно принимать решения. От их качества зависит не только успех отдельных проектов, но и будущее всей компании.

В этой статье мы разберём основные подходы к принятию решений в бизнесе и узнаем, почему компании всё чаще строят свою работу на данных. А ещё расскажу о роли, без которой data-driven подход попросту невозможен – о роли дата-инженера.

Читать далее

Инфраструктура для Data-Engineer DBT

Level of difficultyEasy
Reading time16 min
Views5.1K

dbt является мощным фреймворком, который включает в себя два популярных языка: SQL + Python.

При помощи dbt можно создавать разные "слои" данных или выделить dbt только под один слой, к примеру dm.

При помощи понятного и всем известного SQL интерфейса можно создавать разные модели для вашего DWH или Data Lake.

Читать далее

Чем можно заняться в IT

Reading time4 min
Views6K

IT – это не пузырь, который может лопнуть. Оно уже настолько плотно вошло в нашу жизнь, что повсюду, куда бы мы ни посмотрели, мы видим его следы, и это не изменится.

В этой статье вы узнаете, что такое IT и чем можно заняться в IT помимо программирования.

Читать далее

Инфраструктура для Data-Engineer Apache Iceberg

Level of difficultyMedium
Reading time16 min
Views6.4K

В этой статье вы узнаете что такое Apache Iceberg, как его можно использовать и для чего он вообще нужен.

В статье также рассматривается вопрос Data Lake.

Читать далее

Данные – это новая нефть

Level of difficultyEasy
Reading time5 min
Views4.8K

Данные – это реально нефть и даже лучше.

Выгода от данных больше чем от нефти.

Нефть заканчивается, а данные никогда не закончатся – это первое. А второе – данные можно перерабатывать и каждый раз получать выгоду.

Читать далее

Инфраструктура для Data-Engineer ClickHouse

Level of difficultyEasy
Reading time9 min
Views4.5K

В этой статье я хочу показать как можно использовать ClickHouse в дата-инженерии и как его "пощупать".

Рекомендуется всем, кто ещё не знаком с ClickHouse.

В статье постарался всё кратко и понятно рассказать про ClickHouse.

Читать далее

Что такое Big Data | Биг Дата?

Level of difficultyEasy
Reading time4 min
Views4.4K

Big Data – термин, который вы можете часто встретить на просторах интернета. Вы можете найти множество статей, докладов и прочих материалов по этому термину, но давайте попробуем разобраться в нём, потому что он не так страшен, как о нём говорят.

Читать далее

Pet-проекты и данные для Data-Engineer

Level of difficultyEasy
Reading time6 min
Views7.1K

При изучении дата‑инжиниринга часто возникает вопрос: «откуда брать данные?»

В данной статье вы узнаете про крутые инструменты, которые позволят вам создавать свои pet‑проекты c использованием разнообразных данных.

Читать далее

Как растут компании

Level of difficultyEasy
Reading time7 min
Views1.4K

В прошлой статье мы обсудили кто такой дата-инженер. Давайте теперь обсудим на каком этапе жизненного цикла компании он появляется в команде/компании.

В этой статье вы узнаете как могут развиваться компании и какие роли бывают в ней, и как они влияют на её развитие.

Читать далее

Инфраструктура для data engineer Kafka

Level of difficultyEasy
Reading time8 min
Views3.9K

В этой статье я хочу показать как можно использовать Kafka в дата-инженерии и как её "пощупать".

Рекомендуется всем кто не знает что такое Kafka.

Читать далее

Кто такой Data Engineer | Дата Инженер

Level of difficultyEasy
Reading time4 min
Views4.1K

В статье вы узнаете кто такой Data Engineer | Дата Инженер. Какие бывают направления и куда можно посмотреть, чтобы развиваться в дата-инженерии

Читать далее

Всё что нужно знать про DuckDB

Level of difficultyEasy
Reading time11 min
Views20K

В статье рассказано, как вам может помочь утка при работе с данными, с OLAP-нагрузкой и как она может плавать в вашем Data Lake. Вы узнаете всё самое важное про DuckDB и сможете попрактиковаться в работе с DuckDB.

Читать далее

Инфраструктура для data engineer S3

Level of difficultyEasy
Reading time4 min
Views3.2K

S3 – это один из сервисов, который используется для построения Data Lake и обмена файлами.

В этой статье рассказывается о технологии S3 со стороны дата-инженерии.

Мы в статье рассмотрим как развернуть сервис, как им пользоваться и зачем он нужен в дата-инженерии

Читать далее
1

Information

Rating
Does not participate
Location
Иркутск, Иркутская обл., Россия
Registered
Activity

Specialization

Fullstack Developer, Data Engineer
Lead
Git
OOP
SQL
Python
Linux
PostgreSQL
Docker
Database
Microsoft SQL Server
T-SQL