All streams
Search
Write a publication
Pull to refresh
9
0

Дата инженер

Send message

Spark. План запросов на примерах

Level of difficultyMedium
Reading time7 min
Views8.5K

Всем привет!

В этой статье возьмем за основу пару таблиц и пройдемся по планам запросов по нарастающей: от обычного селекта до джойнов, оконок и репартиционирования. Посмотрим, чем отличаются виды планов друг от друга, что в них изменяется от запроса к запросу и разберем каждую строчку на примере партиционированной и непартиционированной таблицы.

Читать далее

Агрегатор личных финансов со всех счетов

Level of difficultyMedium
Reading time6 min
Views13K

Всем привет!

Примерно год назад мне захотелось проанализировать доходы и расходы со всех своих банковских карт, количество которых начало разрастаться. После ресерча существующих приложений я поняла, что они либо платные, либо нужно ручками вбивать всю информацию. Плюс вопрос сохранения конфиденциальности данных. В этой статье я расскажу про свой мини-проект, как он мне помогает следить за личными финансами и как вы можете покрутить его сами.

Читать далее

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Engineer
Middle
From 250,000 ₽
Spark
Python
SQL
Apache Hadoop
Apache Airflow
Java
Spring Boot
Docker
Scala
Hibernate