Articles / Profile of confident

Андрей Кучеров @confident_action

Lead Data Engineer

Habr Career Habr Experts

ProfileArticles3Posts1NewsComments3

confident_action Apr 16 at 05:00

Apache Spark Catalyst: секреты оптимизатора запросов, который должен знать каждый Data Engineer

Hard

17 min

5.1K

Data Engineering * Big Data *

Tutorial

Привет Хабр! Меня зовут Кучеров Андрей и я Lead Data Engineer с более чем 7-летним опытом в области распределенной обработки данных. Я работал над оптимизацией высоконагруженных Spark-приложений в X5 Retail Group и билайн, где мы обрабатывали петабайтные объемы данных. Регулярно сталкиваясь с производительностью запросов, я убедился, что понимание работы Catalyst — необходимый навык для каждого Data Engineer, работающего со Spark.

confident_action Apr 1 at 12:31

Как Apache Spark читает файлы: механизмы, оптимизации

Hard

5 min

3.1K

Big Data * Data Engineering *

Tutorial

Меня зовут Андрей Кучеров, и я Lead Data Engineer. Часть моей работы включает обучение команды. Я люблю делиться своим опытом, потому что в работе с данными мелочей не бывает - часто кажущиеся незначительными детали могут кардинально влиять на производительность всего пайплайна. Многие недооценивают важность правильного выбора форматов данных и тонкой настройки процессов чтения, а потом удивляются, почему их Spark-джобы работают медленно и потребляют слишком много ресурсов. Читаем далее что бы разобраться в теме ->

confident_action Mar 17 at 15:15

Комплексное руководство по конфигурации сервера для LLM

Medium

7 min

5.8K

Machine learning * Natural Language Processing * Artificial Intelligence

From sandbox

Развертывание языковой модели на собственном сервере требует тщательного планирования аппаратной составляющей. В этой статье мы разберем, какие компоненты критически важны для эффективной работы LLM, как они взаимодействуют, и какую конфигурацию выбрать под разные сценарии использования.

Apache Spark Catalyst: секреты оптимизатора запросов, который должен знать каждый Data Engineer

Как Apache Spark читает файлы: механизмы, оптимизации

Комплексное руководство по конфигурации сервера для LLM

Information

Specialization