Хабр
Все потоки
Поиск
Редактировать
Настройки
Войти
Обновить
256K+
Подписаться
Data Engineering
*
Обсуждаем вопросы сбора и подготовки данных
64,17
Рейтинг
Статьи
Посты
Новости
Авторы
Компании
Поиск
Имя
Вклад в хаб
Evgeny Vilkov
@EvgenyVilkov
Technical Director, Lead Data Architect
Процедурное SQL-расширение в Lakehouse-платформе – новые возможности для работы с данными
20 января в 11:32
43
Алёна Дозорова
@Dozorova_Alyona
Пользователь
Мал, да удал: почему пять строк рефакторинга могут сказать о разработчике больше, чем весь его GitHub
29 апреля в 13:57
41
Игорь Кальченко
@IgorKalchenko
ML разработчик
Как я учился на аналитика данных
27 мая 2025 в 07:00
42
@artyba
Пользователь
Из таксиста в дата саентисты (перекатиться в 37 лет). Часть 2
12 мая 2021 в 10:42
41
Артем Пичугин
@a-pichugin
Education program designer
Как сделать свой автоскейлер для кластера
27 декабря 2019 в 08:35
40
Влад Божьев
@NeTRuS-Dev
Backend Engineer
Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице
29 мая 2025 в 09:12
40
Михаил Фомин
@selenzorn
Технический писатель
Как упростить анализ данных? Запуск и сценарии использования готовой виртуальной машины для аналитики
31 марта 2023 в 10:30
40
Никита
@sowow359
Data Engineer
Как мы выбирали Data Catalog, но в итоге оставили все как есть
9 апреля 2021 в 08:51
40
@Magnit_OMNI
Пользователь
Тонкости Kafka Connect и Debezium
29 апреля в 11:56
38
@SacredDiablo
Пользователь
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов
15 мая 2025 в 09:01
38
Никита
@databorodata
intern data analyst
Работа над неразмеченными данными с QGIS и opentripmap на практике
16 июля 2022 в 13:55
38
Евгений Трифонов
@phillennium
ContentProvider
О чём узнают дата-инженеры на SmartData 2024: инструменты, БД, DataOps и немножко космоса
20 августа 2024 в 15:08
38
Murad Arfanian
@murad_arfanian
Пользователь
Как мы мигрировали на новый шардированный кластер ClickHouse
29 августа 2025 в 15:25
37
Дмитрий Немчин
@4etvegr
DBA, DevOps, TeamLead
Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов
5 июня 2025 в 09:55
37
Илья Бакалец
@Ilya12c
Руководитель ML команды
Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (1 и 2 место)
24 августа 2023 в 10:29
37
Ruslan Zhuravlev
@zhurus
исследователь, аналитик
Уловимые частицы: как сервисы Яндекса помогают прогнозировать последствия извержений вулканов
21 февраля 2024 в 08:00
36
Vitaly Zdanevich
@zdanevich-vitaly
Software Developer
О Wikidata для тех кто вообще не слышал: открытая база данных, сестринский проект Википедии — с ней же и интегрирован
30 марта 2024 в 03:10
35
@ItsPavel
Пользователь
Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса
5 сентября 2023 в 09:43
35
Команда Х5 Tech
@X5Tech
Пользователь
Параллельные вычисления в Apache Spark
23 августа 2022 в 09:42
35
Наталия Вареник
@natalia_varenik
Пользователь
Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС
14 мая 2025 в 13:16
34
Назад
Сюда
1
2
3
4
5
Туда
Назад