Хабр
Все потоки
Поиск
Написать публикацию
Настройки
Войти
Обновить
121.34
Подписаться
Data Engineering
*
Обсуждаем вопросы сбора и подготовки данных
Статьи
Посты
Новости
Авторы
Компании
Поиск
Имя
Вклад в хаб
Артем
@art_pro
Пользователь
В поисках обеда: распознавание активности по данным фитнес-трекера
22 июня 2020 в 07:01
45
Станислав Габдулгазиев
@StanislavRG
Пользователь
Spark Connect. А нужны ли перемены?
17 сентября в 09:43
45
@ds-team
Пользователь
Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито
2 мая в 15:18
45
Дмитрий Сергеев
@DataWondering
Data Science @ ŌURA, автор канала @data_wondering
44
@ruvds
Пользователь
Как не пополнить ряды стремных специалистов, если ты Data Scientist
23 мая 2020 в 11:16
44
МФТИ Digital
@mipt_digital
Технологии и предпринимательство
Что случается с медицинскими данными без стандартов отчетности: кейс менингита и survival-анализа в R
17 сентября в 09:00
42
Игорь Кальченко
@IgorKalchenko
ML разработчик
Как я учился на аналитика данных
27 мая в 07:00
42
@artyba
Пользователь
Из таксиста в дата саентисты (перекатиться в 37 лет). Часть 2
12 мая 2021 в 10:42
41
Артем Пичугин
@a-pichugin
Education program designer
Как сделать свой автоскейлер для кластера
27 декабря 2019 в 08:35
40
Влад Божьев
@NeTRuS-Dev
Backend Engineer
Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице
29 мая в 09:12
40
Михаил Фомин
@selenzorn
Технический писатель
Как упростить анализ данных? Запуск и сценарии использования готовой виртуальной машины для аналитики
31 марта 2023 в 10:30
40
Никита
@sowow359
Data Engineer
Как мы выбирали Data Catalog, но в итоге оставили все как есть
9 апреля 2021 в 08:51
40
Евгений Левашов
@levashove
Content Team Lead VK Tech, Lead Editor
H2O LLM Studio: как дообучить языковую модель под свои задачи, не привлекая внимания датасаентистов
16 октября в 09:32
38
Трофим
@select_zvezdo4ka_from
Пользователь
ClickHouse не тормозит, но теряет данные. Часть 3 — материализованные представления
14 августа в 13:00
38
@SacredDiablo
Пользователь
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов
15 мая в 09:01
38
Никита
@databorodata
intern data analyst
Работа над неразмеченными данными с QGIS и opentripmap на практике
16 июля 2022 в 13:55
38
Евгений Трифонов
@phillennium
ContentProvider
О чём узнают дата-инженеры на SmartData 2024: инструменты, БД, DataOps и немножко космоса
20 августа 2024 в 15:08
38
Murad Arfanian
@murad_arfanian
Пользователь
Как мы мигрировали на новый шардированный кластер ClickHouse
29 августа в 15:25
37
Дмитрий Немчин
@4etvegr
DBA, DevOps, TeamLead
Проблемы БД или почему большой продакшн спасут только массовые расстрелы запросов
5 июня в 09:55
37
Илья Бакалец
@Ilya12c
Тим лид команды по машинному обучению в Магнус Тех
Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (1 и 2 место)
24 августа 2023 в 10:29
37
Назад
Сюда
1
2
3
4
5
Туда
Назад