Pull to refresh
3
0
Дмитрий Курганский @DmKrg

User

Send message

Yandex Data Proc для ML: ускоряем Embedding на Spark

Level of difficultyHard
Reading time9 min
Views1.3K

Меня зовут Дмитрий Курганский, я Tech Lead команды MLOps в Банки.ру.
Мы работаем над тем, чтобы грамотно организовать и ускорить этапы жизненного цикла ML. В этой статье поделюсь нашим опытом применения Embedding: от запуска Яндекс Data Proc кластера через Airflow до оптимизации этапа применения Embedding с помощью Spark.
Материал в целом будет актуален для этапа применения (inference) любых моделей для больших наборов данных, работающих в batch режиме по расписанию.

Читать далее
Total votes 3: ↑3 and ↓0+4
Comments0

Как автоматизировать проверки данных в Airflow с Great Expectations

Reading time7 min
Views3.2K

Привет, меня зовут Дима Курганский, и я - MLOps инженер в команде машинного обучения в Банки.ру. Эта статья будет интересна, тем кто понимает принципы работы с Great Expectations и его составляющие компоненты и хочет вывести его на прод с использованием Apache Airflow.

Читать далее
Total votes 7: ↑6 and ↓1+7
Comments0

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

Data Scientist, ML Engineer
Senior