Как стать автором
Обновить

Комментарии 13

Яна, спасибо за материал. Подскажите, какой DQ инструмент используете?

Яна, спасибо за интересный и полезный материал. К сожалению пока единичные компании приходят к такому уровню зрелости работы с данными :)

Спасибо за обратную связь! Да, выстроить единый процесс мониторинга качества данных может быть непросто. Но положительная тенденция определённо есть :)

Яна спасибо! Если есть возможность напиши про сами проверки которые вы используете.

Спасибо за интерес!

Инструмент базового мониторинга (актуальность, отсутствие дублей, полнота данных) реализован коллегами таким образом, чтобы его можно было переиспользовать в разных командах для своих таблиц.

Всё остальное (логические проверки, как правило) разрабатываем сами для каждого проекта в Ataccama. И здесь, как писали в статье, что и как нужно проверять зависит от конкретных данных.

Яна, добрый день.

А решение Ataccama продолжает работать в версии на момент начала 2022 года? Этого хватает? Смотрели на отечественные аналоги?

Добрый день!
Пока продолжаем работать в Ataccama и текущих возможностей хватает.
Но, как писали в статье, мониторинг данных можно реализовать во многих доступных аналитических инструментах.

Спасибо, что отдельно подчеркнули, какие именно проверки считаете базовыми и отметили, что они нужны всегда.

Итак, практически любой мониторинг начинается с базовых проверок – это фундамент контроля качества данных. Основным является мониторинг актуальности, полноты и дублей. 

Базовые проверки нужны всегда! Они способствуют быстрому отслеживанию стандартных проблем и оперативному реагированию на них.

Я бы еще добавил, что достаточно большая доля проблем с данными укладывается именно в эти категории, а реализовать такие проверки довольно просто. Кроме того, в процессе настройки проверок на актуальность, уникальность и полноту можно обнаружить довольно много интересных, но неприятных моментов, которые ранее могли оставаться незамеченными.

Согласна, спасибо за полезный комментарий!

Что я понял, как не программист. Отзывы покупателей на товар - не доходят до работников магазина и вообще не привязаны к конкретному товару, что на мой взгляд крайне странно.

То есть вся система изначально была сделана плохо и теперь вы исправляет ошибки, придумывая костыли?

Добрый день!

Мы нигде не писали про отзывы покупателей. Статья описывает технический мониторинг данных.

Возможно, ваш комментарий относится не к этой статье.

Здравствуйте.

Я же говорю, что я не программист)

Но я всё равно не понимаю, почему нельзя заложить в основу системы возможность создавать отчёты? Просто это так странно.

Либо я вообще не понял статью и надо будет перечитать ещё раз внимательнее)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий