Открываю ноутбук. Захожу в метрики своего интернет-магазина. 500 тысяч посетителей в день. Каждый клик — событие. Каждый просмотр товара — строка в логах. Каждое добавление в корзину — ещё одна строка.

За месяц — 15 миллионов событий. За год — почти 200 миллионов. Это не Google. Не Amazon. Это обычный средний магазин на ~100 человек.

А теперь умножьте это на количество таблиц: пользователи, заказы, платежи, доставки, отзывы, просмотры, лайки, рефералы, купоны, возвраты...

Поздравляю. Вы уже работаете с Big Data. В 2026 году это уже не привилегия корпораций, а стандарт ведения цифрового бизнеса. И как следствие этой "гонки вооружений" произошла тектоническая смена ориентиров. Классическая связка Airflow + PostgreSQL, которая ещё вчера считалась золотым стандартом, сегодня стремительно сдает позиции. Её место уверенно занимает дуэт Airflow + ClickHouse — технологический фундамент современной инженерии данных.

Иллюзия "маленького бизнеса"

Почему мы до сих пор думаем, что Big Data — это про Google, Uber и Amazon?

Потому что 10 лет назад так и было:

  • Терабайты данных генерировали только корпорации

  • Хранить и обрабатывать их могли только они

  • Инструменты для Big Data были сложными и дорогими

Но мир изменился. Сейчас даже маленький бизнес генерирует столько событий, сколько 10 лет назад генерировал средний банк.

Постгрес не виноват, он просто другой

Я люблю PostgreSQL. Он прекрасен для транзакций. Но давайте честно:

Что хорошо умеет PostgreSQL:

  • Обрабатывать множество транзакций в секунду

  • Гарантировать целостность данных (ACID)

  • Выполнять сложные JOIN между 5-10 таблицами

  • Работать с 10-50 миллионами строк

Что PostgreSQL НЕ умеет или умеет плохо:

  • Сканировать 100 миллионов строк за секунду

  • Хранить 500 миллионов строк без падения производительности

  • Агрегировать терабайтные таблицы "на лету"

  • Обрабатывать аналитические запросы параллельно на всех ядрах

  • Эффективно сжимать данные

  • MPP

Простая математика:

  • Если ваша таблица > 100 млн строк = PostgreSQL начинает тупить

  • Если ваша таблица > 500 млн строк = PostgreSQL непригоден для аналитики

  • Если вы храните больше года истории = добро пожаловать в Big Data

Вывод: Средний бизнес уже давно перешагнул эти пороги. Просто никто ему об этом не сказал.

ClickHouse — когда данных "слишком много"

ClickHouse создавался для другого мира. Для мира, где фраза «у нас слишком много данных» — это не проблема, а исходное состояние.

Философия ClickHouse звучит примерно так:

«Мы не будем спрашивать, сколько у вас данных. Мы спросим, сколько у вас есть времени на ответ. И сделаем всё, чтобы вы успели выпить кофе, пока запрос крутится.»

В мире PostgreSQL вы постоянно экономите. Выбираете, какие данные хранить, а какие — удалить. Сжимаете историю. Агрегируете ночью, потому что днём «база ляжет». Вы живёте в режиме дефицита.

В мире ClickHouse вы позволяете себе роскошь хранить всё. Каждый клик, каждый просмотр, каждое движение пользователя. Потому что вы никогда не знаете, какая строчка лога через год окажется золотой жилой для бизнеса.

Разница в ментальности огромна:

В PostgreSQL вы думаете: «У меня 50 миллионов строк. Надо почистить, а то тормозит». В ClickHouse вы думаете: «У меня 500 миллионов строк. Отлично, теперь статистика будет точной».

В PostgreSQL запрос на год истории — это подвиг, который готовят заранее. В ClickHouse это происходит на лету, вы даже не успеете отвлечься на шортс.

ClickHouse не просто быстрее. Он — другой. Он создан для эпохи, когда данные перестали быть дефицитом. Когда каждый бизнес, даже небольшой интернет-магазин, генерирует терабайты событий. И когда бизнес требует ответа не «завтра утром», а «пока я пью кофе».

PostgreSQL — это универсальный работяга. Он закрывает мно задач: и транзакции провести, и данные сохранить, и даже немного посчитать. ClickHouse — это узкий специалист экстра-класса. Он не умеет делать всё подряд. Но ту единственную задачу, для которой он создан — молниеносно отвечать на аналитические запросы по гигантским объёмам данных — он выполняет лучше всех.

А как "рынок порешал"?

Можно сколько угодно рассуждать о технологиях, философии и архитектурных подходах. Можно бесконечно утверждать, что "PostgreSQL плохой, потому что не эффективно хранит большие данные", или же наоборот, что "ClickHouse плохой, потому что не умеет в ACID". Но есть один безжалостный арбитр, чьё мнение перевешивает любые аргументы.

Это рынок. И он уже всё решил.

Открываем никому не известный сайт. Вбиваем airflow AND postgresql и выбираем все специализации, связанные с данными. Также указываем поиск по всей России, а не только Москве:

Получаем следующее количество вакансий:

А теперь меняем postgresql на clickhouse:

Цифры не врут. ClickHouse не просто догнал — он уверенно вышел вперёд.

Рынок не спрашивает, какая база данных «правильнее». Рынок спрашивает, какая база данных приносит бизнесу больше денег. И указывает на ту, с которой дашборды грузятся мгновенно, а аналитики не ждут до обеда.

Airflow + ClickHouse — это не мой выбор. Это выбор рынка.

А для того, чтобы быстро пересесть на ClickHouse и не сойти с ума от подводных камней - добро пожаловать на БЕСПЛАТНЫЙ курс от автора статьи - ClickHouse: быстрый старт. В нем разобрана вся необходимая база, без знаний которой внедрение ClickHouse окажется мучительным испытанием.