Любите ли вы SQL так же, как и я? Недавно, собирая огромный SQL-запрос, я понял, что надо что-то менять.

Логическим блоком в SQL является подзапрос или CTE и вроде бы можно разбивать запрос по блокам и работать с ними отдельно, как строится по кирпичикам любое приложение.

Однако когда весь текст запроса идет сплошняком на несколько десятков экранов, сложно и разрабатывать, и  через длительное время понимать алгоритм запроса. 

А что, если не надо писать SQL?

В SAP мы не писали запросы, мы создавали Calculation View, и работать с ними было на порядок быстрее и приятнее. 

Перефразируя диалог из Матрицы: 

— Когда я стану избранным, я смогу писать длинный SQL?
— Тебе не надо будет писать SQL.

После добавления в asapBI возможности создания моделей Data Vault (вот статья на эту тему), я переключился на реализацию Calculation View. За основу я взял логику, реализованную в SAP Hana Calculation View (анализировал также и другие построители) с добавлением новых возможностей:

  • визуальное построение выборки данных

  • использование параметров CV при выборе данных

  • использование различных баз данных (ADB, Greenplum, PostgreSQL, Clickhouse)

  • на выходе как вся CV, так и ее промежуточные блоки представляют собой функции (UDF) базы данных — их можно вызвать из других инструментов

  • возможность выполнения CV как внутри базы, так и на внешних кластерах (например, Trino или CedrusData). Это значит, что трансформация данных и закрытие периода будет идти не 4 часа, нагружая продуктовую базу данных, а 10 минут на внешнем кластере. Или не потребуется материализация данных для отчетов — за ней ведь еще и следить надо.

  • для олд скул тру программистов — полная прозрачность, возможность проверить, какой SQL нагенерил инструмент и, при необходимости, добавить ручной SQL код.

  • возможность отказаться от asapBI IDE и вести дальнейшую разработку общепринятыми инструментами без потери наработанного — т. е. без вендор-лока.

  • использование AI. 

Создать CV, как и объекты модели данных, можно в любой папке, пример созданного CV:

Кто-то скажет, что запросы можно вручную написать — это так, но ТТМ будет уже не таким.

Да и много ли таких запросов, которые нужно оптимизировать вручную? Тем более что часть оптимизации возьмет на себя движок базы данных, а с каждым годом железо становится все быстрее и быстрее.

Роль языка SQL, на мой взгляд, в дальнейшем должна свестись к роли Ассемблера — все знают, что он есть, что он быстрый, но давно ли вы использовали его в разработке? Полагаю, что SQL станет нишевым языком для того, чтобы вручную написать очень оптимизированный запрос.

Вишенка на тортик

Коллеги, а зачем нам инструмент, который не сам будет работать? Весь этот выбор и создание таблиц, протягивание соединений, join по полям — разве в конце концов нам это нужно?

Нам надо, чтобы инструмент работал сам, строил запросы, модели данных, а мы проверяли решение и допиливали по мелочи неучтенные вопросы.

В этом, конечно же, нам поможет встроенный в asapBI локальный или облачный AI. А вот как именно поможет — это уже тема отдельной публикации.

Буду рад обратной связи.

Например, чего именно не хватает в подобных построителях?

Да и вообще имеют ли такие системы смысл? Ведь писать длинные тексты на чистом SQL так увлекательно и приятно ;)