SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

Andrey_Biryukov 19 дек 2022 в 15:40

Изучаем PostgreSQL. Часть 1. Знакомимся с архитектурой

8 мин

144K

Блог компании OTUSPostgreSQL*SQL*

Туториал

На сегодняшний день существует большое количество различных систем управления базами данных - СУБД, от коммерческих до открытых, от реляционных до новомодных NoSQL и аналогичных.

Одним из лидеров направления СУБД является PostgreSQL и ее различные ответвления, о некоторых из которых мы рассмотрим подробнее.

В этой статье мы начнем говорить о СУБД PostgreSQL, рассмотрим отличия редакций и некоторые особенности архитектуры, а также процесс установки. Но начнем мы с небольшого ликбеза для того, чтобы читатели плохо знакомые с терминологией баз данных могли быстро войти в курс дела.

Итак, схемой мы будем называть логическое объединение таблиц в базе данных, а сама БД это физическое объединение таблиц. Индекс - отношение, которое содержит данные, полученные из таблицы или материализованного представления. Его внутренняя структура поддерживает быстрое извлечение и доступ к исходным данным.

Еще один важный термин, это первичный ключ - частный случай ограничения уникальности, определенной для таблицы или другого отношения, которое также гарантирует, что все атрибуты в первичном ключе не имеют нулевых значений. Как следует из названия, для каждой таблицы может быть только один первичный ключ, хотя возможно иметь несколько уникальных ограничений, которые также не имеют атрибутов, поддерживающих значение null.

Ну и наконец, наверное, самый распространенный термин - транзакция это комбинация команд, которые должны действовать как единая атомарная команда. То есть, все они завершаются успешно или завершаются неудачно как единое целое, и их эффекты не видны другим сеансам до завершения транзакции, и, возможно, даже позже, в зависимости от уровня изоляции. Соответственно, если выполнение хотя бы одной команды внутри транзакции завершилось ошибкой - вся транзакция завершится ошибкой.

tmrkust 5 дек 2022 в 11:53

Детальное рассмотрение поведения при использовании INCLUDE

14 мин

10K

Базы данных*SQL*PostgreSQL*

Из песочницы

Перевод

Некоторые базы данных такие, как Microsoft SQL Server, IBM Db2, а также PostgreSQL начиная с 11 версии – предлагают прибегнуть к оператору include для генерации индекса. Представление данного функционала в PostgreSQL (исходная статья вышла 30.04.2019) послужило поводом для этого объёмного рассуждения о работе с оператором include.

Содержание:

1) Напоминание: btree-индексы

2) Напоминание: Index-only сканирование

3) Оператор include

4) Фильтрация по полям в include

5) Уникальные индексы при использовании include

6) Сравнение

7) PostgreSQL: Никакой фильтрации до проверки области видимости

pluzanov 3 ноя 2022 в 09:04

PostgreSQL 16: Часть 2 или Коммитфест 2022-09

14 мин

Блог компании Postgres ProfessionalPostgreSQL*SQL*

PostgreSQL 15 уже вышел официально. И в сети появилось множество информации о новинках версии.

А мы продолжаем знакомить с новинками будущей 16-й версии. В начале октября завершился второй коммитфест и есть что обсудить.

Самое интересное из первого, июльского, коммитфеста можно прочитать в предыдущей статье серии: 2022-07.

Читать дальше →

NewTechAudit 24 окт 2022 в 05:58

Визуализация данных с помощью Metabase

4 мин

52K

SQL*Визуализация данных*Хранение данных*Data Engineering*

Привет, Хабр!

Сегодня я рассмотрю основные возможности BI-инструмента с открытым исходным кодом Metabase.

olga_rogova 16 окт 2022 в 22:07

BigQuery. Что делать, если повредил или случайно удалил таблицы

3 мин

7.9K

Data Engineering*Google Cloud Platform*SQL*

Как быть, если случайно удалил или повредил таблицу в BigQuery? Первое о чем нужно помнить: BigQuery хранит состояние вашей существующей таблицы на любой момент времени в течение прошедших 7 дней + у вас есть 2 суток, чтобы восстановить случайно удаленную таблицу. Рассмотрим, как это все провернуть.

Husia 26 авг 2022 в 11:41

Materialized Path – создаём своё первое дерево

18 мин

9.1K

Блог компании BimeisterSQL*C#*Алгоритмы*.NET*

Туториал

Всем привет! Меня зовут Хусрав, я бэкенд разработчик в компании Bimeister.

В этой статье я бы хотел бы поговорить о способе поиска родительских и дочерних элементов структуры посредством PostgreSQL Materialized Path.

Статья является вводной и рассчитана на людей, незнакомых с темой.

Polina_Averina 30 мая 2022 в 08:52

Построение DWH на основе Greenplum

11 мин

20K

Блог компании СлёрмБазы данных*IT-инфраструктура*SQL*PostgreSQL*

DBA в Southbridge Иван Чувашов подготовил статью о построении DWH на основе Greenplum. Слово Ивану.

Привет, Хабр! Я администратор баз данных с 15-летним опытом. Сегодня хочу рассказать про Data Warehouse на основе Greenplum — как они устроены, как их поднимать и с какими проблемами и нюансами я лично сталкивался в своей практике.

Читать про Greenplum

KargaltsevMikhail 27 мар 2022 в 16:19

TRY / CATCH в PostgreSQL

2 мин

31K

PostgreSQL*SQL*

Туториал

Во встроенном процедурном языке PL/pgSQL для СУБД PostgreSQL отсутствуют привычные операторы TRY / CATCH для для перехвата исключений возникающих в коде во время выполнения. Аналогом является оператор EXCEPTION.

SkyZion 5 фев 2022 в 12:36

TINKOFF-INVEST. Разработка торгового робота на JAVA. Часть 2

32 мин

13K

Программирование*Java*SQL*Проектирование API*Финансы в IT

Туториал

Как же быстро летит время... Прошло почти 2 месяца с момента публикации моей первой статьи о работе с TINKOFF INVEST API – Разработка торгового робота на JAVA. Часть 1, в которой мы начали свое знакомство с инструментарием автоматизации торговли, предоставляемым брокером ТИНЬКОФФ.

В этой части разработаем механизмы для загрузки и хранения биржевых исторических данных, а также рассмотрим некоторые ограничения, с которыми неминуемо столкнется каждый пользователь API и методами их преодоления.

Если нет желания вникать в код и читать статью, то можете сразу мотать к разделу "Демонстрация работы приложения".

Sber 23 дек 2021 в 08:13

Миграция расчёта управленческой отчётности с Teradata на GreenPlum

12 мин

6.1K

Блог компании СберSQL*Базы данных*Big Data*Финансы в IT

Всем привет! Меня зовут Николай Когель, я главный инженер по разработке Управления технологий MIS Департамента ИТ-блока «Финансы» в Сбере.

Сейчас в Сбере существует несколько крупных систем, в которых происходит построение управленческой отчётности и расчёт финансового результата. Как правило, это предполагает обработку огромных массивов исторических данных нетривиальной структуры из различных систем, загружаемых в аналитическое хранилище данных. По этой причине хранилище данных строится на основе MPP-систем, а с недавнего времени в Сбере наряду с Teradata появилась альтернатива в виде GreenPlum.

Kilor 25 ноя 2021 в 05:30

PostgreSQL в «Тензоре» — публикации за год (#2)

4 мин

3.1K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Высоконагруженные системы*

Добро пожаловать под кат, если вдруг вы пропустили какие-то из наших статей за прошедший год об интересных и полезных возможностях PostgreSQL, которые мы узнаем при разработке нашей системы полного цикла управления бизнесом СБИС — от кадрового учета, бухгалтерии, делопроизводства и налоговой отчетности, до таск-менеджмента, корпоративного портала и видеокоммуникаций.

Если не видели дайджест за первый год — время наверстать упущенное!

Kilor 8 сен 2021 в 14:00

SQL HowTo: три WHERE в одном запросе

3 мин

10K

Блог компании ТензорНенормальное программирование*PostgreSQL*SQL*Базы данных*

При реализации некоторых прикладных задач в рамках экосистемы СБИС случается сталкиваться с неочевидными возможностями PostgreSQL, которые позволяют вместо сложной логики создать решение "в один ход".

Сегодня на примере вполне реальной задачи рассмотрим такие возможности оператора INSERT ... ON CONFLICT.

little-brother 13 мая 2021 в 08:20

Как написать расширение для SQLite в примерах

6 мин

4.1K

SQL*SQLite*

Туториал

Если при работе с SQLite вам встречалась ситуация, когда не нашлось нужного функционала, то добро пожаловать под кат. И нет, хранимые процедуры добавить нельзя.

NataliaZheltova 18 дек 2020 в 14:53

Наши грабли — залог вашего успеха. Кейсы DevOps и SQL-команд

2 мин

3.1K

Блог компании ЮMoneySQL*DevOps*Data Engineering*Apache*

Пятница — самое время занимательных историй. Сегодня предлагаем вам послушать доклады DevOps и SQL-направления с конференции ЮMoneyDay. Специалисты расскажут про:

устройство кластера логов, который позволяет нам понимать, что происходит с платежами и транзакциями (а также в целом с компонентами и сервисами);
работу дата-инженеров в машинном обучении;
внедрение и трансформацию CI/CD.

Делимся ценным опытом, чтобы вы не совершали наших ошибок. Надеемся, будет полезно!

Читать дальше →

Kilor 17 дек 2020 в 20:50

SQL HowTo: префиксный FTS-поиск с релевантностью по дате

4 мин

3.9K

Блог компании ТензорERP-системы*PostgreSQL*SQL*Алгоритмы*

В нашем СБИС, как и в любой другой системе работы с документами, по мере накопления данных у пользователей возникает желание их "поискать".

Но, поскольку люди — не компьютеры, то и ищут они примерно как "что-то там такое было от Иванова или от Ивановского… нет, не то, раньше, еще раньше… вот оно!"

То есть технически верное решение — это префиксный полнотекстовый поиск с ранжированием результатов по дате.

Но разработчику это грозит жуткими проблемами — ведь для FTS-поиска в PostgreSQL используются «пространственные» типы индексов GIN и GiST, которые не предусматривают «подсовывания» дополнительных данных, кроме текстового вектора.

Остается только грустно вычитывать все записи по совпадению префикса (тысячи их!) и сортировать или, наоборот, идти по индексу даты и фильтровать все встречающиеся записи на совпадение префикса, пока не найдем подходящие (как скоро найдется «абракадабра»?..).

И то, и другое не особо приятно для производительности запроса. Или что-то все же можно придумать для быстрого поиска?

Читать дальше →

neoflex 16 дек 2020 в 09:53

Управление кодом Spark-приложений

6 мин

3.3K

Блог компании NeoflexSQL*Big Data*Apache*

Есть множество подходов к созданию кода приложений, направленных на то, чтобы сложность проекта не росла со временем. Например, объектно-ориентированный подход и множество прилагаемых паттернов, позволяют если не удерживать сложность проекта на одном уровне, то хотя бы держать ее под контролем в ходе разработки, и делать код доступным для нового программиста в команде.

Как можно управлять сложностью проекта по разработке ETL-трансформаций на Spark?

Тут все не так просто.

Как это выглядит в жизни? Заказчик предлагает создать приложение, собирающее витрину. Вроде бы надо выполнить через Spark SQL код и сохранить результат. В ходе разработки выясняется, что для сборки этой витрины требуется 20 источников данных, из которых 15 похожи, остальные нет. Эти источники надо объединить. Далее выясняется, что для половины из них надо писать собственные процедуры сборки, очистки, нормализации.

И простая витрина после детального описания начинает выглядеть примерно так:

В результате простой проект, который должен был всего лишь запустить на Spark скрипт SQL собирающий витрину, обрастает собственным конфигуратором, блоком чтения большого числа настроечных файлов, собственным ответвлением маппинга, трансляторами каких-нибудь специальных правил и т.д.

Читать дальше →

MaxRokatansky 28 авг 2020 в 14:49

Как SQL Server использует bitmap-фильтры

8 мин

5.5K

Блог компании OTUSMicrosoft SQL Server*SQL*

Перевод

Перевод статьи подготовлен в преддверии старта курса «MS SQL Server Developer».

Может ли запрос, выполняющийся параллельно, использовать меньше CPU и выполняться быстрее, чем такой же запрос, выполняющийся последовательно?

Да! Для демонстрации я буду использовать две таблицы с одной колонкой типа integer.

Примечание — TSQL скрипт в виде текста находится в конце статьи.

Читать дальше →

Kilor 28 июл 2020 в 05:50

SQL HowTo: красивые отчеты по «дырявым» данным — GROUPING SETS

8 мин

3.4K

Блог компании ТензорСистемное администрирование*Базы данных*SQL*PostgreSQL*

Для пользователя наш СБИС представляется единой системой управления бизнесом, но внутри состоит из множества взаимодействующих сервисов. И чем их становится больше — тем выше вероятность возникновения каких-то неприятностей, которые необходимо вовремя отлавливать, исследовать и пресекать.

Поэтому, когда на каком-то из тысяч подконтрольных серверов случается аномальное потребление ресурсов (CPU, памяти, диска, сети, ...), возникает потребность разобраться «кто виноват, и что делать».

Для оперативного мониторинга использования ресурсов Linux-сервера «в моменте» существует утилита pidstat. То есть если пики нагрузки периодичны — их можно «высидеть» прямо в консоли. Но мы-то хотим эти данные анализировать постфактум, пытаясь найти процесс, создавший максимальную нагрузку на ресурсы.

То есть хочется иметь возможность смотреть по ранее собранным данным разные красивые отчеты с группировкой и детализацией на интервале типа таких:

В этой статье рассмотрим, как все это можно экономично расположить в БД, и как максимально эффективно собрать по этим данным отчет с помощью оконных функций и GROUPING SETS.

Читать дальше →

chemtech 22 июл 2020 в 07:23

Тестирование производительности аналитических запросов в PostgreSQL, ClickHouse и clickhousedb_fdw (PostgreSQL)

6 мин

9.2K

Высоконагруженные системы*Системное администрирование*SQL*Big Data*Хранение данных*

Перевод

В этом исследовании я хотел посмотреть, какие улучшения производительности можно получить, используя источник данных ClickHouse, а не PostgreSQL. Я знаю, какие преимущества производительности при использовании ClickHouse я получаю. Будут ли эти преимущества сохранены, если я получу доступ к ClickHouse из PostgreSQL с помощью внешней оболочки данных (FDW)?

Читать дальше →

Tzimie 27 фев 2020 в 17:54

Рядовой SNAFU идет в DBA

2 мин

5.1K

ИнтервьюSQL*Microsoft SQL Server*

Для тех, кто не знает, SNAFU — персонаж военных патриотических мультфильмов, созданных американцами во время войны. Этот раздолбай, ввиду природного идиотизма, все время попадает в катастрофические ситуации и, как правило, гибнет в конце серии. Правда, в следующей серии он снова оказывается живым — в этом смысле, его можно считать далеким прародителем Кенни из Южного Парка.

При наборе людей на позицию SQL server developer, я часто был покорен тем, как они отвечали на вопросы. Я готов был сказать им ДА, если бы меня не спасала небольшая задача в одну строчку, которую предложил мой коллега. Удивительно, сколько всего может дать эта задача в одну строку SQL. И вот уже кандидат уже с упоением ходит по граблям. А грабель, как вы увидите, там много. Конечно, ни один человек не собрал ВСЕ возможные грабли. Но, чтобы их все показать, мне и понадобился SNAFU.

Читать дальше →

1 2 ...

59 60

62 63 ...

90 91

SQL *

Изучаем PostgreSQL. Часть 1. Знакомимся с архитектурой

Детальное рассмотрение поведения при использовании INCLUDE

PostgreSQL 16: Часть 2 или Коммитфест 2022-09

Визуализация данных с помощью Metabase

BigQuery. Что делать, если повредил или случайно удалил таблицы

Materialized Path – создаём своё первое дерево

Построение DWH на основе Greenplum

TRY / CATCH в PostgreSQL

TINKOFF-INVEST. Разработка торгового робота на JAVA. Часть 2

Миграция расчёта управленческой отчётности с Teradata на GreenPlum

PostgreSQL в «Тензоре» — публикации за год (#2)

SQL HowTo: три WHERE в одном запросе

Как написать расширение для SQLite в примерах

Ближайшие события

Наши грабли — залог вашего успеха. Кейсы DevOps и SQL-команд

SQL HowTo: префиксный FTS-поиск с релевантностью по дате

Управление кодом Spark-приложений

Как SQL Server использует bitmap-фильтры

SQL HowTo: красивые отчеты по «дырявым» данным — GROUPING SETS

Тестирование производительности аналитических запросов в PostgreSQL, ClickHouse и clickhousedb_fdw (PostgreSQL)

Рядовой SNAFU идет в DBA

Вклад авторов