Search results for «[unnest]» / Habr

Publications Hubs Companies Users Comments

Kilor Dec 12 2019 at 14:00

PostgreSQL Antipatterns: сизифов JOIN массивов

2 min

9.9K

Тензор corporate blogPostgreSQL*SQL*Database Administration*

Иногда возникает задача «склеить» внутри SQL-запроса из переданных в качестве параметров линейных массивов целостную выборку с теми же данными «по столбцам».

Читать дальше →

+14

Kilor Dec 19 2019 at 15:33

PostgreSQL Antipatterns: передача наборов и выборок в SQL

5 min

15K

Тензор corporate blogPostgreSQL*SQL*Database Administration*

Периодически у разработчика возникает необходимость передать в запрос набор параметров или даже целую выборку «на вход». Иногда попадаются очень странные решения этой задачи.

Пойдем «от обратного» и посмотрим, как делать не стоит, почему, и как можно сделать лучше.

Читать дальше →

selesnow Jan 21 2021 at 10:23

Как использовать функцию UNNEST в Google BigQuery для анализа параметров событий Google Analytics

6 min

13K

SQL*Data Mining*Big Data*Data storages*Data Engineering*

Tutorial

Translation

Сегодня я расскажу о том, как использовать функцию `UNNEST` в Google BigQuery для анализа параметров событий и свойств пользователей, которые вы получаете вместе с данными Google Analytics.

selesnow Apr 27 2021 at 09:54

Как использовать конструкцию SELECT FROM UNNEST для анализа параметров в повторяющихся записях Google BigQuery

7 min

4.9K

SQL*Data Mining*API*Big Data*Data Engineering*

Tutorial

Translation

В предыдущей статье мы с вами разобрались с тем, как использовать функцию UNNEST для работы с повторяющимися записями в Google BigQuery.

В этой статье мы идём дальше, и поговорим про конструкцию SELECT FROM UNNEST.

Используя конструкцию SELECT FROM UNNEST, вы говорите: «Я хочу применить функцию UNNESTк повторяющейся записи в ее собственной маленькой временной таблице. Далее выбрать одну строку из неё и поместить ее в наши результаты, так же как если бы это было любое другое значение ».

Kilor Nov 18 2020 at 10:10

PostgreSQL Antipatterns: DBA-детектив, или Три дела о потерянной производительности

30 min

5.2K

Тензор corporate blogPostgreSQL*SQL*Database Administration*Reverse engineering*

Сегодня вместо решения абстрактных алгоритмических задач мы выступим в роли детектива, по крупицам доставшейся информации исследующего неэффективные запросы, и рассмотрим три реальных дела, встречавшихся в разное время на просторах нашего приложения СБИС, когда простота и наивность при написании SQL превращалась в дополнительную нагрузку для PostgreSQL-сервера.

Дедукция и индукция помогут нам вычислить, что же все-таки хотел получить от СУБД разработчик, и почему это получилось не слишком оптимально. Итак, сегодня нас ждут:

Дело о непростом пути вверх
Разберем в live-видео на реальном примере некоторые из способов улучшения производительности иерархического запроса.
Дело о худеющем запросе
Увидим, как можно запрос упростить и ускорить в несколько раз, пошагово применяя стандартные методики.
Дело о развесистой клюкве
Восстановим структуру БД на основании единственного запроса с 11 JOIN и предложим альтернативный вариант решения на ней той же задачи.

Расследовать

+17

Kilor Jun 19 2020 at 11:30

SQL HowTo: 1000 и один способ агрегации

5 min

14K

Тензор corporate blogHigh performance*PostgreSQL*Programming*SQL*

Наш СБИС, как и другие системы управления бизнесом, не обходится без формирования отчетов — каждый руководитель любит сводные цифры, особенно всякие суммы по разделам и красивые "Итого".

А чтобы эти итоги собрать, необходимо по исходным данным вычислить значение некоторой агрегатной функции: количество, сумма, среднее, минимум, максимум,… — и, как правило, не одной.

Сегодня мы рассмотрим некоторые способы, с помощью которых можно вычислить агрегаты в PostgreSQL или ускорить выполнение SQL-запроса.

Читать дальше →

+12

Kilor Jan 31 2020 at 12:56

SQL HowTo: пишем while-цикл прямо в запросе, или «Элементарная трехходовка»

5 min

34K

Тензор corporate blogPostgreSQL*SQL*Algorithms*Database Administration*

Периодически возникает задача поиска связанных данных по набору ключей, пока не наберем нужное суммарное количество записей.

Наиболее «жизненный» пример — вывести 20 самых старых задач, числящихся на списке сотрудников (например, в рамках одного подразделения). Для различных управленческих «дашбордов» с краткими выжимками по участкам работы похожая тема требуется достаточно часто.

В статье рассмотрим реализацию на PostgreSQL «наивного» варианта решения такой задачи, «поумнее» и совсем сложный алгоритм «цикла» на SQL с условием выхода от найденных данных, который может быть полезен как для общего развития, так и для применения в других похожих случаях.

Читать дальше →

selesnow Mar 31 2020 at 09:46

Разворачиваем вложенные столбцы — списки с помощью языка R (пакет tidyr и функции семейства unnest)

24 min

2.4K

Data Mining*Big Data*R*Data Engineering*

Tutorial

Translation

В большинстве случаев при работе с ответом полученным от API, или с любыми другими данными которые имеют сложную древовидную структуру, вы сталкиваетесь с форматами JSON и XML.

Эти форматы имеют множество преимуществ: они достаточно компактно хранят данные и позволяют избежать излишнего дублирования информации.

Минусом данных форматов является сложность их обработки и анализа. Неструктурированные данные невозможно использовать в вычислениях и нельзя строить на их основе визуализацию.

Данная статья является логическим продолжением публикации "R пакет tidyr и его новые функции pivot_longer и pivot_wider". Она поможет вам привести неструктурированные конструкции данных к привычному, и пригодному для анализа табличному виду с помощью пакета tidyr, входящего в ядро библиотеки tidyverse, и его функций семейства unnest_*().

Читать дальше →

+13

Kilor Sep 2 2021 at 11:20

КЛАДРируем адреса произвольной формы (ч.2 — подстрочный поиск)

12 min

3.1K

Тензор corporate blogHigh performance*PostgreSQL*SQL*ERP-systems*

Tutorial

В первой части серии статей про работу с адресами по КЛАДР мы научились импортировать данные этого справочника к себе в базу и превращать их во что-то более удобное для дальнейшей работы.

Сегодня же займемся реализацией конкретных прикладных алгоритмов на этой структуре и рассмотрим, как можно реализовать мгновенную помощь пользователю при вводе адреса, используя возможности префиксного поиска в PostgreSQL.

Kilor May 11 2023 at 17:40

SQL HowTo: замена в строке по набору

Easy

2 min

4.2K

Тензор corporate blogAbnormal programming*PostgreSQL*Programming*SQL*

Tutorial

Решим сегодня простую, казалось бы, задачу: как на PostgreSQL можно в строке провести замены по набору пар строк. То есть в исходной строке 'abcdaaabbbcccdcba' заменить, например, 'а' -> 'x', 'bb' -> 'y', 'ccc' -> 'z' и получить 'xbcdxxxybzdcbx'.

Фактически, мы попробуем создать аналог str_replace или strtr.