SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

koanse 13 янв в 05:46

Выполнение DAX запроса AI DAX движка в СУБД на примере PostgreSQL

3 мин

1.4K

Big Data*Визуализация данных*Искусственный интеллектSQL*

Кейс

Привет, Хабр! DAX является мощным аналитическим языком запросов и активно используется во множестве проектов. Кроме того, на текущем уровне развития AI он способен условно в режиме реального времени преобразовать DAX запросы в запросы одной из СУБД, например, PostgreSQL, но, конечно, с рядом ограничений на сложность DAX запроса, схему данных и т.д. В связи с этим может быть актуальным вопрос, реально ли использовать «AI DAX движок» в сочетании с выполнением SQL запросов, сгенерированных этим движком, в одной из СУБД, т.е. выполнить DAX без Power BI на PostgreSQL источнике? Интересующимся возможностями DAX AI на примере PostgreSQL — добро пожаловать под кат :)

aptypuoh 29 ноя 2024 в 12:17

Введение в PL/SQL

Простой

10 мин

12K

Oracle*SQL*

Туториал

Для меня PL/SQL есть логичное продолжение изучения SQL, но по нему много и статей, и курсов, причем даже на русском языке. С другой стороны, PL/SQL раскрывается достаточно редко, особенно среди бесплатных ресурсов, так что… Начинаем :)

Продолжение следует

EvgeniyGar 25 ноя 2024 в 05:16

Транзакции в базах данных на примере PostgreSQL

Простой

12 мин

21K

SQL*PostgreSQL*Базы данных*

Из песочницы

Транзакция — это набор операций с базой данных. В этот набор может входить как одна операция, так и несколько. Операции внутри транзакции либо выполняются все и полностью, либо ни одна операция не выполняется. Это свойство еще называют атомарностью. Транзакция переводит базу данных из одного согласованного состояния в другое. Согласованность означает что данные в базе данных подчиняются определенным правилам, которые были заложены при ее создании. К примеру, у нас есть две таблицы — Покупатели (Customer) и Покупки (Purchase).

Kmamish вчера в 09:14

Как заставить вашу базу данных летать, а не ползать. Часть 3 – ещё три способа шардирования

Средний

9 мин

3.6K

Блог компании SENSEБазы данных*PostgreSQL*MySQL*SQL*

Туториал

Всем привет! И снова с вами Илья Криволапов – системный аналитик в SENSE, где мы вместе с командой трудимся над проектом одного из цветных банков РФ. Напоминаю, что в профессии я уже больше пяти лет и, несмотря на фамилию, прод все еще живой и здоровый (ну почти)!

В свободное от работы время, я преподаю курс «Хранение и обработка больших объемов данных», где успел накопить немало наблюдений, кейсов и выводов, которые не хочется держать в столе. Поэтому всё самое полезное оформил в цикл статей на Хабре – рассказываю как строить базы данных с прицелом на рост и не сойти с ума под нагрузкой.

В первой части мы говорили о базовых стратегиях масштабирования: вертикальной и горизонтальной. Покрутили в руках репликацию, рассмотрели кейсы, когда и как можно к ней обращаться. Во второй углубились в шардинг и разобрали три популярных подхода: по диапазону, хэшу и геозонам. А сегодня будет финальная, третья часть. В ней мы рассмотрим ещё три способа шардирования: директивный, круговой и динамический. Расскажу, как они устроены, когда применяются, в чём их сильные стороны и где скрывается подвох.

Материал будет полезен всем, кто проектирует, масштабирует или просто поддерживает «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам.

Финальный рывок – поехали!

LiN1uM 4 июл в 18:59

Пятый и последний шаг к повышению производительности Firebird

Простой

6 мин

957

SQL*Firebird/Interbase*

Туториал

Перевод

Ваша база данных Firebird организована таким образом, что она разделена на отдельные части, каждая из которых имеет одинаковый размер. Эти части называются страницами. Размер каждой страницы напрямую влияет на производительность базы данных и её взаимодействие с операционной системой и оборудованием компьютера. Размер страницы может варьироваться в зависимости от конкретной версии Firebird, которую вы используете.

pihel 1 июл в 10:30

Что нового в Apache Spark 4.0

Средний

11 мин

2.6K

Блог компании КОРУС КонсалтингData Engineering*Big Data*Apache*SQL*

Обзор

Apache Spark — это мощный фреймворк для распределённой обработки больших объёмов данных, позволяющий выполнять сложные вычисления на кластерах компьютеров с высокой производительностью и гибкостью.

И вот 23 мая 2025 года компания Apache выпустила новую версию Spark 4.

Стоит отметить, что Apache Spark — масштабный фреймворк с широким функционалом. В данной статье я сосредоточусь на нововведениях, которые в первую очередь затронут пользователей Spark SQL и PySpark.

Alena_Les 15 июн в 08:11

Ошибки, которые можно избежать в SQL: грабли начинающего аналитика

Простой

5 мин

5.7K

PostgreSQL*SQL*

Из песочницы

Recovery Mode

Привет Хабр! Меня зовут Алёна, я middle-продуктовый аналитик. В свободное время я рассказываю о реальных задачах с работы и делюсь материалами для тех, кто хочет стать аналитиком.

Если ты только начинаешь писать SQL-запросы — вот твой анти-фейл лист: с примерами, пояснениями и короткими лайфхаками, как не получить ошибку из-за лишнего JOIN или пропущенного WHERE.

Daria_Chetyrkina 7 мая в 09:53

Индексы в базах данных: сколько индексов — перебор?

Простой

5 мин

5.7K

SQL*Microsoft SQL Server*

Мнение

Recovery Mode

Перевод

Вопрос оптимального количества индексов часто становится предметом горячих дискуссий среди разработчиков и администраторов баз данных. Одни утверждают, что больше индексов означает лучшую производительность, другие предупреждают о рисках избыточности и снижении эффективности операций записи. Но как определить золотую середину?

Далее предлагаем вашему вниманию перевод оригинальной статьи “How Many Indexes Is Too Many?”, который подготовила специалист «Автомакона». В статье детально рассматривается данная проблема и приводятся практические рекомендации по выбору подходящего количества индексов для повышения производительности.

Для начала давайте рассмотрим простой эксперимент. Возьмем популярную базу данных Stack Overflow любого размера, уберем все индексы из таблицы Users и запустим удаление одной строки командой DELETE.

Friflex_dev 25 апр в 12:07

Offline First в мобильных приложениях. CRUD на стороне клиента

Средний

9 мин

1.1K

Блог компании FriflexРазработка мобильных приложений*SQL*NoSQL*

Обзор

Привет, Хабр! Это Ахмед Шериев, сооснователь стартапа VoxOps, а сегодня — еще и гостевой автор блога Friflex. Это вторая статья про мой опыт разработки офлайн-приложений — первая была про кэширование.

Если пользователи в офлайне должны менять данные, а потом синхронизировать изменения с сервером, есть два основных подхода. Первый — синхронизировать сами данные. Второй — синхронизировать команды или события.

Tzimie 15 апр в 18:00

MSSQL: рисуем метрики из Query Store на листинге процедуры

Средний

2 мин

928

Microsoft SQL Server*SQL*

Туториал

В моей предыдущей статье я отображал метрики из записанного SQL profiler trace на листинг stored процедуры. Это идеально подходит к тестовым окружениям, но в production надо быть осторожным, и запись "частых" событий могут увеличивать CPU сервера и замедлять его работу.

@speshuric предложил использовать данные из Query Store. Там, правда, нет номеров строк. Но можно выкрутиться, так как есть смещения и можно посчитать количество переводов строки до смещения. Итак, сказано - сделано!

Tzimie 4 апр в 14:12

Раскраска листинга процедуры T-SQL значениями метрик

Средний

3 мин

1.1K

SQL*Microsoft SQL Server*

Туториал

Сразу покажу, о чем идет речь, чтобы вы решили, нужно вам это или нет. На текст процедуры мы отображаем данные о числе выполнений, cpu, duration, о числе чтений и записей и числе обработанных записей.

badcasedaily1 28 мар в 16:12

Промежуточные витрины в SQL

8 мин

Блог компании OTUSSQL*Big Data*

Обзор

Привет, Хабр!

Сегодня я хочу поговорить о том, без чего не обходится практически ни один серьёзный проект с большими данными (да и с не слишком большими тоже) — о промежуточных витринах (или более привычно – staging, core, data mart).

Dzbell 17 мар в 06:00

Оптимизация скриптов для витрин данных: от суток к часам

6 мин

1.7K

Блог компании ГазпромбанкSQL*Data Engineering*

В 2022 году я присоединился к команде Газпромбанка в должности дата-инженера. В мои обязанности входила поддержка витрин данных для машинного обучения. Главной проблемой, с которой мне пришлось столкнуться, оказалось непомерно долгое время обработки данных при использовании устаревших скриптов. Например, расчет среза одной из витрин занимал более суток! Причина крылась в неоптимизированных скриптах, которые изначально разрабатывались для гораздо меньших объемов данных. Со временем объем обрабатываемой информации значительно увеличился, что закономерно привело к драматическому ухудшению производительности. В этой статье поделюсь своим опытом решения проблемы и расскажу о подходах, которые помогли сократить время выполнения с суток до нескольких часов.

mrprogre 12 фев в 11:51

Где я учился, чтобы перейти в it сферу и преуспеть

Простой

4 мин

Java*SQL*Oracle*

Туториал

Данная статья является продолжением этой статьи: Инструкция: как перейти в сферу it, но с перечнем курсов, которые я закончил (это тоже часто спрашивают). Можете считать это рекламой пройденных мною курсов, а можете и не считать.

lfwsmrp 24 янв в 23:43

Кредит, график платежей, аннуитет, досрочное погашение. Тех реализация. Велосипед, который будет переизобретаться вечно

Простой

41 мин

4.7K

Финансы в ITPython*SQL*

Если столкнулись с кредитом и задавали вопросы как считается график платежей по нему (не в общем и целом, а почему конкретно тут такая циферка, а не другая), то, надеюсь, большую их часть сможете закрыть, после ознакомления.

Плюс в статье делюсь своей технической реализацией в ознакомительных целях.

Нырнуть в дебри

sejkeee 24 янв в 16:18

Простое решение для автоматизации контроля за состоянием базы данных с использованием EF Core

Простой

6 мин

2.4K

Блог компании КРОК.NET*C#*SQL*

Туториал

Привет, Хабр! Меня зовут Кирилл Салихов, и я занимаюсь разработкой бизнес-приложений на платформе .NET в компании КРОК. При оптимизации процессов развертывания приложений возник вопрос о том, как эффективно хранить SQL-код, предназначенный для применения к базе данных, чтобы избежать необходимости в ручном труде и перемещении файлов.

В короткой статье дам пошаговую инструкцию автоматического применения миграций к базе данных и управлению представлениями и процедурами, без всяких сиай/сиди…

So what if I swagger?

RodionGork 10 янв в 05:21

Божественная K-V таблица для мелочей

Простой

5 мин

6.6K

Базы данных*SQL*Проектирование и рефакторинг*

Мнение

Во времена пика интереса к NoSQL базам данных простоватые K-V хранилища были несколько обойдены вниманием - отчасти это понятно, вещь не очень "инновационная", можно даже сказать старинная. В то же время своя "ниша" у них находится до сих пор (не считая того что они используются в более сложных БД в качестве индексов).

В то же время в обычной SQL-ной базе проекта порой "не хватает" такого общего K-V хранилища для разнородных (семантически) записей. В своих проектах я такую обычно завожу. Среди коллег этот подход порой вызывает негатив :)

Поясню ситуацию на примерах и попробую выписать "за и против" - а уважаемых знатоков приглашаю поделиться мнениями - особенно если у кого-то в схеме похожие таблички встречаются. Не для поиска несуществующей "истины", а ради дележа опытом и идеями.

Вперед, к примерам

SbWereWolf 2 янв в 01:24

Как добавить или расширить диск в Linux

Простой

7 мин

12K

*nix*SQL*

Туториал

Recovery Mode

На виртуалке кончилось место ? Не беда, у нас виртуалка - увеличим диск. Не хотим размещать файлы на основном диске ? Не беда у нас виртуалка - добавим новый диск.

Всё бы ни чего, но виртуалка сама железо не настроит, в том смысле что конечно виртуальная машина предоставляет доступ к железу, но ресурсы этого железа программам предоставляет не виртуалка, ресурсы предоставляет операционная система. И пока вы не настроите операционную систему, ваши программы не получат ресурсы этого железа (в нашем случае свободное место на диске для размещения файлов)

Эта инструкция будет о том как настроить операционную систему Ubunta, для управления новым железом (в нашем случае дисковым пространством).

Будет три части:

Как расширить раздел (увеличить диск)

Как добавить новый диск

Как создать базу данных на новом диске

Daria_Chetyrkina 12 ноя 2024 в 10:16

Как фрагментация индексов в SQL Server «подкладывает свинью» производительности, и что с этим делать

Простой

4 мин

5.1K

Блог компании АвтомаконSQL*Microsoft SQL Server*

Мнение

Из песочницы

Привет, Хабр и его читатели!

Меня зовут Дарья Четыркина, я программист SQL в IT-компании «Автомакон». Предлагаю обсудить проблему, которая может «съедать» производительность вашего SQL Server — фрагментация индексов, в конце статьи будут решения этой ситуации. Если вам важно, чтобы SQL Server всегда работал на полную мощность, эта статья — для вас.

Когда дело касается SQL Server, индексы — это ваши верные помощники: они организуют данные так, что сервер может находить нужные записи быстрее, чем обычный поиск. При этом со временем индексы начинают «разваливаться» и создают массу проблем. Фрагментация индексов — невидимый враг, который замедляет запросы, увеличивает нагрузку на сервер и лишает ваш SQL Server той оптимальной скорости, ради которой и создаются индексы. Разберемся, почему возникает фрагментация индекса, как она вредит производительности и что можно с этим сделать.

koanse 8 ноя 2024 в 13:01

Определяем доли и коэффициенты проникновения с помощью DAX

Простой

4 мин

Блог компании VisiologyВизуализация данных*Big Data*SQL*

Кейс

Привет, Хабр! Одной из важных задач в аналитических запросах является расчет долей, который позволяет узнать, какая часть записей из общего количества по всей таблице соответствует какому-либо критерию. Также нередко полезными оказываются коэффициенты проникновения (в общем-то тоже являющиеся долями). Они позволяют оценить продажи, найти взаимосвязи признаков и сделать много еще чего полезного. Чтобы проводить такого рода расчеты идеально подходит язык DAX. Если Вам интересно, насколько это удобно и как именно сделать это в DAX — добро пожаловать под кат :)

1 2 ...

10 11

13 14

SQL *

Выполнение DAX запроса AI DAX движка в СУБД на примере PostgreSQL

Введение в PL/SQL

Транзакции в базах данных на примере PostgreSQL

Как заставить вашу базу данных летать, а не ползать. Часть 3 – ещё три способа шардирования

Пятый и последний шаг к повышению производительности Firebird

Что нового в Apache Spark 4.0

Ошибки, которые можно избежать в SQL: грабли начинающего аналитика

Индексы в базах данных: сколько индексов — перебор?

Offline First в мобильных приложениях. CRUD на стороне клиента

MSSQL: рисуем метрики из Query Store на листинге процедуры

Раскраска листинга процедуры T-SQL значениями метрик

Промежуточные витрины в SQL

Оптимизация скриптов для витрин данных: от суток к часам

Ближайшие события

Где я учился, чтобы перейти в it сферу и преуспеть

Кредит, график платежей, аннуитет, досрочное погашение. Тех реализация. Велосипед, который будет переизобретаться вечно

Простое решение для автоматизации контроля за состоянием базы данных с использованием EF Core

Божественная K-V таблица для мелочей

Как добавить или расширить диск в Linux

Как фрагментация индексов в SQL Server «подкладывает свинью» производительности, и что с этим делать

Определяем доли и коэффициенты проникновения с помощью DAX

Вклад авторов