SQL *

Формальный непроцедурный язык программирования

Kilor 26 ноя 2020 в 07:10

PostgreSQL в «Тензоре» — публикации за год

16 мин

6.9K

Блог компании ТензорERP-системы * PostgreSQL * SQL * Базы данных *

Ровно год назад с рассказа о нашем сервисе визуализации планов запросов мы начали публикацию на Хабре серии статей, посвященных работе с PostgreSQL и его особенностям. Это уже пройденные нами «грабли», интересные наработки, накопившиеся рекомендации, применяемые в разработке «Тензора» — те вещи, которые помогают нам делать СБИС более эффективным.

СБИС — это система полного цикла управления бизнесом — от кадрового учета, бухгалтерии, делопроизводства и налоговой отчетности, до таск-менеджмента, корпоративного портала и видеокоммуникаций. Поэтому каждый из 1 500 000 клиентов-организаций находит что-то полезное для себя и использует наши сервисы на постоянной основе — что дает ежемесячно более миллиона активных клиентов.

И все их данные надо где-то хранить и эффективно извлекать. Поэтому еще в далеком 2012 году мы сделали ставку на PostgreSQL, и теперь это основное хранилище данных наших сервисов:

почти 9000 баз общим объемом 1PB
свыше 200TB данных клиентов
1500 разработчиков работают с БД

Чтобы упорядочить накопившиеся знания, за минувший год мы опубликовали более 60 статей, в которых делимся своим реальным опытом, проверенным практикой «сурового энтерпрайза». Возможно, какие-то из них вы пропустили, поэтому под катом мы собрали дайджест, где каждый разработчик и DBA найдет что-то интересное для себя.

Для удобства все статьи разбиты на несколько циклов:

Анализ запросов
Наглядно демонстрируем все тайны EXPLAIN [ANALYZE].
SQL Antipatterns и оптимизация SQL
Понимаем как [не] надо решать те или иные задачи в PostgreSQL и почему.
SQL HowTo
Пробуем подходы к реализации сложных алгоритмов на SQL для развлечения и с пользой.
DBA
Присматриваем за базой, чтобы ей легко дышалось.
Прикладные решения
Решаем с помощью PostgreSQL конкретные бизнес-задачи.

Читать дальше →

+20

moscas 25 ноя 2020 в 15:17

DataGrip 2020.3: SQL для Монги, новые форматы экспорта, интроспекция прав доступа и другое

6 мин

5.3K

Блог компании JetBrainsБазы данных * SQL * PostgreSQL * MySQL *

Привет! Очередной длинный пост о том, что мы сделали за последние четыре месяца. Как всегда, мы говорим DataGrip, а подразумеваем все остальные наши IDE. В том числе и WebStorm, SQL-плагин к которому теперь можно докупить.

Читать дальше →

+21

dimoobraznii 25 ноя 2020 в 08:06

Опыт создания аналитической консалтинг-компании в Северной Америке (не очень успешный)

17 мин

9.4K

Карьера в IT-индустрииРазвитие стартапаУправление проектами * Big Data * SQL *

Всем привет, последние 2-3 года у меня было интересное хобби, интересное для меня - предоставление аналитических услуг компаниям в Канаде и США. В этой статья я хочу поделиться опытом по созданию консалтинг-компании в области аналитики. Могу сразу сказать, что идея провалилась, если оценивать денежную составляющую идеи, но зато я смог получить полезный опыт и расширить кругозор.

MaxRokatansky 24 ноя 2020 в 16:17

Проблема с N+1 запросами в JPA и Hibernate

7 мин

172K

Блог компании OTUSВысоконагруженные системы * Программирование * SQL *

Перевод

В этой статье я расскажу, в чем состоит проблема N + 1 запросов при использовании JPA и Hibernate, и как ее лучше всего исправить.

Проблема N + 1 не специфична для JPA и Hibernate, с ней вы можете столкнуться и при использовании других технологий доступа к данным.

MaxRokatansky 24 ноя 2020 в 14:54

Секреты производительности Spark, или Почему важна компиляция запросов

8 мин

5.1K

Блог компании OTUSПрограммирование * SQL * Data Engineering *

Перевод

Criteo — это компания, работа которой основана на данных. Каждый день через наши системы проходят десятки терабайт новых данных для обучения моделей рекомендаций, обрабатывающих запросы в масштабах всего Интернета. Spark — наше основное средство обработки больших данных. Это мощный и гибкий инструмент, однако он отличается довольно высокой сложностью в освоении, а чтобы пользоваться им эффективно, зачастую требуется читать исходный код платформы.

little-brother 20 ноя 2020 в 05:55

Возможности SQLite, которые вы могли пропустить

8 мин

49K

SQL * SQLite *

Если вы используете SQLite, но не следите за его развитием, то возможно некоторые вещи, позволяющие сделать код проще, а запросы быстрее, прошли незамеченными. Под катом я постарался перечислить наиболее важные из них.

Читать дальше →

+74

lapiner 19 ноя 2020 в 11:36

Электронные таблицы как средство разработки бизнес-приложений

8 мин

14K

ERP-системы * SQL * Ненормальное программирование * Программирование * Office 365 *

Excel часто используется как универсальное средство для разработки бизнес-приложений. В этой статье я хочу сравнить, существующие без особых изменений уже более 30 лет, электронные таблицы с современной классической императивной парадигмой программирования глазами архитектора ПО. Затем я хочу рассказать о своей работе над новым табличным процессором, который исправляет многие недостатки, выявленные при сравнении, тем самым позволяя создавать более надежные, масштабируемые и легкие для поддержки и дальнейшего развития, бизнес-приложения.

Читать дальше →

+14

Kilor 18 ноя 2020 в 07:10

PostgreSQL Antipatterns: DBA-детектив, или Три дела о потерянной производительности

30 мин

5.7K

Блог компании ТензорPostgreSQL * SQL * Базы данных * Реверс-инжиниринг *

Сегодня вместо решения абстрактных алгоритмических задач мы выступим в роли детектива, по крупицам доставшейся информации исследующего неэффективные запросы, и рассмотрим три реальных дела, встречавшихся в разное время на просторах нашего приложения СБИС, когда простота и наивность при написании SQL превращалась в дополнительную нагрузку для PostgreSQL-сервера.

Дедукция и индукция помогут нам вычислить, что же все-таки хотел получить от СУБД разработчик, и почему это получилось не слишком оптимально. Итак, сегодня нас ждут:

Дело о непростом пути вверх
Разберем в live-видео на реальном примере некоторые из способов улучшения производительности иерархического запроса.
Дело о худеющем запросе
Увидим, как можно запрос упростить и ускорить в несколько раз, пошагово применяя стандартные методики.
Дело о развесистой клюкве
Восстановим структуру БД на основании единственного запроса с 11 JOIN и предложим альтернативный вариант решения на ней той же задачи.

Расследовать

+17

MaxRokatansky 16 ноя 2020 в 14:52

Автоматизация миграций баз данных с помощью контейнеров и Git

4 мин

4.9K

Блог компании OTUSGit * Kubernetes * SQL * Microsoft SQL Server *

Перевод

Управление миграциями баз данных для нескольких сред и команд может быть достаточно сложной задачей. В этой статье описывается, как сочетание Git, контейнеров и клонов баз данных используется для реализации доставки в среды разработки, тестирования и стейджинга за считанные секунды.

Хотя Git и так часто используется в сочетании с контейнерами баз данных, описанный здесь подход все же вводит два новых элемента. Вместо того, чтобы воспроизводить базы данных из бекапов или создавать из источника данных, мы клонируем идентичные безопасные среды производственных баз данных и доставляем их в течении секунд. Клоны баз данных доступны для записи и позволяют легко внедрять маскирование данных и синтетические тестовые данные. Второй элемент - это файл манифеста сценариев, используемый при создании и применении персонализированных сценариев миграции.

Разработчик может работать с клоном производственной базы данных в функциональной ветке - сценарии для этой ветки применяются автоматически. В то же время команда тестирования может работать в релизной ветке с идентичным клоном производственной базы данных - для нее применяется набор релизных сценариев. На каком-нибудь конвейерном стейдже можно протестировать откат релизной ветки с третьим идентичным безопасным клоном производственной базы данных, благодаря автоматическому применению сценариев обновления и отката.

Эта статья берет за основу SQL Server, но эти методы также поддерживаются Postgres и MySQL.

4reg 15 ноя 2020 в 10:28

Вредные советы для «идеального» REST API

4 мин

7.1K

Проектирование API * SQL *

Из песочницы

Всем привет!

Почему 'идеального' написано в кавычках?!

То, что написано ниже относится к разряду "так делать не надо", однако, если вы считаете иначе — интересно будет услышать ваше мнение на этот счёт )

Наверное, многие из нас делали REST API, либо пользовались чьим-то готовым. Разберём в статье "невероятные" трюки, которые помогут сделать ваше API на голову выше, чем у других.

Читать дальше →

MaxRokatansky 13 ноя 2020 в 15:41

Web Security SQL Injection 2020

6 мин

14K

Блог компании OTUSИнформационная безопасность * Веб-разработка * SQL *

Статья расскажет, как использовать SQLmap и похожих инструментов для автоматизации решений заданий по sql injection на одном из популярных CTF ресурсов. В статье зайдем немного дальше, чем просто модификация risk-level «if you know what i mean». Задания не будут полностью разобраны для решения, флаги необходимо найти самостоятельно.

Также будет продемонстрировано, как можно самостоятельно изменять инструменты для покрытия большего количества уязвимостей в веб.

cerrenesi 10 ноя 2020 в 17:46

Spring: Ускоряем запись в базу данных с помощью XML

5 мин

5.4K

Java * Kotlin * SQL * Программирование *

Всем привет!

В этой статье пойдет речь о том как ускорить запись большого объема информации в реляционную базу данных для приложений, написанных с использованием Spring Boot. При записи большого количества строк за раз Hibernate вставляет их по одному, что приводит к существенному ожиданию, если строк много. Рассмотрим кейс как это обойти.

Читать дальше →

-5

Kilor 10 ноя 2020 в 07:10

PostgreSQL Antipatterns: работаем с отрезками в «кровавом энтерпрайзе»

6 мин

14K

Блог компании ТензорАлгоритмы * SQL * PostgreSQL * ERP-системы *

В различных бизнес-приложениях регулярно возникает необходимость решить какую-либо задачу с отрезками/интервалами. Самое сложное в них — понять, что это именно одна из таких задач.

Как правило, они отчаянно маскируются, и даже у нас в СБИС их найти можно в абсолютно разных сферах управления предприятием: контроле рабочего времени, оценке загрузки линий АТС или даже в бухгалтерском учете.

«Отличие enterprise [решения] от всего остального — он всегда идёт от запросов бизнеса и решает какую-то бизнес-задачу.» [src]

Вот и давайте посмотрим, какие именно прикладные задачи и как можно решить с помощью PostgreSQL и сократить время анализа данных с нескольких секунд на бизнес-логике до десятков миллисекунд, умея эффективно применять следующие алгоритмы непосредственно внутри SQL-запроса:

поиск отрезков, пересекающих точку/интервал
слияние отрезков по максимальному перекрытию
подсчет количества отрезков в каждой точке

Читать дальше →

+24

zm_llill 9 ноя 2020 в 20:27

Как я решил написать ORM на php с нуля на работающем сайте, и что из этого вышло

5 мин

6.6K

PHP * SQL *

Я, как и многие программисты, довольно отрицательно отношусь к созданию велосипедов и изобретению колес и это более чем обосновано хотя бы стоимостью разработки для бизнеса. Но как показал мой опыт иногда приходится отходить от этого правила и, даже, получать от этого пользу. Я имею ввиду не только интерес и удовольствие от разработки, но и плюшки для проекта в целом. Об одном моем подобном опыте можно прочесть несколько слов под катом.

Читать дальше →

FallDi 6 ноя 2020 в 03:24

PostgreSQL отложенные SQL ограничения

10 мин

32K

PostgreSQL * SQL *

Перевод

На Хабре уже было несколько статей упоминающих deferred constraints.

Но хочется рассказать о них подробнее.

PostgreSQL deferred constraint

Читать дальше →

+12

shmelev-1987 5 ноя 2020 в 00:00

Ведение разработки БД. Шаблоны создания/изменения объектов MSSQL

12 мин

8.8K

Microsoft SQL Server * SQL *

При постоянной работе с MSSQL необходимо создавать различные объекты БД: таблицы, представления, триггеры и т.д.

В статье приведу шаблоны SQL запросов, которые помогут, и, возможно, стандартизируют подход создания кода на языке T-SQL.

Кроме этого, опишу о том, как я веду репозиторий БД в системе контроля версий.

Читать дальше →

kzzzr 2 ноя 2020 в 18:17

Кто ответит за качество аналитики: QA для Хранилища Данных

6 мин

4.6K

Блог компании OTUSSQL * Базы данных * Big Data * Data Engineering *

Вы любите просыпаться от звонка/сообщения руководителя или бизнес-партнера с просьбой срочно проверить данные и актуальность дашбордов? Я - нет.

Сегодня, когда данные приобретают поистине колоссальное значение, я расскажу как сделать шаг вперед навстречу управляемому и прогнозируемому качеству аналитики с точки зрения DWH, и работы с данными в общем.

Внедрение мониторинга и проактивное устранение проблем позволят выйти на принципиально новый уровень зрелости информационных и аналитических сервисов. И, возможно, помогут обеспечить здоровый и крепкий сон инженеров.

splarv 29 окт 2020 в 14:14

Перечислимый тип и PostgreSQL

20 мин

22K

Блог компании ДомкликSQL * PostgreSQL *

Пролог

Под перечислимым типом обычно понимают тип данных, который может принимать ограниченное и, как правило, небольшое число значений. Его выделяет то, что эти значения часто хардкодятся программистами в исходный код. И, как следствие, пользователи и операторы приложения не могут менять множество значений перечислимого типа. Их меняют только разработчики, зачастую с соответствующими исправлениями в коде и бизнес-логике приложения. Примерами перечислимых типов могут быть: времена года, месяцы, направление типа въезда/выезд или in/out, какие-нибудь типы или категории чего-нибудь, и так далее. В PostgreSQL подобную функциональность могут и реализуют различными способами. Этому посвящена статья.

Читать дальше →

+24

Kilor 29 окт 2020 в 11:00

Анализируем «слона» по частям

3 мин

4.4K

Блог компании ТензорВизуализация данных * Базы данных * SQL * PostgreSQL *

Если вы регулярно отлаживаете производительность запросов к PostgreSQL, а EXPLAIN (ANALYZE, BUFFERS) ... — любимый инструмент познания особенностей работы этой СУБД, то новые полезные «фишки» нашего сервиса визуализации и анализа планов explain.tensor.ru наверняка пригодятся вам в этом нелегком деле.

Но сразу напомню, что без полноценного всестороннего мониторинга базы PostgreSQL использовать только анализ плана — это выступать с позиции мудреца #5!

[источник КДПВ, «Слепые и слон»]

Немного про мудреца #5

+16

MaxRokatansky 22 окт 2020 в 13:09

Шифрование в MySQL: ротация Master Key

3 мин

2.3K

Блог компании OTUSSQL * Базы данных * MySQL *

Перевод

В преддверии старта нового набора на курс «Базы данных» продолжаем публиковать серию статей про шифрование в MySQL.

В предыдущей статье этой серии мы обсудили, как работает шифрование с главным ключом (Master Key). Сегодня, основываясь на полученных ранее знаниях, посмотрим на ротацию главных ключей.

Ротация главных ключей заключается в том, что генерируется новый главный ключ и этим новым ключом повторно шифруются ключи табличных пространств (которые хранятся в заголовках табличных пространств).

Давайте вспомним, как выглядит заголовок зашифрованного табличного пространства:

-2

1 2 ...

56 57

59 60 ...

106 107

SQL *

PostgreSQL в «Тензоре» — публикации за год

DataGrip 2020.3: SQL для Монги, новые форматы экспорта, интроспекция прав доступа и другое

Опыт создания аналитической консалтинг-компании в Северной Америке (не очень успешный)

Проблема с N+1 запросами в JPA и Hibernate

Секреты производительности Spark, или Почему важна компиляция запросов

Возможности SQLite, которые вы могли пропустить

Электронные таблицы как средство разработки бизнес-приложений

PostgreSQL Antipatterns: DBA-детектив, или Три дела о потерянной производительности

Автоматизация миграций баз данных с помощью контейнеров и Git

Вредные советы для «идеального» REST API

Web Security SQL Injection 2020

Spring: Ускоряем запись в базу данных с помощью XML

PostgreSQL Antipatterns: работаем с отрезками в «кровавом энтерпрайзе»

Ближайшие события

Как я решил написать ORM на php с нуля на работающем сайте, и что из этого вышло

PostgreSQL отложенные SQL ограничения

Ведение разработки БД. Шаблоны создания/изменения объектов MSSQL

Кто ответит за качество аналитики: QA для Хранилища Данных

Перечислимый тип и PostgreSQL

Пролог

Анализируем «слона» по частям

Шифрование в MySQL: ротация Master Key

Вклад авторов