PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

erogov 9 янв 2017 в 11:58

И снова о рекурсивных запросах

25 мин

31K

Блог компании Postgres ProfessionalPostgreSQL*SQL*

Туториал

В этой заметке речь пойдет о том, как писать рекурсивные запросы. Тема эта поднималась не раз и не два, но обычно все ограничивается простыми «деревянными» случаями: спуститься от вершины до листьев, подняться от вершины до корня. Мы же займемся более сложным случаем произвольного графа.

Начнем с того, что повторим теорию (очень кратко, потому что с ней все ясно), а затем поговорим о том, что делать, если непонятно, как подступиться к реальной задаче, или вроде бы понятно, но запрос упорно не хочет работать.

Для упражнения будем использовать демо-базу, подробно описанную ранее, и попробуем написать в ней запрос для поиска кратчайшего пути из одного аэропорта в другой.

Читать дальше →

+39

zzeng 9 янв 2017 в 05:05

Про Z-оrder и R-дерево

15 мин

16K

C*PostgreSQL*Алгоритмы*Геоинформационные сервисы*

Индекс на основе Z-order кривой в сравнении с R-деревом имеет массу преимуществ, он:

реализован как обычное B-дерево, а мы знаем что
страницы B-дерева имеют лучшую заполняемость, кроме того,
Z-ключи сами по себе более компактны
B-дерево имеет естественный порядок обхода, в отличие от R-дерева
B-дерево быстрее строится
B-дерево лучше сбалансировано
B-дерево понятнее, не зависит от эвристики расщепления/слияния страниц
B-дерево не деградирует при постоянных изменениях
...

Впрочем, у индексов на основе Z-order есть и недостаток — сравнительно низкая производительность :). Под катом мы попробуем разобраться с чем связан этот недостаток и можно ли что-то с этим сделать.

Читать дальше →

+33

olegbunin 5 янв 2017 в 19:38

Производительность запросов в PostgreSQL – шаг за шагом

15 мин

94K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL*SQL*Высоконагруженные системы*

Илья Космодемьянский ( hydrobiont )

Для начала сразу пару слов о том, о чем пойдет речь. Во-первых, что такое оптимизация запросов? Люди редко формулируют и, бывает так, что часто недооценивают понимание того, что они делают. Можно пытаться ускорить какой-то конкретный запрос, но это не обязательно будет оптимизацией. Мы немного на эту тему потеоретизируем, потом поговорим о том, с какого конца к этому вопросу подходить, когда начинать оптимизировать, как это делать, и как понять, что какой-то запрос или набор запросов никак нельзя оптимизировать – такие случаи тоже бывают, и тогда нужно просто переделывать. Как ни странно, я почти не буду приводить примеров того, как запросы оптимизировать, потому что даже 100 примеров не приблизят нас к разгадке.

+42

Folklore 22 дек 2016 в 18:00

Уровни изоляции транзакций с примерами на PostgreSQL

8 мин

303K

PostgreSQL*SQL*Веб-разработка*

Вступление

В стандарте SQL описывается четыре уровня изоляции транзакций — Read uncommited (Чтение незафиксированных данных), Read committed (Чтение зафиксированных данных), Repeatable read (Повторяемое чтение) и Serializable (Сериализуемость). В данной статье будет рассмотрен жизненный цикл четырёх параллельно выполняющихся транзакций с уровнями изоляции Read committed и Serializable.

Для уровня изоляции Read committed допустимы следующие особые условия чтения данных:

Неповторяемое чтение — транзакция повторно читает те же данные, что и раньше, и обнаруживает, что они были изменены другой транзакцией (которая завершилась после первого чтения).

Фантомное чтение — транзакция повторно выполняет запрос, возвращающий набор строк для некоторого условия, и обнаруживает, что набор строк, удовлетворяющих условию, изменился из-за транзакции, завершившейся за это время.

Что же касается Serializable, то данный уровень изоляции самый строгий, и не имеет феноменов чтения данных.

Читать дальше →

+31

mnv 20 дек 2016 в 03:11

Оптимизация одного запроса с GROUP BY в PostgreSQL

6 мин

23K

Программирование*Высоконагруженные системы*SQL*PostgreSQL*

Сразу скажу, что в этой статье нет универсального совета на все случаи, а рассмотрен случай оптимизации лишь небольшого класса запросов. Тем не менее такие запросы могут встречаться во многих проектах.

Ускоряем запрос с GROUP BY в 10 раз

+27

seleznev_nvkz 12 дек 2016 в 09:09

Миллион строк в секунду из Postgres с помощью Python

4 мин

56K

Python*PostgreSQL*

Из песочницы

asyncpg — новая Python open-source библиотека для работы с PostgreSQL. Она была написана с использованием asyncio и Python 3.5. asyncpg — самый быстрый драйвер для работы с PostgreSQL среди похожих реализаций на Python, NodeJS и Go.

Почему asyncpg?

Мы создаем EdgeDB — базу данных нового поколения, с PostgreSQL на бэкенде. Нам необходима высокая производительность, низкая задержка доступа и дополнительные возможности самого PostgreSQL.

Самый очевидный вариант – использовать psycopg2 — популярнейший драйвер Python для работы с PostgreSQL. У него отличное комьюнити, он стабильный и проверенный временем. Также есть aiopg, который реализует асинхронный интерфейс, поверх psycopg2. Тогда очевиден вопрос — зачем писать свой велосипед? Короткий ответ: производительность и поддержка возможностей PostgreSQL. Ниже мы рассмотрим это более детально.

Читать дальше →

+37

erogov 30 ноя 2016 в 09:32

Демонстрационная база данных для PostgreSQL

7 мин

69K

Блог компании Postgres ProfessionalSQL*PostgreSQL*

В этой заметке я расскажу о нашей демонстрационной базе данных для PostgreSQL: почему она важна для нас и как может пригодиться вам, как устроена схема и какие данные в ней содержатся.

Сразу приведу ссылку на полное описание (там же написано, где взять демо-базу и как ее установить).

Читать дальше →

+38

Habr_Studio 7 ноя 2016 в 06:34

Текстовая трансляция HighLoad++ 2016. День первый

1 мин

10K

Блог компании Конференции Олега Бунина (Онтико)Веб-разработка*Высоконагруженные системы*PostgreSQL*MySQL*

Трансляция первого дня от 7 ноября окончена. 8 ноября в 09:45 Мск продолжение видео на странице спецпроекта и текстовой трансляции в новом посте и на странице спецпроекта.

Сегодня в этом посте весь день будет вестись текстовая трансляция конференции HighLoad++ 2016, проходящей в Сколково 7 и 8 ноября. HighLoad++ — это более 200 экспертов высочайшего класса с докладами о высоконагруженных сервисах, проблемах работы с ними и вопросах администрирования. Более 15 залов, плотный график, честный и полезный опыт спикеров — HighLoad++ умеет собирать крутые темы, задавать тон дискуссии и всё на одном дыхании.

Если вы хотите смотреть видео из главного зала и включения из мобильной студии Хабрахабра, то вам на страницу спецпроекта. Если почитать онлайн и поообщаться в кооментариях — под кат.

Читать дальше →

+27

darthunix 31 окт 2016 в 13:41

Техника безопасности при работе с PostgreSQL

7 мин

28K

PostgreSQL*SQL*

Из песочницы

Так получилось, что я начал работать с PostgreSQL три года назад и за это время умудрился методично собрать все возможные грабли, которые можно вообразить. И сказать по правде, если бы была возможность поделиться с собой трехлетней давности нынешним горьким опытом, моя жизнь была бы куда проще и нервные клетки целее. Именно поэтому я решил написать абсолютно субъективную статью со сводом правил, которых придерживаюсь при разработке на PostgreSQL. Возможно, кому-то эта статья поможет обойти собранные мной грабли (и наступить на другие, ха-ха!).

Читать дальше →

+67

olegbunin 25 окт 2016 в 18:56

Асинхронная репликация без цензуры

12 мин

24K

Блог компании Конференции Олега Бунина (Онтико)MySQL*PostgreSQL*Высоконагруженные системы*Распределённые системы*

Олег Царёв ( zabivator )

Есть мастер, мастер неожиданно упал, но система продолжает работать. Клиенты мигрируют на вторую базу. Нужно делать резервные копии базы. Если делать резервные копии на основной базе, мы можем получить какие-то проблемы производительности, увеличение времени отклика. Это плохо. Поэтому достаточно распространенный пример асинхронной репликации — это снятие резервной копии со слэйва. Другой пример — это миграция тяжелых запросов с мастера на слэйв, с основной базы на вторую. Например, построение отчетов.

Иногда бывает необходимо, чтобы приложение могло получать все обновления из базы и желательно в режиме реального времени. Этим занимается оpen source библиотека, которая называется libslave.

Читать дальше →

+26

olegbunin 22 окт 2016 в 20:16

Sharding – patterns and antipatterns

23 мин

34K

Блог компании Конференции Олега Бунина (Онтико)MySQL*PostgreSQL*Высоконагруженные системы*Программирование*

Константин Осипов ( kostja ), Алексей Рыбак ( fisher )

Константин Осипов: Доклад родился из следующего разговора. Я, как всегда, пытался убедить Алексея больше использовать Tarantool, а он сказал, что там до сих пор нет шардинга и, вообще, неинтересно. Тогда мы стали рассуждать о том, почему нет. Я стал рассказывать, что тут нет одного универсального решения, автоматика полная за вас работает, а вы только кофе на работе пьете и все…

Поэтому родился этот доклад — чтобы посмотреть на то, какой бывает шардинг, какие методы в каких системах используются, какие преимущества и недостатки, почему нельзя одной «серебряной пулей» все решить?

Читать дальше →

+30

olegbunin 12 окт 2016 в 18:41

Сага о кластере. Все, что вы хотели знать про горизонтальное масштабирование в Postgres‘е

17 мин

25K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL*SQL*Высоконагруженные системы*

Олег Бартунов (zen), Александр Коротков (smagen), Федор Сигаев

Илья Космодемьянский: Сейчас будет самая животрепещущая тема по PostgreSQL. Все годы, что мы занимаемся консалтингом, первое, что спрашивают люди: «Как сделать мультимастер-репликацию, как добиться волшебства?». Много профессиональных волшебников будут рассказывать о том, как это сейчас хорошо и здорово реализовано в PostgreSQL — ребята из Postgres Professional в рамках этого доклада расскажут про кластер все. Название соответствующее — «Сага» — что-то эпическое и монументальное. Сейчас ребята из Postgres Professional начнут свою сагу, и это будет интересно и хорошо.

Итак, Олег Бартунов, Александр Коротков и Федор Сигаев.

+47

kapustor 11 окт 2016 в 07:57

Сравнение аналитических in-memory баз данных

19 мин

42K

Блог компании Т-БанкBig Data*MySQL*PostgreSQL*SQL*

В последние два месяца лета в управлении хранилищ данных (Data Warehouse, DWH) Тинькофф Банка появилась новая тема для кухонных споров.

Всё это время мы проводили масштабное тестирование нескольких in-memory СУБД. Любой разговор с администраторами DWH в это время можно было начать с фразы «Ну как, кто лидирует?», и не прогадать. В ответ люди получали длинную и очень эмоциональную тираду о сложностях тестирования, премудростях общения с доселе неизвестными вендорами и недостатках отдельных испытуемых.

Подробности, результаты и некое подобие выводов из тестирования — под катом.

Читать дальше →

+41

afiskon 7 окт 2016 в 11:02

ZSON: расширение PostgreSQL для прозрачного сжатия JSONB

4 мин

11K

Блог компании Postgres ProfessionalPostgreSQL*

Туториал

Недавно мы выложили на GitHub ZSON. ZSON — это расширение к PostgreSQL для прозрачного сжатия JSONB-документов. Сжатие осуществляется путем выделения строк, наиболее часто встречающихся в ваших документах, и построения словаря с этими строками. Притом строки могут быть не только ключами документа, но и значениями или, например, строками из вложенных массивов. В некоторых случаях ZSON позволяет уменьшить размер базы до двух раз и увеличить количество транзакций в секунду на 10%. В shared buffers документы хранятся в сжатом виде, за счет чего память тоже экономится.

Интересно? Читайте дальше, и вы узнаете, как пользоваться всем этим хозяйством на практике.

Читать дальше →

+41

varanio 3 окт 2016 в 14:32

Ограничения (сonstraints) PostgreSQL: exclude, частичный unique, отложенные ограничения и др

4 мин

72K

PostgreSQL*SQL*Отладка*Программирование*Веб-разработка*

Целостность данных легко нарушить. Бывает так, что в поле price попадает значение 0 из-за ошибки в коде приложения (периодически всплывают новости, как в том или ином инет-магазине продавали товары по 0 долларов). Или бывает, что удалили юзера из таблицы, но какие-то данные о нем остались в других таблицах, и эти данные вылезли в каком-то интерфейсе.

PostgreSQL, как и любая другая СУБД, умеет делать некоторые проверки при вставке/изменении данных, и этим обязательно нужно уметь пользоваться. Давайте посмотрим, что мы можем проверять:

1. Кастомный подтип через ключевое слово DOMAIN

Читать дальше →

+47

NikolaySivko 30 сен 2016 в 08:12

Мониторинг Postgresql: запросы

6 мин

63K

Блог компании okmeter.ioPostgreSQL*

В 2008 году в списке рассылки pgsql-hackers началось обсуждение расширения по сбору статистики по запросам. Начиная с версии 8.4 расширение pg_stat_statements входит в состав постгреса и позволяет получать различную статистику о запросах, которые обрабатывает сервер.

Обычно это расширение используется администраторами баз данных в качестве источника данных для отчетов (эти данные на самом деле являются суммой показателей с момента сброса счетчиков). Но на основе этой статистики можно сделать мониторинг запросов — посмотреть на статистику во времени. Это оказывается крайне полезно для поиска причин различных проблем и в целом для понимания, что происходит на сервере БД.

Я расскажу, какие метрики по запросам собирает наш агент, как мы их группируем, визуализируем, так же расскажу о некоторых граблях, по которым мы прошли.

Читать дальше →

+27

x-wao 29 сен 2016 в 17:56

Новый релиз PostgreSQL 9.6: вклад Postgres Professional

5 мин

21K

Блог компании Postgres ProfessionalPostgreSQL*

Сегодня, 29 сентября 2016 года, вышел новый релиз PostgreSQL, получивший номер 9.6. В нём содержится много весьма полезных фич, и нельзя не рассказать о них, тем более что вклад нашей компании в этот релиз существенен. Поэтому в этой статье мы расскажем о тех разработках Postgres Pro, которые вошли в сегодняшний релиз.

Читать дальше →

+57

afiskon 20 сен 2016 в 14:45

Примеры реальных патчей в PostgreSQL: часть 2 из N

7 мин

8.8K

Блог компании Postgres ProfessionalC*PostgreSQL*

Туториал

В предыдущих статьях мы рассмотрели процесс разработки PostgreSQL, а также примеры некоторых реальных патчей, принятых в эту РСУБД за последнее время. При этом рассмотренные патчи были, прямо скажем, какие-то «несерьезные» — исправление опечаток, исправление простейших косяков, найденных при помощи статического анализа, и прочее в таком духе.

Сегодня мы рассмотрим примеры уже более серьезных патчей, устраняющих узкие места в коде, исправляющих достаточно серьезные баги, относительно крупные рефакторинги, и так далее. Как и ранее, основная цель статьи — не столько осветить изменения, принятые в PostgreSQL 9.6, сколько показать, что разработка open source проектов, в частности PostgreSQL, это интересно и не так сложно, как вам это может казаться.

Если эта тема вам интересна, прошу под кат.

Читать дальше →

+42

yegelletezeta 9 сен 2016 в 13:00

«Как я провёл это лето»: видео с летних встреч JUG.ru

2 мин

5.4K

Блог компании JUG Ru GroupКомпиляторы*PostgreSQL*Java*

Вот и наступила осень. Кто-то возвращается в город с центнером яблок в багажнике, кто-то — c норвежским пивом прямиком с JavaZone, а мы подготовили для вас материал, который, надеемся, скоротает дождливые вечера. Мы расскажем о трёх летних встречах JUG.ru. Посему разработчики, вернувшись из отпусков, имеют замечательную возможность запастись чашкой горячего чая, завернуться в плед и посмотреть видео с наших митапов.

Итак, летом у нас было три встречи:
    — Douglas Hawkins из Azul рассказал об особенностях работы JIT-компиляторов в HotSpot JVM;
    — Alvaro Hernandez, разработчик ToroDB, рассказал о том, как Java работает с PostgreSQL;
    — наконец, Евгений Борисов порадовал нас новой порцией загадок на тему Spring.

+34

olegbunin 9 сен 2016 в 09:17

Масштабирование базы данных через шардирование и партиционирование

11 мин

171K

Блог компании Конференции Олега Бунина (Онтико)MySQL*PostgreSQL*Высоконагруженные системы*Веб-разработка*

Масштабирование базы данных через шардирование и партиционирование

Денис Иванов (2ГИС)

Всем привет! Меня зовут Денис Иванов, и я расскажу о масштабировании баз данных через шардирование и партиционирование. После этого доклада у всех должно появиться желание что-то попартицировать, пошардировать, вы поймете, что это очень просто, оно никак жрать не просит, работает, и все замечательно.

Немного расскажу о себе — я работаю в команде WebAPI в компании 2GIS, мы предоставляем API для организаций, у нас очень много разных данных, 8 стран, в которых мы работаем, 250 крупных городов, 50 тыс. населенных пунктов. У нас достаточно большая нагрузка — 25 млн. активных пользователей в месяц, и в среднем нагрузка около 2000 RPS идет на API. Все это располагается в трех датацентрах.

Перейдем к проблемам, которые мы с вами сегодня будем решать. Одна из проблем — это большое количество данных. Когда вы разрабатываете тот или иной проект, у вас в любой момент времени может случиться так, что данных становится очень много. Если бизнес работает, он приносит деньги. Соответственно, данных больше, денег больше, и с этими данными что-то нужно делать, потому что эти запросы очень долго начинают выполняться, и у нас сервер начинает не вывозить. Одно из решений, что с этими данными делать — это масштабирование базы данных.

Читать дальше →

+31

1 2 ...

15 16

18 19 ...

22 23

PostgreSQL *

И снова о рекурсивных запросах

Про Z-оrder и R-дерево

Производительность запросов в PostgreSQL – шаг за шагом

Илья Космодемьянский ( hydrobiont )

Уровни изоляции транзакций с примерами на PostgreSQL

Вступление

Оптимизация одного запроса с GROUP BY в PostgreSQL

Миллион строк в секунду из Postgres с помощью Python

Почему asyncpg?

Демонстрационная база данных для PostgreSQL

Текстовая трансляция HighLoad++ 2016. День первый

Техника безопасности при работе с PostgreSQL

Асинхронная репликация без цензуры

Олег Царёв ( zabivator )

Sharding – patterns and antipatterns

Константин Осипов ( kostja ), Алексей Рыбак ( fisher )

Сага о кластере. Все, что вы хотели знать про горизонтальное масштабирование в Postgres‘е

Олег Бартунов (zen), Александр Коротков (smagen), Федор Сигаев

Сравнение аналитических in-memory баз данных

Ближайшие события

ZSON: расширение PostgreSQL для прозрачного сжатия JSONB

Ограничения (сonstraints) PostgreSQL: exclude, частичный unique, отложенные ограничения и др

1. Кастомный подтип через ключевое слово DOMAIN

Мониторинг Postgresql: запросы

Новый релиз PostgreSQL 9.6: вклад Postgres Professional

Примеры реальных патчей в PostgreSQL: часть 2 из N

«Как я провёл это лето»: видео с летних встреч JUG.ru

Масштабирование базы данных через шардирование и партиционирование

Масштабирование базы данных через шардирование и партиционирование

Денис Иванов (2ГИС)

Вклад авторов