Все потоки

PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

zzeng 9 янв 2017 в 05:05

Про Z-оrder и R-дерево

15 мин

16K

Геоинформационные сервисы * Алгоритмы * PostgreSQL * C *

Индекс на основе Z-order кривой в сравнении с R-деревом имеет массу преимуществ, он:

реализован как обычное B-дерево, а мы знаем что
страницы B-дерева имеют лучшую заполняемость, кроме того,
Z-ключи сами по себе более компактны
B-дерево имеет естественный порядок обхода, в отличие от R-дерева
B-дерево быстрее строится
B-дерево лучше сбалансировано
B-дерево понятнее, не зависит от эвристики расщепления/слияния страниц
B-дерево не деградирует при постоянных изменениях
...

Впрочем, у индексов на основе Z-order есть и недостаток — сравнительно низкая производительность :). Под катом мы попробуем разобраться с чем связан этот недостаток и можно ли что-то с этим сделать.

Читать дальше →

+30

olegbunin 5 янв 2017 в 19:38

Производительность запросов в PostgreSQL – шаг за шагом

15 мин

102K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL * SQL * Высоконагруженные системы *

Илья Космодемьянский ( hydrobiont )

Для начала сразу пару слов о том, о чем пойдет речь. Во-первых, что такое оптимизация запросов? Люди редко формулируют и, бывает так, что часто недооценивают понимание того, что они делают. Можно пытаться ускорить какой-то конкретный запрос, но это не обязательно будет оптимизацией. Мы немного на эту тему потеоретизируем, потом поговорим о том, с какого конца к этому вопросу подходить, когда начинать оптимизировать, как это делать, и как понять, что какой-то запрос или набор запросов никак нельзя оптимизировать – такие случаи тоже бывают, и тогда нужно просто переделывать. Как ни странно, я почти не буду приводить примеров того, как запросы оптимизировать, потому что даже 100 примеров не приблизят нас к разгадке.

+42

Folklore 22 дек 2016 в 18:00

Уровни изоляции транзакций с примерами на PostgreSQL

8 мин

357K

PostgreSQL * SQL * Веб-разработка *

Вступление

В стандарте SQL описывается четыре уровня изоляции транзакций — Read uncommited (Чтение незафиксированных данных), Read committed (Чтение зафиксированных данных), Repeatable read (Повторяемое чтение) и Serializable (Сериализуемость). В данной статье будет рассмотрен жизненный цикл четырёх параллельно выполняющихся транзакций с уровнями изоляции Read committed и Serializable.

Для уровня изоляции Read committed допустимы следующие особые условия чтения данных:

Неповторяемое чтение — транзакция повторно читает те же данные, что и раньше, и обнаруживает, что они были изменены другой транзакцией (которая завершилась после первого чтения).

Фантомное чтение — транзакция повторно выполняет запрос, возвращающий набор строк для некоторого условия, и обнаруживает, что набор строк, удовлетворяющих условию, изменился из-за транзакции, завершившейся за это время.

Что же касается Serializable, то данный уровень изоляции самый строгий, и не имеет феноменов чтения данных.

Читать дальше →

+28

mnv 20 дек 2016 в 03:11

Оптимизация одного запроса с GROUP BY в PostgreSQL

6 мин

24K

Программирование * Высоконагруженные системы * SQL * PostgreSQL *

Сразу скажу, что в этой статье нет универсального совета на все случаи, а рассмотрен случай оптимизации лишь небольшого класса запросов. Тем не менее такие запросы могут встречаться во многих проектах.

Ускоряем запрос с GROUP BY в 10 раз

+24

seleznev_nvkz 12 дек 2016 в 09:09

Миллион строк в секунду из Postgres с помощью Python

4 мин

60K

PostgreSQL * Python *

Из песочницы

asyncpg — новая Python open-source библиотека для работы с PostgreSQL. Она была написана с использованием asyncio и Python 3.5. asyncpg — самый быстрый драйвер для работы с PostgreSQL среди похожих реализаций на Python, NodeJS и Go.

Почему asyncpg?

Мы создаем EdgeDB — базу данных нового поколения, с PostgreSQL на бэкенде. Нам необходима высокая производительность, низкая задержка доступа и дополнительные возможности самого PostgreSQL.

Самый очевидный вариант – использовать psycopg2 — популярнейший драйвер Python для работы с PostgreSQL. У него отличное комьюнити, он стабильный и проверенный временем. Также есть aiopg, который реализует асинхронный интерфейс, поверх psycopg2. Тогда очевиден вопрос — зачем писать свой велосипед? Короткий ответ: производительность и поддержка возможностей PostgreSQL. Ниже мы рассмотрим это более детально.

Читать дальше →

+34

erogov 30 ноя 2016 в 09:32

Демонстрационная база данных для PostgreSQL

7 мин

78K

Блог компании Postgres ProfessionalPostgreSQL * SQL *

В этой заметке я расскажу о нашей демонстрационной базе данных для PostgreSQL: почему она важна для нас и как может пригодиться вам, как устроена схема и какие данные в ней содержатся.

Сразу приведу ссылку на полное описание (там же написано, где взять демо-базу и как ее установить).

Читать дальше →

+35

gladkovs 28 ноя 2016 в 13:08

Адреса ФИАС в среде PostgreSQL. Часть 1

10 мин

33K

Из песочницы

Как бы мы не относились к качеству адресов ФИАС с ними необходимо работать, потому что это единственный общероссийский справочник адресов. Поэтому рано или поздно приходится решать задачу связи местоположения объектов недвижимости, юридических и физические адресов с адресом из ФИАС.

В этой статье изложен опыт работы со списком адресообразующих элементов ФИАС, загруженным в базу данных под управлением PostgreSQL. Для работы с адресообразующими элементами ФИАС создано несколько функций на языке PL/pgSQL.

Читать дальше →

+17

moscas 25 ноя 2016 в 14:44

Релиз DataGrip 2016.3

4 мин

22K

Блог компании JetBrainsMicrosoft SQL Server * MySQL * PostgreSQL * SQL *

Привет! Этот пост о том, что нового в DataGrip 2016.3. Напомню, что описанное справедливо и для других IDE на платформе IntelliJ с поддержкой баз данных: PHPStorm, PyCharm, RubyMine и, конечно, IntelliJ IDEA. Кроме одной маленькой возможности, о чём отмечу отдельно.

Этот релизный цикл был очень важным — удалось многое из того, что нас долго просили сделать: поддержка триггеров, поиск использований внутри представлений и функций, отложенное редактирование таблиц. Благодарим тех, кто не стесняется тестировать наши инструменты и пробует новые версии задолго до релиза.

Итак, DataGrip 2016.3!

Читать дальше →

+21

the_unbridled_goose 24 ноя 2016 в 10:37

О влиянии full-page writes

6 мин

10K

Перевод

Настраивая postgresql.conf, Вы могли заметить, что там есть параметр full_page_writes. Имеющийся рядом с ним комментарий гласит что-то о частичной записи страниц и люди, как правило, оставляют его в состоянии on — что не плохо, это я и объясню далее в данной статье. Тем не менее, очень полезно понимать что full_page_writes делает, так как влияние на работы системы может быть значительным.

В отличие от моего прошлого поста про настройку чекпоинтов, этот не является пособием о том, как надо настраивать сервер. Здесь не так много всего того, что Вы могли бы настроить, на самом деле, но я покажу Вам как некоторые решения на уровне приложения (к примеру, выбор типов данных) могут взаимодействовать с записью полных страниц.

Читать дальше →

+11

Habr_Studio 7 ноя 2016 в 06:34

Текстовая трансляция HighLoad++ 2016. День первый

1 мин

10K

Блог компании Конференции Олега Бунина (Онтико)MySQL * PostgreSQL * Высоконагруженные системы * Веб-разработка *

Трансляция первого дня от 7 ноября окончена. 8 ноября в 09:45 Мск продолжение видео на странице спецпроекта и текстовой трансляции в новом посте и на странице спецпроекта.

Сегодня в этом посте весь день будет вестись текстовая трансляция конференции HighLoad++ 2016, проходящей в Сколково 7 и 8 ноября. HighLoad++ — это более 200 экспертов высочайшего класса с докладами о высоконагруженных сервисах, проблемах работы с ними и вопросах администрирования. Более 15 залов, плотный график, честный и полезный опыт спикеров — HighLoad++ умеет собирать крутые темы, задавать тон дискуссии и всё на одном дыхании.

Если вы хотите смотреть видео из главного зала и включения из мобильной студии Хабрахабра, то вам на страницу спецпроекта. Если почитать онлайн и поообщаться в кооментариях — под кат.

Читать дальше →

+24

darthunix 31 окт 2016 в 13:41

Техника безопасности при работе с PostgreSQL

7 мин

28K

PostgreSQL * SQL *

Из песочницы

Так получилось, что я начал работать с PostgreSQL три года назад и за это время умудрился методично собрать все возможные грабли, которые можно вообразить. И сказать по правде, если бы была возможность поделиться с собой трехлетней давности нынешним горьким опытом, моя жизнь была бы куда проще и нервные клетки целее. Именно поэтому я решил написать абсолютно субъективную статью со сводом правил, которых придерживаюсь при разработке на PostgreSQL. Возможно, кому-то эта статья поможет обойти собранные мной грабли (и наступить на другие, ха-ха!).

Читать дальше →

+64

olegbunin 25 окт 2016 в 18:56

Асинхронная репликация без цензуры

12 мин

25K

Блог компании Конференции Олега Бунина (Онтико)Распределённые системы * Высоконагруженные системы * PostgreSQL * MySQL *

Олег Царёв ( zabivator )

Есть мастер, мастер неожиданно упал, но система продолжает работать. Клиенты мигрируют на вторую базу. Нужно делать резервные копии базы. Если делать резервные копии на основной базе, мы можем получить какие-то проблемы производительности, увеличение времени отклика. Это плохо. Поэтому достаточно распространенный пример асинхронной репликации — это снятие резервной копии со слэйва. Другой пример — это миграция тяжелых запросов с мастера на слэйв, с основной базы на вторую. Например, построение отчетов.

Иногда бывает необходимо, чтобы приложение могло получать все обновления из базы и желательно в режиме реального времени. Этим занимается оpen source библиотека, которая называется libslave.

Читать дальше →

+23

olegbunin 22 окт 2016 в 20:16

Sharding – patterns and antipatterns

23 мин

37K

Блог компании Конференции Олега Бунина (Онтико)MySQL * PostgreSQL * Высоконагруженные системы * Программирование *

Константин Осипов ( kostja ), Алексей Рыбак ( fisher )

Константин Осипов: Доклад родился из следующего разговора. Я, как всегда, пытался убедить Алексея больше использовать Tarantool, а он сказал, что там до сих пор нет шардинга и, вообще, неинтересно. Тогда мы стали рассуждать о том, почему нет. Я стал рассказывать, что тут нет одного универсального решения, автоматика полная за вас работает, а вы только кофе на работе пьете и все…

Поэтому родился этот доклад — чтобы посмотреть на то, какой бывает шардинг, какие методы в каких системах используются, какие преимущества и недостатки, почему нельзя одной «серебряной пулей» все решить?

Читать дальше →

+27

the_unbridled_goose 21 окт 2016 в 09:32

Сравнение схем Postgres и сопутствующие проблемы с представлениями

5 мин

9.2K

Перевод

Сравнение схем двух или более различных баз данных Postgres является распространенной задачей, но она может стать более каверзной, если эти базы работают на разных версиях Postgres'а. Быстрым и каноническим способом сравнить схемы является использование одной и той же программы pg_dump для взаимодействия с каждой базой со --schema-only параметром. Этот метод работает великолепно, но имеются некоторые подводные камни, особенно при копировании представлений.

(Фото сделано Philippe Vieux-Jeanton)

Читать дальше →

+11

Loriowar 17 окт 2016 в 06:04

Интеграция PostgreSQL с MS SQL Server для тех, кто желает побыстрее и поглубже

8 мин

33K

Microsoft SQL Server * PostgreSQL * Ruby on Rails *

Перевод

Недавно на хабре уже было опубликовано описание интеграции PostgreSQL и MSSQL. Но, деталей там категорически не хватало. Посему, цели сей публикации следующие:

расширить и углубить общедоступную информацию о FDW для MSSQL называемом tds_fdw: рассказать о разнице в мажорных версиях и описать базовые проблемы совместимости;
рассказать о возможностях оптимизации запросов, использующих внешние таблицы;
затронуть тему кэширования внешних данных в материализованных представлениях;
сказать пару слов об экзотических подходах к интеграции PostgreSQL и MSSQL.

Читать дальше →

+14

olegbunin 12 окт 2016 в 18:41

Сага о кластере. Все, что вы хотели знать про горизонтальное масштабирование в Postgres‘е

17 мин

25K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL * SQL * Высоконагруженные системы *

Олег Бартунов (zen), Александр Коротков (smagen), Федор Сигаев

Илья Космодемьянский: Сейчас будет самая животрепещущая тема по PostgreSQL. Все годы, что мы занимаемся консалтингом, первое, что спрашивают люди: «Как сделать мультимастер-репликацию, как добиться волшебства?». Много профессиональных волшебников будут рассказывать о том, как это сейчас хорошо и здорово реализовано в PostgreSQL — ребята из Postgres Professional в рамках этого доклада расскажут про кластер все. Название соответствующее — «Сага» — что-то эпическое и монументальное. Сейчас ребята из Postgres Professional начнут свою сагу, и это будет интересно и хорошо.

Итак, Олег Бартунов, Александр Коротков и Федор Сигаев.

+44

kapustor 11 окт 2016 в 07:57

Сравнение аналитических in-memory баз данных

19 мин

43K

Блог компании Т-БанкBig Data * MySQL * PostgreSQL * SQL *

В последние два месяца лета в управлении хранилищ данных (Data Warehouse, DWH) Тинькофф Банка появилась новая тема для кухонных споров.

Всё это время мы проводили масштабное тестирование нескольких in-memory СУБД. Любой разговор с администраторами DWH в это время можно было начать с фразы «Ну как, кто лидирует?», и не прогадать. В ответ люди получали длинную и очень эмоциональную тираду о сложностях тестирования, премудростях общения с доселе неизвестными вендорами и недостатках отдельных испытуемых.

Подробности, результаты и некое подобие выводов из тестирования — под катом.

Читать дальше →

+38

afiskon 7 окт 2016 в 11:02

ZSON: расширение PostgreSQL для прозрачного сжатия JSONB

4 мин

11K

Блог компании Postgres ProfessionalPostgreSQL *

Туториал

Недавно мы выложили на GitHub ZSON. ZSON — это расширение к PostgreSQL для прозрачного сжатия JSONB-документов. Сжатие осуществляется путем выделения строк, наиболее часто встречающихся в ваших документах, и построения словаря с этими строками. Притом строки могут быть не только ключами документа, но и значениями или, например, строками из вложенных массивов. В некоторых случаях ZSON позволяет уменьшить размер базы до двух раз и увеличить количество транзакций в секунду на 10%. В shared buffers документы хранятся в сжатом виде, за счет чего память тоже экономится.

Интересно? Читайте дальше, и вы узнаете, как пользоваться всем этим хозяйством на практике.

Читать дальше →

+38

varanio 3 окт 2016 в 14:32

Ограничения (сonstraints) PostgreSQL: exclude, частичный unique, отложенные ограничения и др

4 мин

80K

PostgreSQL * SQL * Отладка * Программирование * Веб-разработка *

Целостность данных легко нарушить. Бывает так, что в поле price попадает значение 0 из-за ошибки в коде приложения (периодически всплывают новости, как в том или ином инет-магазине продавали товары по 0 долларов). Или бывает, что удалили юзера из таблицы, но какие-то данные о нем остались в других таблицах, и эти данные вылезли в каком-то интерфейсе.

PostgreSQL, как и любая другая СУБД, умеет делать некоторые проверки при вставке/изменении данных, и этим обязательно нужно уметь пользоваться. Давайте посмотрим, что мы можем проверять:

1. Кастомный подтип через ключевое слово DOMAIN

Читать дальше →

+44

NikolaySivko 30 сен 2016 в 08:12

Мониторинг Postgresql: запросы

6 мин

68K

Блог компании okmeter.ioPostgreSQL *

В 2008 году в списке рассылки pgsql-hackers началось обсуждение расширения по сбору статистики по запросам. Начиная с версии 8.4 расширение pg_stat_statements входит в состав постгреса и позволяет получать различную статистику о запросах, которые обрабатывает сервер.

Обычно это расширение используется администраторами баз данных в качестве источника данных для отчетов (эти данные на самом деле являются суммой показателей с момента сброса счетчиков). Но на основе этой статистики можно сделать мониторинг запросов — посмотреть на статистику во времени. Это оказывается крайне полезно для поиска причин различных проблем и в целом для понимания, что происходит на сервере БД.

Я расскажу, какие метрики по запросам собирает наш агент, как мы их группируем, визуализируем, так же расскажу о некоторых граблях, по которым мы прошли.

Читать дальше →

+24

1 2 ...

56

57 58 ...