RustamKuramshin Jun 30 2025 at 17:10

Как не облажаться с типами данных в PostgreSQL

Medium

19 min

36K

PostgreSQL * Database Administration * SQL * Programming *

Tutorial

Translation

+42

Comments 30

Arm79 Jun 30 2025 at 19:52

Спасибо, про ограничения serial не знал

Evengard Jul 1 2025 at 00:04

Честно скажу, я не разделяю общей любви к timestamptz. Хранит даты в непонятно какой таймзоне настроенной где-то там на стороне сервера безо всякого твоего контроля (особенно если база предоставляется "облачно" - да даже если не облачно, то в любом моменте когда база администрируется dba а не создателем приложения), и при неучёте этого поведения можно получить совсем не то что ожидаешь...

Я предпочитаю всё же использовать timestamp, в названии колонки явно указывать что это utc (либо если по какой-то странной причине нужно в другой таймзоне - указывать что это local и рядом создавать ещё одну колонку с указанием таймзоны), и на уровне приложения уже передавать именно utc.

База не предназначена для конвертаций таймзон как по мне, это дело приложения, там слишком много подводных камней. А если очень нужно сравнить две даты - используйте utc и не морочьте никому голову.

lxvkw Jul 1 2025 at 10:19

Можете описать, пожалуйста , что за подводные камни конвертации? Если у нас есть локальное время и смещение, то абсолютное получить можно легким движением руки, разве нет?

Evengard Jul 2 2025 at 08:38

Как минимум - всякие особенности при вычислении времени в момент когда таймзона переходит с зимнего на летнее время и обратно. А вообще чёрной магии на уровне таймзон хватает. На уровне приложения можно это дополнительно доучесть - собственно либы всякие часто предоставляют методы "из коробки" для того чтобы это доучесть - а на уровне базы данных таких расширенных инструментов нету.

hogstaberg Jul 1 2025 at 10:43

Хранит даты в непонятно какой таймзоне настроенной где-то там на стороне сервера безо всякого твоего контроля

Просто используйте на серверах UTC. Или выставляйте в сессии time zone в UTC. Ваш кэп.

Если без шуток, то это очень удобно когда у вас инфраструктура по всему глобусу размазана. И даже имеет смысл когда у вас всё в одном городе стоит, ведь никто не даст гарантий, что завтра у вас ещё города/страны не появится.

Evengard Jul 2 2025 at 08:35

Не всегда у пользователя базы данных есть возможность выставить конфиг сервера баз данных в UTC - администрируется какими-нибудь dba которые просто выдают тебе готовую базку. Там может быть абсолютно что угодно выставленное вне контроля.

hogstaberg Jul 7 2025 at 07:16

Это ж параметр сессии, при чём тут dba?

Evengard Jul 7 2025 at 07:20

Вы часто меняете параметры сессии при подключении?

hogstaberg Jul 7 2025 at 11:13

Если нужно - меняю, конечно.

kulity Jul 2 2025 at 11:41

Хранит даты в непонятно какой таймзоне настроенной где-то там на стороне сервера безо всякого твоего контроля

Что за бред? Значения хранятся в UTC. При сохранении значения можно явно указать к какому часовому поясу оно относится и настройки сервера, на котором БД, ни на что не повлияют

Evengard Jul 2 2025 at 12:01

Хранится - да, а отдаётся в таймзоне сервера если не указать иное. И по факту если не озаботиться с явным указанием таймзоны когда вычитываешь данные - то получишь не то что ожидаешь.

kulity Jul 2 2025 at 13:24

Отдается тоже в UTC. По крайней мере это справедливо для драйвера PostgreSQL в Java. При касте в текст он меняет на другую зону, но и это не проблема, так как она указывается на конце.

Evengard Jul 4 2025 at 07:38

Я из дотнет мира, и похоже в npgsql это в какой-то момент поменяли (раньше отдавалось в таймзоне сервера/сессии). Видимо, старая память...

vasyakolobok77 Jul 6 2025 at 15:12

Возможно я ошибаюсь, но кажется вы не до конца понимаете смысла timestamp / timestamptz. Внутри postgres они оба хранятся как штамп времени по UTC. Разница появляется при чтении / записи - будет ли учитываться TZ клиента или нет.

По факту timestamp нужен для хранения локальной даты-времени. Например, Новый год 1 января 0:00 - в каждом часовом поясе он свой, т.е. штамп времени не зависит от TZ.

С другой стороны timestamptz нужен для хранения глобальной даты-времени, метки в общемировом течении времени. Например, рождение ребенка 15 января 2025 года в 16:48 по МСК.

Если все клиенты работают с БД с одной TZ, то разницы между ts / tstz вообще нет. Разница появляется, когда есть клиент из Москвы (UTC+3) и допустим из Екатеринбурга (UTC+5). В примере с глобальной датой-времени 2025-01-15T16:48:00+03 клиент из Москвы увидит 2025-01-15T16:48:00+03, а клиент из Екатеринбурга увидит 2025-01-15T18:48:00+05. Обе эти метки указывают на одно время.

hogstaberg Jul 7 2025 at 07:22

timestamp хранится не в UTC, там будет аккурат то значение, которое вы передали. И т.к. ему неизвестно в какой зоне вы находитесь, то будет неизвестно какой это момент времени в UTC. Хранись там всегда utc, проблем было бы существенно меньше.

timestamptz хранит ещё и зону в которой вы записали timestamp, поэтому вы можете посчитать время в любой нужной зоне.

Evengard Jul 7 2025 at 17:37

timestamptz не хранит зону. Если бы хранила... Без указания зоны постгрес просто молча сконвертирует время так как будто оно в таймзоне сервера (или сессии, если оверрайднуто) и запишет в UTC.

hogstaberg Jul 7 2025 at 21:36

Туше. Я криво сформулировал, считайте меня не читающим маны дезинформатором. timestamptz не хранит зону. Оно учитывает зону. А хранит UTC.

shurutov Jul 1 2025 at 04:04

varchar(n) vs text в более расширенном варианте:
https://ru-postgres.livejournal.com/65930.html .

уж сколько раз твердили миру...

Но timestamp without timezone, в лучшем случае, а то ведь есть товарищи, которые таймстампы в bigint хранят! и varchar(n) - в каждом первом проекте. И смотреть на миграции, в которых прилично DROP VIEW, DROP FUNCTION потому что надо изменить размер поля varchar(n) - это БОЛЬНО. А с учётом того, что людишки, просмотрев материал выше, продолжают творить дичь из релиза в релиз, не утруждая себя сменить тип на нормальный...

hogstaberg Jul 1 2025 at 10:44

есть товарищи, которые таймстампы в bigint хранят! и varchar(n) - в каждом первом проекте.

У них просто флэшбэки от старых версий mysql)

0pel Jul 1 2025 at 05:49

По поводу timestamp когда-то читал диаметрально противоположное мнение. В документации написано, что timestamp, с зоной или без зоны, хранится в UTC, если зона не указана, для конвертации используется системная. В итоге, главное скормить время с временной зоной, а в каком типе оно будет храниться - неважно.

lxvkw Jul 1 2025 at 10:20

Полагаю, что для большинства задач удобно работать с абсолютным временем.

Другое дело, что есть те же пассажирские перевозки (авиа) где очень важно хранить информацию о локальном времени. Для такой специфики можно использовать два поля: timestamp_local & timestamp_utc

OlegIct Jul 1 2025 at 16:19

timestamptz хранит в UTC. timestamp сохраняет значение как есть (без преобразований), не отображает часовой пояс, не использует временную зону, timestamptz
отображает и выполняет вычисления во временной зоне, задаваемой параметром timezone:

timestamptz хранится в UTC, timestamp "как есть"

timestamp, timestamptz не хранят часовой пояс, значения физически хранятся в одинаковом виде, занимают 8 байт.

DrZlodberg Jul 1 2025 at 08:28

Последний пример максимально странный. Вы бы ещё '{"color":0}' вот с этим '<important-property><property-name>color</property-name><property-value>00000</property-value></important-property>' сравнили. Тогда эффект был бы ещё заметнее.

Понятно, что XML более многословен, чем JSON, однако в данном примере можно и просто '<color>0</color>'Или добавить корень, если это более сложный объект. Так уже не столь катастофично смотрится.

RustamKuramshin Jul 1 2025 at 13:22

Тут есть момент, что подразумевается сравнение структурированного хранения ключ-значение. Автор приводит пример ключ-значение на XML и JSON. В итоге очевидно, что в XML больше синтаксических обвесов для этого надо. Суть сравнения именно в этом. Использовать в качестве ключа сам тег не всегда подойдет.

DrZlodberg Jul 2 2025 at 18:26

Это не однозначно очевидно. Объекты в json тоже сериализуются так. В данном случае имеем список свойств (на что прямо указывает тэг property), которые вполне могут быть свойствами объекта. Т.е. могут быть заменены на тэги.
Если нужет компактный список ключ-значение - ничто не мешает их хранить в виде <k>key</k><v>value</v> или даже <property key="k" value="v"/>. Разница уже опять не столь драматическая.
Сам факт сравнения "0" и "000000" крайне прозрачно намекает, что никакого честного сравнения не предполагалось.

chemtech Jul 1 2025 at 15:27

А есть ли какая нибудь утилита, которой указываешь Postgresql и она показывает в выводе какие типы данных нужно поправить?

bartov-e Oct 11 2025 at 18:59

Спасибо за обзор, хотел сам что-то подобное написать. Скоро, думаю, книга появится на русском языке, на этой неделе заканчиваю ее перевод (по заказу издательства «Питер»).

Помимо описанных типов данных, автор в конце книги еще довольно развернуто пишет про "глюки", которые могут вызвать разные реализации булевых типов в известных СУБД при миграции в Postgres.

RustamKuramshin Oct 11 2025 at 19:02

Здорово. Как называется, если не секрет?

bartov-e Oct 11 2025 at 19:28

Книга? Или глава про булевы типы?

Книга в договоре указана как "100 ошибок PostgreSQL и как их избежать (PostgreSQL Mistakes and How to Avoid Them), автор Джимми Ангелакос (Jimmy Angelakos) ", это рабочее название, с каким названием дойдет до печати - не знаю, это от переводчика не зависит.

RustamKuramshin Oct 11 2025 at 20:09

А, так это та самая книга. Понял.