Базы данных *

Все об администрировании БД

СтатьиПостыНовостиАвторыКомпании

sergiorussia 3 апр 2024 в 07:00

Как мы переехали с Oracle на PostgreSQL в нагруженном сервисе без даунтайма

Средний

30 мин

28K

Блог компании ЯндексOracle*PostgreSQL*Базы данных*

Кейс

✏️ Технотекст 7

Всем привет! Я Сергей, работаю в B2B-команде Яндекс Маркета последние 3,5 года. Как уже понятно из заголовка, сейчас я вам расскажу про yet-another-миграцию с базы на базу, которая началась в середине 2021 года и заняла почти год. Получается, мемуары.

Вас ждёт рассказ о том, как мы:

- несколько месяцев чинили тесты и делали трансформер;

- десятки раз переливали данные;

- чинили баги незаметно для пользователей;

- заставили сервис работать на PostgreSQL быстрее, чем он работал на Oracle.

+91

dmserebr 9 ноя 2023 в 15:41

Почему вам стоит отказаться от использования timestamp в PostgreSQL

10 мин

77K

Базы данных*Программирование*PostgreSQL*

Из песочницы

Не секрет, что работа с часовыми поясами — боль, и многие разработчики объяснимо стараются ее избегать. Тем более что в каждом языке программирования / СУБД работа с часовыми поясами реализована по-разному.

Среди тех, кто работает с PostgreSQL, есть очень распространенное заблуждение про типы данных timestamp (который также именуется timestamp without time zone) и timestamptz (или timestamp with time zone). Вкратце его можно сформулировать так:

Мне не нужен тип timestamp with time zone, т.к. у меня все находится в одном часовом поясе — и сервер, и клиенты.

В статье я постараюсь объяснить, почему даже в таком довольно простом сценарии можно запросто напороться на проблемы. А в более сложных (которые на самом деле чаще встречаются на практике, чем может показаться) баги при использовании timestamp практически гарантированы.

+90

136

olemskoi 3 фев 2017 в 06:56

sudo rm -rf, или Хроника инцидента с базой данных GitLab.com от 2017/01/31

15 мин

68K

Блог компании СлёрмIT-инфраструктура*Серверное администрирование*Системное администрирование*Базы данных*

Перевод

Он пьянел медленно, но все-таки опьянел, как-то сразу, скачком; и когда в минуту просветления увидел перед собой разрубленный дубовый стол в совершенно незнакомой комнате, обнаженный меч в своей руке и рукоплещущих безденежных донов вокруг, то подумал было, что пора идти домой. Но было поздно.

Аркадий и Борис Стругацкие

31 января 2017 года произошло важное для мира OpenSource событие: один из админов GitLab.com, пытаясь починить репликацию, перепутал консоли и удалил основную базу PostgreSQL, в результате чего было потеряно большое количество пользовательских данных и сам сервис ушел в офлайн. При этом все 5 различных способов бэкапа/репликации оказались нерабочими. Восстановились же с LVM-снимка, случайно сделанного за 6 часов до удаления базы. It, как говорится, happens. Но надо отдать должное команде проекта: они нашли в себе силы отнестись ко всему с юмором, не потеряли голову и проявили удивительную открытость, написав обо всем в твиттере и выложив в общий доступ, по сути, внутренний документ, в котором команда в реальном времени вела описание разворачивающихся событий.

Во время его чтения буквально ощущаешь себя на месте бедного YP, который в 11 часов вечера после тяжелого трудового дня и безрезультатной борьбы с Постгресом, устало щурясь, вбивает в консоль боевого сервера роковое sudo rm -rf и жмет Enter. Через секунду он понимает, что натворил, отменяет удаление, но уже поздно — базы больше нет...

По причине важности и во многих смыслах поучительности этого случая мы решили целиком перевести на русский язык его журнал-отчет, сделанный сотрудниками GitLab.com в процессе работы над инцидентом. Результат вы можете найти под катом.

Читать дальше →

+81

129

RukInDaHouse 2 ноя 2023 в 11:56

Это база: нюансы работы с Redis. Часть 1

Средний

15 мин

56K

Блог компании NixysDevOps*Базы данных*NoSQL*Системное администрирование*

Обзор

✏️ Технотекст 2023

Привет! Меня зовут Петр и мы в компании Nixys очень любим Redis. Эта база используется, если не на каждом нашем проекте, то на подавляющем большинстве. Мы работали как с разными инсталляциями Redis, так и с разными версиями, вплоть до самых дремучих, вроде 2.2. Несмотря на то, что в Интернете очень много статей и докладов по этой БД, мы в своей практике достаточно часто встречаемся с непониманием некоторых основных концепций Redis и со стороны разработчиков, и со стороны системных администраторов.

В серии статей я попытаюсь осветить неочевидные нюансы при работе с Redis и сегодня начну с основных концепций и понятий. А еще в конце статьи приведу небольшой чек-лист, который может помочь вам в оптимизации этого NoSQL решения.

+79

GrishinAlex 29 мая в 12:00

Как оптимизировать PostgreSQL и не лишиться сна: разбор для разработчиков

Средний

12 мин

17K

Блог компании SelectelPostgreSQL*Базы данных*Облачные сервисы*Системное администрирование*

Мнение

Когда вы разворачиваете веб-приложение, чаще всего у вас веб-сервер, бэкенд, база данных и авторизация оказываются на одном сервере. Первые пользователи, обычно тестировщики и менеджер, счастливы — все летает. Но потом приложение выходит в продакшн и начинается боль. Запросы тормозят и отвечают по пять секунд, CPU не загружен даже на треть, веб-сервер швыряет 504 Gateway Timeout и т. д. И вот вы сидите ночью и чините прод, потому что PostgreSQL — не просто «табличка с данными», а сложный инструмент с кэшем, индексами, буферами и планировщиком запросов.

Привет, Хабр! Меня зовут Александр Гришин, я руководитель по развитию продуктов хранения данных в Selectel и отвечаю за облачные баз данных и объектное S3 хранилище. В работе я часто сталкиваюсь с вопросами о производительности PostgreSQL, поэтому собрал практические советы для разработчиков, инженеров и архитекторов облачной инфраструктуры. В статье рассмотрим, как правильно использовать индексы, анализировать планы выполнения запросов и избегать типичных ошибок при проектировании схемы. Погнали!

Читать дальше →

+78

alekskram 30 окт 2022 в 15:08

Топ полезных SQL-запросов для PostgreSQL

7 мин

114K

PostgreSQL*SQL*Базы данных*Хранение данных*

Технотекст 2022

Статей о работе с PostgreSQL и её преимуществах достаточно много, но не всегда из них понятно, как следить за состоянием базы и метриками, влияющими на её оптимальную работу. В статье подробно рассмотрим SQL-запросы, которые помогут вам отслеживать эти показатели и просто могут быть полезны как пользователю.

+78

GrishinAlex 27 мая в 08:17

Все, что нужно PostgreSQL: быстрые диски, дорогой процессор и терабайты RAM

Средний

13 мин

18K

Блог компании SelectelPostgreSQL*Базы данных*Облачные вычисления*Облачные сервисы*

Мнение

В облачном мире PostgreSQL возникает много вопросов. Какую конфигурацию выбрать для старта кластера? Сколько оперативной памяти и ядер CPU нужно под мою базу данных? Нужны ли под такой профиль нагрузки высокочастотные процессоры? Какое должно быть соотношение RAM к Storage в кластере? Хватает ли ресурсов и на системные службы, и на кэширование запросов? Не переплачиваю ли я?

Всем привет! Меня зовут Гришин Александр, я руководитель по развитию продуктов хранения данных в Selectel, отвечаю за объектное S3-хранилище и облачные базы данных. В этой статье я поделюсь своими практическими рекомендациями и ориентирами по планированию использования ресурсов кластера в PostgreSQL — в зависимости от типа и профиля нагрузки, размера данных и характера доступа к ним. Погнали!

Читать дальше →

+76

andreios 6 фев 2020 в 08:25

KeyDB как [потенциальная] замена Redis

6 мин

43K

Блог компании ФлантNoSQL*Open source*Базы данных*Системное администрирование*

На хабре не нашлось обзоров «более быстрой альтернативы Redis» — KeyDB. Получив достаточно свежий опыт его использования, хочется восполнить этот пробел.

Предыстория достаточно банальна: однажды с большим наплывом трафика была зафиксирована значительная деградация производительности приложения (а именно — времени ответа). На тот момент, к сожалению, не удалось провести нормальную диагностику происходящего, поэтому впоследствии запланировали ряд нагрузочных тестирований. После их проведения удалось обнаружить узкое место, коим стал кэш базы данных в Redis. Как это часто бывает, проблему нельзя было решить сию секунду и правильным путём — силами разработчиков (изменением логики работы). Поэтому включилось любопытство и желание побороть ситуацию обходным путём. Так и появилась эта статья.

Читать дальше →

+76

olegbunin 10 июн 2019 в 07:35

Топ ошибок со стороны разработки при работе с PostgreSQL

21 мин

53K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL*Базы данных*Высоконагруженные системы*Серверная оптимизация*

HighLoad++ существует давно, и про работу с PostgreSQL мы говорим регулярно. Но у разработчиков все равно из месяца в месяц, из года в год возникают одни и те же проблемы. Когда в маленьких компаниях без DBA в штате случаются ошибки в работе с базами данных, в этом нет ничего удивительного. В крупных компаниях тоже нужны БД, и даже при отлаженных процессах все равно случаются ошибки, и базы падают. Неважно, какого размера компания — ошибки все равно бывают, БД периодически обваливаются, рушатся.

С вами такого, конечно, никогда не случится, но проверить чек-лист не трудно, а сэкономить будущих нервов он может очень прилично. Под катом перечислим топ типичных ошибок, которые совершают разработчики при работе с PostgreSQL, разберемся, почему так делать не надо, и выясним, как надо.

О спикере: Алексей Лесовский (lesovsky) начинал системным администратором Linux. От задач виртуализации и систем мониторинга постепенно пришел к PostgreSQL. Сейчас PostgreSQL DBA в Data Egret — консалтинговой компании, которая работает с большим количеством разных проектов и видит много примеров повторяющихся проблем. Это ссылка на презентацию доклада на HighLoad++ 2018.

Читать дальше →

+75

postgres 24 окт 2017 в 08:13

Курс молодого бойца PostgreSQL

13 мин

555K

PostgreSQL*SQL*Базы данных*Программирование*

Туториал

Хочу поделиться полезными приемами работы с PostgreSQL (другие СУБД имеют схожий функционал, но могут иметь иной синтаксис).

Постараюсь охватить множество тем и приемов, которые помогут при работе с данными, стараясь не углубляться в подробное описание того или иного функционала. Я любил подобные статьи, когда обучался самостоятельно. Пришло время ~~отдать должное бесплатному интернет самообразованию и~~ написать собственную статью.

Данный материал будет полезен тем, кто полностью освоил базовые навыки SQL и желает учиться дальше. Советую выполнять и экспериментировать с примерами в pgAdmin'e, я сделал все SQL-запросы выполнимыми без разворачивания каких-либо дампов.

Поехали!

Читать дальше →

+75

Bright_Translate 6 дек 2024 в 13:01

О векторных базах данных простым языком

Средний

6 мин

26K

Блог компании RUVDS.comPython*Базы данных*Машинное обучение*Управление e-commerce*

Обзор

Перевод

Представьте, что управляете онлайн-магазином, предлагающим тысячи товаров.

Чтобы помочь пользователям находить нужные позиции, вы добавили строку поиска. Теперь посетители могут вводить интересующие их запросы, на что вы будете показывать им подходящие результаты.

Например, когда пользователь вводит «лето», вы можете показывать предметы вроде шортов, платьев, панам и пляжных зонтов.

Как бы вы реализовали такую систему?

Читать дальше →

+70

ashotog 30 мая 2019 в 04:16

Опять сотни тысяч платежей граждан в ГИБДД и ФССП находились в открытом доступе

2 мин

36K

IT-инфраструктура*Базы данных*Информационная безопасность*Платежные системы*

Помните я писал на Хабре и у себя в Telegram-канале, как в открытом доступе оказались подробности платежей в пользу ГИБДД и ФССП пользователей сайтов оплатагибдд.рф, paygibdd.ru, gos-oplata.ru, штрафов.net и oplata-fssp.ru?

Только не надо смеяться, это вовсе не шутка — тот же самый сервер с данными той же самой системы снова оказался открытым для всего мира.

Ну что, поехали разбираться…

Читать дальше →

+70

orlov-pg 15 янв в 09:33

Как я сделал PR на 14К строк в проект YDB будучи студентом

12 мин

13K

Блог компании ЯндексБлог компании YDBБазы данных*SQL*

✏️ Технотекст 7

В этой статье я хотел бы рассказать о задаче, решение которой легло в основу моей дипломной работы. На момент ноября 2023 года я был студентом Физтеха — учился на базовой кафедре Яндекса, программа обучения которой реализуется совместно с ШАДом. Задача заключалась в переводе парсера языка запросов YQL (диалект SQL для YDB и YTsaurus) с ANTLR3 на ANTLR4. Мой наставник в ШАД и руководитель команды разработки клиентских библиотек YDB в Яндексе к. т. н. Алексей Мясников @asmyasnikovотметил еёе как особо сложную. Но меня это не отпугнуло:, тема работы из всех тем, предложенных в ШАД, эта показалась самой интересной и близкой мне.

+69

alpl8 26 дек 2024 в 08:28

Как проводить сложные исследования в Google Таблицах и Excel? Работаем с формулой QUERY

10 мин

15K

Блог компании SelectelБазы данных*Программирование*Софт

✏️ Технотекст 7

Привет, Хабр! Раньше ни один мой рабочий день не проходил без Google Таблиц. Теперь продолжаю использовать инструмент только в личных целях, но в его аналогах многое очень похоже.

Меня зовут Саша, я координатор отдела пользовательских исследований в Selectel. В этой статье я объясню, как и какие формулы использовать в таблицах, чтобы работать с большими объемами данных.

Читать дальше →

+67

mizhka 3 мар 2023 в 13:11

Аномалии под нагрузкой в PostgreSQL: о чём стоит помнить и с чем надо бороться

14 мин

31K

Блог компании Postgres ProfessionalВысоконагруженные системы*PostgreSQL*Базы данных*

Из песочницы

В этой статье мы разберём несколько аномальных случаев высокой нагрузки в СУБД PostgreSQL. Что это такое? Обычно PostgreSQL хорошо показывает себя под нагрузкой и оправдывает ожидания в отношении производительности — она остаётся высокой. Но при определённых профилях нагрузки СУБД может вести себя не так, как мы ожидаем. Это и есть аномалии, на которых мы сосредоточимся в данной статье (для тех, кто предпочитает видео, эта информация доступна в виде записи доклада на HighLoad++).

Наша компания помогает обслуживать мультитерабайтные базы данных в крупных проектах, поэтому мой рассказ об аномалиях основан на реальном опыте промышленной эксплуатации СУБД в Postgres Professional — порой мы сталкиваемся с тем, что СУБД ведёт себя не так, как мы ожидали.

Также в рамках статьи мы рассмотрим следующее:

+67

maxkokryashkin 5 сен 2023 в 10:31

Как профилировать, когда perf видит не все

11 мин

6.2K

Блог компании VKВысоконагруженные системы*Базы данных*Tarantool*

В современных системах интерпретаторы используются повсеместно. Для проверки на соответствие ожиданиям по производительности их необходимо профилировать. Но когда значительная часть логики исполняется встроенным интерпретатором, окинуть взглядом общую картину при профилировании становится крайне затруднительно, потому что существующие инструменты не способны отражать переходы между интерпретируемой и нативной частями системы.

Читать дальше →

+66

Wimbo 26 мая 2020 в 06:27

Больше разработчиков должны знать это о базах данных

19 мин

44K

Блог компании ФлантБазы данных*Программирование*

Перевод

Прим. перев.: Jaana Dogan — опытный инженер из Google, которая в данный момент занимается вопросами наблюдаемости production-сервисов компании, написанных на Go. В этой статье, снискавшей большую популярность у англоязычной аудитории, она в 17 пунктах собрала важные технические детали, касающиеся СУБД (а иногда — распределённых систем в целом), которые полезно учитывать разработчикам крупных/требовательных приложений.

Подавляющее большинство компьютерных систем отслеживают свое состояние и, соответственно, нуждаются в некой системе хранения данных. Я накапливала знания о базах данных в течение длительного времени, попутно совершая ошибки при проектировании, приводившие к потере данных и перебоям в работе. В системах, обрабатывающих большие объемы информации, базы данных лежат в сердце системной архитектуры и выступают ключевым элементом при выборе оптимального решения. Несмотря на то, что работе БД уделяется пристальное внимание, проблемы, которые пытаются предусмотреть разработчики приложений, часто оказываются лишь верхушкой айсберга. В этой серии статей я делюсь некоторыми идеями, которые будут полезны для разработчиков, не специализирующихся в этой области.

Читать дальше →

+66

Loxmatiymamont 18 дек 2024 в 11:00

Будущее PostgreSQL: как 64-битный счетчик транзакций решает проблему масштабирования

Средний

7 мин

13K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*SQL*Системное программирование*

✏️ Технотекст 7

Много лет в комьюнити PostgreSQL никто не верил что эта СУБД в принципе может использоваться в системах с большой транзакционной нагрузкой. То есть, какие-то тестовые лаборатории, бэкенд веб-приложений средней руки и так далее — вот его типичные задачи. А когда нужна серьёзная нагрузка, это уже надо брать СУБД за много денег и не сомневаться. Ну и раз никто не верил, то и не развивал особенно его в эту сторону, оставляя всё больше повисших в воздухе вопросов.

Но на практике вышло так, что наши клиенты всё чаще сталкиваются с проблемами, которые породил этот подход. Например, в международном комьюнити постгреса считается, что 64 ядра — это предельный размер сервера, где его вообще можно запустить. А мы всё чаще видим, что это становится минимальной типовой конфигурацией. Другим таким узким местом стал счётчик транзакций, ситуация с которым намного более интересная. Поэтому о нём мы сегодня и поговорим. В чём там проблема, как мы её решили, и что на эту тему думает международное комьюнити.

+65

GrishinAlex 29 авг 2023 в 11:17

Нужна ли вам Kafka? Разбираемся в технологии и собираем простое приложение на базе managed-решения

16 мин

46K

Блог компании SelectelХранение данных*Распределённые системы*Базы данных*Python*

FAQ

✏️ Технотекст 2023

Я Гришин Александр продакт менеджер Облачных Баз данных Selectel. Сегодня расскажу о нашей новой услуге. Kafka — стильная, модная, молодежная технология, которую разработала в 2011 году компания LinkedIn и значительно усовершенствовал Apache Software Foundation. Представляет собой надежный, масштабируемый и устойчивый инструмент для обработки и передачи данных в режиме реального времени — шину данных.

Но нужно ли внедрять технологию в угоду моде или амбициям вашего продуктового менеджера? Под катом расскажу про сильные стороны Kafka и задачи, в которых она раскрывается по максимуму. Также напишем быстрое приложение на базе Kafka-as-a-service, которую мы недавно релизнули в Selectel.

Читать дальше →

+65

michael-filonenko 1 апр 2021 в 14:04

Tarantool vs Redis: что умеют in-memory технологии

15 мин

40K

Блог компании VKNoSQL*Tarantool*Базы данных*

В этой статье я хочу сравнить Redis и Tarantool. У меня нет цели сделать громогласный вывод «Tarantool лучше!» или «Redis круче!». Я хочу понять их сходства и отличия, разобраться, для каких задач какую технологию выбрать. Потому что это очень близкие на первый взгляд вещи, и вопросы про их отличия я вижу часто.

Для этого мы посмотрим на технологии в трёх частях:

Вначале посмотрим глазами новичка. Что такое БД в памяти? Какие задачи они решают лучше дисковых БД?
Потом посмотрим архитектурно. Как обстоит вопрос с производительностью, надёжностью, масштабированием?
В третьей части лезем в технические вещи поглубже. Типы данных, итераторы, индексы, транзакции, ЯП, репликация, коннекторы.

Смело переходите сразу к наиболее интересной вам части. Или даже сразу к итоговой табличке сравнения, которую я прикладываю в заключении.

Поехали!

Читать дальше →

+65

3 4 ...

83 84

Базы данных *

Как мы переехали с Oracle на PostgreSQL в нагруженном сервисе без даунтайма

Почему вам стоит отказаться от использования timestamp в PostgreSQL

sudo rm -rf, или Хроника инцидента с базой данных GitLab.com от 2017/01/31

Это база: нюансы работы с Redis. Часть 1

Как оптимизировать PostgreSQL и не лишиться сна: разбор для разработчиков

Топ полезных SQL-запросов для PostgreSQL

Все, что нужно PostgreSQL: быстрые диски, дорогой процессор и терабайты RAM

KeyDB как [потенциальная] замена Redis

Топ ошибок со стороны разработки при работе с PostgreSQL

Курс молодого бойца PostgreSQL

О векторных базах данных простым языком

Опять сотни тысяч платежей граждан в ГИБДД и ФССП находились в открытом доступе

Как я сделал PR на 14К строк в проект YDB будучи студентом

Ближайшие события

Как проводить сложные исследования в Google Таблицах и Excel? Работаем с формулой QUERY

Аномалии под нагрузкой в PostgreSQL: о чём стоит помнить и с чем надо бороться

Как профилировать, когда perf видит не все

Больше разработчиков должны знать это о базах данных

Будущее PostgreSQL: как 64-битный счетчик транзакций решает проблему масштабирования

Нужна ли вам Kafka? Разбираемся в технологии и собираем простое приложение на базе managed-решения

Tarantool vs Redis: что умеют in-memory технологии

Вклад авторов