Базы данных *

Все об администрировании БД

СтатьиПостыНовостиАвторыКомпании

stebunovd 4 мая 2022 в 03:07

Мигрируем БД в продакшене без даунтайма

12 мин

28K

Веб-разработка*Базы данных*DevOps*

Перевод

В этой статье мы рассмотрим основные принципы миграции БД без даунтайма и дадим быстрые рецепты для наиболее распространенных случаев.

+57

codesign 11 июн 2021 в 09:35

Архитектура in-memory СУБД: 10 лет опыта в одной статье

14 мин

27K

Блог компании VKTarantool*Базы данных*Высоконагруженные системы*

База данных в оперативной памяти — понятие не новое. Но оно слишком плотно ассоциируется со словами «кэш» и «не персистентный». Сегодня я расскажу, почему это не обязательно так. Решения в памяти имеют гораздо более широкое поле применения и гораздо более высокий уровень надежности, чем кажется на первый взгляд.

В статье я рассуждаю об архитектурных принципах решений в оперативной памяти. Как можно взять лучшее от in-memory мира — производительность невероятного уровня — и не жертвовать достоинствами дисковых реляционных систем. В первую очередь, надежность — как можно быть уверенным в сохранности данных.

Этот рассказ сжимает 10 лет опыта работы с in-memory решениями в один текст. Порог входа максимально низкий. Чтобы получить пользу от прочтения, вам не нужно иметь столько же лет опыта, достаточно базового понимания IT.

Читать дальше →

+57

Karlovn 1 авг 2024 в 11:13

Как организовать анализ большого объема данных в реальном времени

8 мин

8.3K

Блог компании VKВысоконагруженные системы*Базы данных*Распределённые системы*Tarantool*

С ростом сложности ИТ-систем и задач аналитики изменяются требования и к возможностям инструментов. Для многих сценариев приоритетными становятся решения, которые могут работать как с историческими данными, так и с теми, которые обновляются в реальном времени. То есть аналитикам все чаще нужен инструмент, работающий на стыке возможностей транзакционных и аналитических (OLAP и OLTP) систем.

Меня зовут Николай Карлов. Я директор инновационных проектов в VK Tech. В этой статье я расскажу, что такое HTAP-системы, какие преимущества они предоставляют, и познакомлю с нашей колоночной СУБД Tarantool Column Store, которая реализует HTAP-обработку.

Статья подготовлена по мотивам вебинара «Анализируем данные в Real-time». Его вы можете посмотреть здесь.

+56

1div0 22 июн 2022 в 10:15

Как мы сжимаем данные в больших проектах

6 мин

13K

Блог компании VKРаспределённые системы*Базы данных*Высоконагруженные системы*Tarantool*

Привет! Меня зовут Александр Кленов, и я работаю в Tarantool. В апреле вышел Tarantool 2.10 Enterprise Edition – обновленная версия платформы in-memory вычислений. В версии 2.10 появилось несколько новых функций, о которых уже немного рассказывали на Хабре.

В этой статье я хочу подробнее остановиться на одной из фичей — сжатии данных в оперативной памяти. Далее я расскажу, как ей пользоваться, что может, а чего не может данный механизм, как его применять и какие существуют особенности.

+56

alizar 21 окт 2024 в 09:01

Почему СУБД такие медленные

Средний

11 мин

39K

Блог компании RUVDS.comPostgreSQL*SQL*Базы данных*Высоконагруженные системы*

Обзор

Недавно на Хабре публиковался перевод статьи «Просто выберите Postgres» (оригинал, англ. яз) с аргументами, что Postgres — оптимальная БД для десктопных и мобильных приложений. Аналогичное мнение высказывают в других популярных статьях вроде «До свидания MongoDB, здравствуй PostgreSQL». Главным недостатком SQLite называют то, что данные хранятся в одном файле, а MongoDB (а также DynamoDB и Cassandra) — низкую производительность:

«Всё это связано с тем, что подобные базы данных, по сути, представляют собой огромную распределённую хеш-таблицу. Единственные операции, работающие без необходимости сканирования всей базы данных — это поиск по секционному ключу и сканы, при которых используется ключ сортировки.

…Если паттерны доступа существенно изменятся, то может потребоваться полная повторная обработка всех данных».

Более производительные резидентные БД хранят данные в памяти (Redis, Valkey), но их использование ограничено объёмом ОЗУ.

После такого заявления интересно посмотреть на независимые тесты производительности разных СУБД.

Читать дальше →

+55

toxicmt 1 июл 2024 в 14:46

Как я положил продакшен базу на выходных

Простой

3 мин

23K

Веб-разработка*Базы данных*Laravel*

Ретроспектива

Вчера произошла эпическая история. После планового деплоя в субботу вечером (так было нужно), мне прилетело сообщение “кирилл, у нас почему-то не показываются заявки”. Наверное фильтры слетели, подумал я и пошел проверять. Фильтры не слетели. Я слегка напрягся и пошел в яндекс клауд посмотреть что там в базе. Как я и боялся, таблицы были пустыми. Причем не все, но многие. Самое интересное, что они были не просто пустыми, но у них сбросились счетчики.

Увидел я это не сразу после деплоя, поэтому было не до конца понятно, это деплой привел к удалению данных или что-то другое. Я быстро восстановил снепшот на новом кластере, благо это делается одним кликом и выполнил туда деплой заново. Какого было мое удивление, когда после деплоя база очистилась. Какого хрена подумал я, прикидывая, что могло быть причиной. В этот момент ко мне присоединился второй разработчик проекта, с которым мы весело провели 3 часа за дебагом.

Сам деплой был необычным, потому что мы выкатывали большое изменение для обработки заявок основного договора (до этого работало только раннее бронирование). Туда входило и много кода и около 40 миграций и обновления зависимостей и новая конфигурация. Но мы точно не добавляли код, который бы грохал половину базы (как нам тогда казалось, хаха).

Дальше мы полезли изучать код на предмет подозрительных вещей:

+55

PatientZero 5 июн 2024 в 08:37

Вы пожалеете об использовании естественных ключей

Простой

5 мин

21K

SQL*Базы данных*Хранение данных*

Мнение

Перевод

Хотя я живу в Копенгагене и в основном перемещаюсь по городу на велосипеде, у меня есть и машина, чтобы добираться до других частей страны. В Дании автомобили через каждые два года проходят обязательный официальный осмотр; я проходил его за свою жизнь несколько раз. Несколько лет назад механик, выполнявший осмотр, сообщил мне о том, что у машины неправильный номер кузова.

Я немного занервничал, потому что покупал машину с рук, и внезапно задался вопросом, действительно ли всё так, как я думал. Неужели я непреднамеренно купил краденную машину?

Но механик просто подошёл к своему компьютеру, чтобы исправить ошибку. И тогда у меня возникло совершенно другое опасение. Когда программируешь больше десятка лет, то учишься предвидеть разные типичные режимы отказа. Так как номер кузова — очевидный кандидат на должность естественного ключа, я заранее предвидел, что изменение этого номера будет или невозможно, или приведёт ко всевозможным каскадным эффектам, и в конечном итоге к уничтожению официальных записей, больше не признающих, что машина принадлежит мне.

+55

126

JetHabr 29 авг 2022 в 10:51

«Надо переехать с Oracle на PostgreSQL. Ты только не волнуйся!»

8 мин

26K

Блог компании Инфосистемы ДжетOracle*PostgreSQL*Базы данных*

С этого сообщения в мессенджере началось мое масштабное расследование вопроса, который давно не дает спать многим айтишникам — можно ли вот так взять и переехать с Oracle на «свободную» СУБД PostgreSQL?

Этот вопрос сначала бередил умы только тех, кто был в курсе стоимости закупок лицензий. В крупных компаниях бюджет на это мог составлять несколько десятков миллионов долларов. А потом каждый год поддержка вендора «съедала» ещё 22% от стоимости лицензий. Теперь та финансовая боль сменилась другой, и у компаний поменялся запрос: а можно ли заменить? И главное, можно ли организовать это в разумные сроки и по адекватной стоимости?

Скажу сразу, что в этом посте не будет технических аспектов миграции с СУБД Oracle на PostgreSQL. Как это делать и как обходить сложности — разберем в следующий раз. Тут же больше поговорим о целесообразности и возможности миграции. С этим мы разбирались в ходе одного проекта, а заодно развенчали строй существующих иллюзий.

Красная таблетка

+55

zen 23 янв 2022 в 21:26

Борьба с TOAST или будущее JSONB в PostgreSQL

9 мин

24K

Блог компании Конференции Олега Бунина (Онтико)Высоконагруженные системы*PostgreSQL*Базы данных*Хранение данных*

В PostgreSQL есть два типа данных: JSON и JSONB. Первый формат является текстовым хранилищем, в котором json хранится "as is", второй — бинарным, в нем ключи отсортированы (сначала по длине ключа, а потом по его названию), дубликаты удалены, а пробелы удалены.

Тип JSONB имеет богатую поддержку, облегчающую работу разработчиков приложений, для него есть встроенные индексы, кроме того, существует расширение Jsquery, в котором реализован язык запросов к JSONB и дополнительные индексы. Когда у меня спрашивают, чем пользоваться, я всегда советую JSONB, так как он позволяет работать очень эффективно.

Однако у постгреса есть серьёзная проблема, которая сказывается и на производительности JSONB — это TOAST, и о ней я говорил в первой части. Сегодня я расскажу о том, как мы улучшили JSONB для того, чтобы существенно повысить его производительность.

+55

Tzimie 30 мар 2021 в 13:05

Неотправленное письмо боссу в кровавом Enterprise

5 мин

24K

Базы данных*Карьера в IT-индустрииDevOps*

Технотекст 2021

Хоть я и интроверт, но с soft skills у меня неплохо. Поэтому я стараюсь придерживаться принципа:

True wisdom: 1. Having a lot to say. 2. Not saying it.

Вариацией пункта 2 являются неотправленные письма менеджерам. Для ускорения процесса они пишутся в голове. Однако иногда хочется поделиться рассуждениями, чтобы не держать все в себе.

+55

GeorgyK 12 фев 2019 в 07:07

Репликация в Tarantool: конфигурирование и использование

16 мин

7.5K

Блог компании VKNoSQL*Tarantool*Базы данных*

Я вхожу в Tarantool Core Team и участвую в разработке движка базы данных, внутренних коммуникаций компонентов сервера и репликации. И сегодня расскажу, как устроена репликация.

Читать дальше →

+55

Maksvelis 8 июн 2023 в 09:41

Кто мощнее в базах данных? Сравниваем производительность БД на серверах с ARM- и x86-процессорами

Средний

15 мин

16K

Блог компании SelectelБазы данных*PostgreSQL*MySQL*IT-инфраструктура*

Аналитика

✏️ Технотекст 2023

Всем привет! Ранее я разобрал и протестировал сервер с процессором ARM, который попал к нам в Selectel Lab. Сервер показал хорошие результаты по производительности в ряде классических тестов, но в этот раз захотелось проверить его в боевой задаче — в работе с базами данных. Быть может, архитектура ARM-процессора сделает всех конкурентов на этой территории?

Чтобы ответить на этот вопрос, протестировал ARM вместе с семеркой серверов разных конфигураций с процессорами Intel и AMD. В качестве баз данных для нашего эксперимента выбрал самые популярные — PostgreSQL и MySQL. Результаты тестов с графиками и комментариями — под катом. Надеюсь, они будут полезны вам при выборе сервера под БД.

Читать дальше →

+54

EasyGrow 5 сен 2019 в 11:06

Kafka и микросервисы: обзор

9 мин

124K

Блог компании AvitoTechМикросервисы*Хранение данных*Базы данных*

Всем привет. В этой статье я расскажу, почему мы в Авито девять месяцев назад выбрали Kafka, и что она из себя представляет. Поделюсь одним из кейсов использования — брокер сообщений. И напоследок поговорим о том, какие плюсы мы получили от применения подхода Kafka as a Service.

Читать дальше →

+53

109

GrishinAlex 17 мар в 12:12

OpenSearch как сервис: обзор и тривиальный пример использования на Python

Простой

7 мин

12K

Блог компании SelectelPython*Базы данных*Облачные сервисы*Хранение данных*

Обзор

Привет, Хабр! Проблема традиционных реляционных баз данных в том, что они не всегда справляются с обработкой огромных объемов информации. Вот вам нужно быстро найти, проиндексировать и проанализировать логи, события или метрики, но вы упираетесь в ограничения масштабируемости, автошардирования и скорости обработки запросов специфического профиля нагрузки. Знакомо?

Меня зовут Гришин Александр, я продакт-менеджер в Selectel и отвечаю за развитие объектного хранилища и облачных баз данных. В этой статье расскажу, как описанные проблемы решает OpenSearch, как развернуть кластеры этой платформы за несколько минут и начать с ней работать в Python.

Читать дальше →

+52

mvideo 29 окт 2021 в 13:31

Архитектурные паттерны в распределенных высоконагруженных системах

8 мин

21K

Блог компании М.Видео-ЭльдорадоСжатие данных*Хранение данных*Базы данных*

Всякая сложная инфраструктура, поступательно развивавшаяся на протяжении длительного времени, содержит в себе набор разных архитектурных неоптимальностей, а то и откровенных недостатков. Порой эти недостатки становятся неожиданным препятствием для внедрения новых сервисов. Инфраструктура М.Видео-Эльдорадо в этом отношении не является исключением, в чем мы признаемся без излишней рефлексии. Но что с этим делать? Как сделать систему надежной и пригодной для дальнейшего развития? За ответами мы пришли к Александру Алехину, директору по развитию ИТ архитектуры.

+52

norc 15 окт 2020 в 08:37

Знакомство с Debezium — CDC для Apache Kafka

18 мин

133K

Блог компании ФлантБазы данных*Мессенджеры*Системное администрирование*

В своей работе я часто сталкиваюсь с новыми техническими решениями/программными продуктами, информации о которых в русскоязычном интернете довольно мало. Этой статьей постараюсь восполнить один такой пробел примером из своей недавней практики, когда потребовалось настроить отправку CDC-событий из двух популярных СУБД (PostgreSQL и MongoDB) в кластер Kafka при помощи Debezium. Надеюсь, эта обзорная статья, появившаяся по итогам проделанной работы, окажется полезной и другим.

Что за Debezium и вообще CDC?

Debezium — представитель категории программного обеспечения CDC (Capture Data Change), а если точнее — это набор коннекторов для различных СУБД, совместимых с фреймворком Apache Kafka Connect.

Читать дальше →

+52

n_bogdanov 25 сен 2020 в 06:21

Обзор операторов PostgreSQL для Kubernetes. Часть 1: наш выбор и опыт

11 мин

32K

Блог компании ФлантБазы данных*PostgreSQL*Kubernetes*DevOps*

Технотекст 2021

Всё чаще от клиентов поступают такие запросы: «Хотим как Amazon RDS, но дешевле»; «Хотим как RDS, но везде, в любой инфраструктуре». Чтобы реализовать подобное managed-решение на Kubernetes, мы посмотрели на текущее состояние наиболее популярных операторов для PostgreSQL (Stolon, операторы от Crunchy Data и Zalando) и сделали свой выбор.

Эта статья — полученный нами опыт и с теоретической точки зрения (обзор решений), и с практической стороны (что было выбрано и что из этого получилось). Но для начала давайте определимся, какие вообще требования предъявляются к потенциальной замене RDS…

Читать дальше →

+52

dokshina 4 дек 2019 в 12:20

Легко и непринужденно деплоим приложения на Tarantool Cartridge (часть 1)

8 мин

6.1K

Блог компании VKВысоконагруженные системы*Базы данных*Tarantool*IT-инфраструктура*

Туториал

Мы уже рассказывали про Tarantool Cartridge, который позволяет разрабатывать распределенные приложения и паковать их. Осталось всего ничего: научиться деплоить эти приложения и управлять ими. Не беспокойтесь, мы всё предусмотрели! Мы собрали вместе все best practices по работе с Tarantool Cartridge и написали ansible-роль, которая разложит пакет на серверы, стартанет инстансы, объединит их в кластер, настроит авторизацию, забутстрапит vshard, включит автоматический failover и пропатчит кластерный конфиг.

Интересно? Тогда прошу под кат, всё расскажем и покажем.

Читать дальше →

+52

ashotog 17 апр 2019 в 11:05

Сотни тысяч платежей граждан в ГИБДД и ФССП находились в открытом доступе

8 мин

28K

IT-инфраструктура*Базы данных*Информационная безопасность*Платежные системы*

Медицинские данные – были, данные по кредитам – были, на этот раз пришла очередь данных по платежам за штрафы ГИБДД и задолженности по исполнительным производствам службы судебных приставов.

Хорошая новость в том, что эти платежи не связаны с официальным сайтом Госуслуг. Плохая новость – данных много, и они более чем «персональные».

Читать дальше →

+52

mi5ha6in 31 мая 2018 в 10:29

Как устроены базы данных

24 мин

156K

Блог компании Конференции Олега Бунина (Онтико)Базы данных*Анализ и проектирование систем*Высоконагруженные системы*Хранение данных*

Нельзя сказать, что в этой статье вас ждут отборные потроха баз данных, но скорее рассказ про базы данных от самого начала, плюс небольшое углубление в некоторые подробности, которые Илье Космодемьянскому (@hydrobiont) кажутся важными. И есть все основания полагать, что так оно и есть.

Эта статья родилась не от хорошей жизни. Часто даже не то что начинающие разработчики, но и вполне продвинутые, не знают каких-то базовых вещей — может быть, давно учились в университете и с тех пор забыли, или им не приходилось углубляться в теорию, поскольку и так работалось нормально.

Тем не менее, теоретические знания иногда полезно освежить. Этим мы, в том числе, и займемся.

О спикере: Илья Космодемьянский CEO и консультант в компании Data Egret, специалист по базам данных PostgreSQL, Oracle, DB2. А кроме того, отвечает за продвижение Postgres-технологий, выступает на конференциях и рассказывает людям, как с ними работать.

Ниже материал по докладу Ильи на РИТ++ 2017, который не был связан с какой-то конкретной базой данных, но охватывал многие основные аспекты.

+52

1 2 3

5 6 ...

83 84

Базы данных *

Мигрируем БД в продакшене без даунтайма

Архитектура in-memory СУБД: 10 лет опыта в одной статье

Как организовать анализ большого объема данных в реальном времени

Как мы сжимаем данные в больших проектах

Почему СУБД такие медленные

Как я положил продакшен базу на выходных

Вы пожалеете об использовании естественных ключей

«Надо переехать с Oracle на PostgreSQL. Ты только не волнуйся!»

Борьба с TOAST или будущее JSONB в PostgreSQL

Неотправленное письмо боссу в кровавом Enterprise

Репликация в Tarantool: конфигурирование и использование

Кто мощнее в базах данных? Сравниваем производительность БД на серверах с ARM- и x86-процессорами

Kafka и микросервисы: обзор

Ближайшие события

OpenSearch как сервис: обзор и тривиальный пример использования на Python

Архитектурные паттерны в распределенных высоконагруженных системах

Знакомство с Debezium — CDC для Apache Kafka

Что за Debezium и вообще CDC?

Обзор операторов PostgreSQL для Kubernetes. Часть 1: наш выбор и опыт

Легко и непринужденно деплоим приложения на Tarantool Cartridge (часть 1)

Сотни тысяч платежей граждан в ГИБДД и ФССП находились в открытом доступе

Как устроены базы данных

Вклад авторов