Базы данных *

Все об администрировании БД

СтатьиПостыНовостиАвторыКомпании

PatientZero 19 авг 2024 в 16:56

Просто выберите Postgres

Средний

6 мин

30K

Веб-разработка*PostgreSQL*Базы данных*

Мнение

Перевод

Отчасти это действенный совет, отчасти — вопрос к читателям.

Совет: при создании нового приложения, требующего постоянного хранения данных, как это и бывает в случае большинства веб-приложений, по умолчанию следует выбирать Postgres.

+41

vaintrub 24 окт 2023 в 09:01

Отказоустойчивая архитектура: почему Tarantool не падает?

8 мин

7.6K

Блог компании VKРаспределённые системы*Высоконагруженные системы*Базы данных*Tarantool*

Туториал

✏️ Технотекст 2023

Основная проблема в высоконагруженных приложениях — отказоустойчивость. Нагрузка с упавших узлов в кластере должна переключаться на живые. Это кажется несложной задачей, но на практике появляется много подводных камней. Я потратил много времени на поддержку различных кластеров, построенных на Tarantool и наших кластерных фреймворках Cartridge и TDG, и сегодня расскажу вам, как обеспечивается отказоустойчивость в наших приложениях. Будет интересно всем, кто хочет подробнее узнать, как устроен фейловер в Cartridge, и тем, кто хочет узнать о нашем опыте создания автоматических фейловеров.

Читать дальше →

+41

Maxilect 19 сен 2023 в 12:25

Clickhouse — непростая жизнь в продакшене

Сложный

13 мин

22K

Блог компании MaxilectВысоконагруженные системы*Системное администрирование*SQL*Базы данных*

Кейс

Около двух лет назад вышла небольшая статья Kafka Streams — непростая жизнь в production, в которой я описывал сложности, с которыми наша команда столкнулась при попытке решить задачи проекта с помощью kafka-streams. Эксперимент вышел неудачным, и мы в итоге совсем отказались от этой технологии. Вместо нее решили попробовать Clickhouse (CH), и сейчас уже можно сказать, что эта база нам очень хорошо подошла и отлично решает почти все задачи, которые нам ставит бизнес. В этой статье я расскажу об особенностях использования CH.

+41

ru_vds 27 фев 2023 в 13:00

Сможет ли Event Sourcing перерасти базы данных?

Средний

8 мин

9.4K

Блог компании RUVDS.comБазы данных*Хранение данных*

Перевод

Event sourcing — не новый термин. Если вы работаете с технологиями, то должны были с ним сталкиваться. Это мощный инструмент, используемый многими крупными организациями в качестве архитектуры баз данных. Он имеет возможность масштабирования и отвечает потребностям современной отрасли обработки данных.

В этой статье мы глубже рассмотрим ES и расскажем о причинах его популярности. Также мы поразмыслим над популярным вопросом: перерастёт ли event sourcing базы данных?

Читать дальше →

+41

kerlay 8 апр 2021 в 06:47

«Ваша устаревшая база данных перерастает сама себя». Опыт chess.com

14 мин

9.9K

Блог компании ФлантБазы данных*Проектирование и рефакторинг*MySQL*

Перевод

Прим. перев.: в этой статье сербский «инженер по масштабируемости» нагруженного онлайн-проекта в подробностях рассказывает о своем опыте оптимизации большой БД на базе MySQL. Проведена она была для того, чтобы выдержать резкий рост трафика на сайт, случившийся из-за пандемии.

База данных становится слишком большой или старой? Ее тяжело обслуживать? Что ж, надеюсь, я смогу немного помочь. Текст, который вы собираетесь прочитать, содержит реальный опыт масштабирования монолитной базы данных, лежащей в основе одного из сайтов Топ-250 (согласно alexa.com). На момент написания этой статьи chess.com занимал 215 место в мире по популярности. Ежедневно к нам заглядывали более 4 млн уникальных пользователей, а наши MySQL-базы обрабатывали в общей сложности более 7 млрд запросов. Год назад сайт ежедневно посещали 1 млн уникальных пользователей; в марте прошлого года их число увеличилось до 1,3 млн; сегодня более 4 млн человек заходят на chess.com ежедневно, а число сыгранных партий превышает 8 млн. Я, конечно, знаю, что это не сопоставимо с самыми крупными игроками на рынке, однако наш опыт все же может помочь в такой сложной задаче, как «исправление» монолитной базы данных и ее вывод на новый уровень производительности.

+41

ovi 22 мар 2021 в 16:09

«Представь, что ты нашел решение, про которое можешь сказать: оно лучшее в мире» — интервью с создателем ClickHouse

12 мин

18K

Блог компании РебреинOpen source*Программирование*Базы данных*Интервью

Алексей Миловидов работал инженером в Яндекс.Метрике, и перед ним стояла непростая задача.

Яндекс.Метрика работала с петабайтами данных — это был третий по популярности сервис веб-аналитики в мире. Для него нужна была база данных, которая может обрабатывать огромное количество данных в реальном времени, очень быстро, при этом не сжигая миллиарды денег.

Долгое время такая СУБД разрабатывалась только для внутренних нужд — но в 2016 вышла в опенсорс под названием ClickHouse, и сообщество встречает инструмент по-разному.

Мы поговорили с Алексеем о том, как он стал разработчиком, почему ClickHouse намного быстрее всех аналогов и как так получилось, какова цена производительности, почему ClickHouse стал опенсорсным и куда вообще движется индустрия.

+41

HeadphoneActor 28 дек 2020 в 13:29

Мониторинг Tarantool: логи, метрики и их обработка

18 мин

11K

Блог компании VKБазы данных*Tarantool*Lua*DevOps*

Туториал

Tarantool — это платформа in-memory вычислений с гибкой схемой данных. На её основе можно создать распределённое хранилище, веб-сервер, высоконагруженное приложение или, в конце концов, сервис, включающий в себя всё вышеперечисленное. Но какой бы ни была ваша промышленная задача, однажды настанет момент, когда её решение придётся мониторить. В этой статье я хочу дать обзор существующих средств для мониторинга приложения на базе Tarantool и пройтись по основным кейсам работы с ними.

Мониторинг Tarantool

Я работаю в команде, которая занимается разработкой, внедрением и поддержкой готовых решений на основе Tarantool. Для вывода наших приложений в эксплуатацию на контуре заказчика было необходимо не только разобраться в текущих возможностях мониторинга, но и доработать их. Большая часть доработок в результате вошла в те или иные стандартные пакеты. Данный материал является текстовой выжимкой этого опыта, и может пригодиться тем, кто решит пройти по той же тропе.

Читать дальше →

+41

NeTRuS-Dev 29 мая в 09:12

Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

Средний

22 мин

15K

Блог компании AvitoTechBig Data*Data Engineering*DIY или Сделай самБазы данных*

Обзор

Привет! Меня зовут Влад Божьев, я старший разработчик юнита АБ-тестирования Авито. Один из наших ключевых инструментов – M42, сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы.

В этой статье мы с вами погружаемся в самое сердце M42 и разбираем, как же там хранятся отчеты по метрикам. Это не просто рассказ, это почти детективная история о том, как мы искали оптимальное решение.

В нашем семантическом слое данных больше 20 000 метрик, и есть десятки разрезов для каждой из них. Под катом рассказываю, как мы храним терабайты данных и автоматизируем добавление новых разрезов в отчёт M42.

+40

0xdde 29 апр в 12:48

Эволюция хранилища ВКонтакте: от первой реализации до наших дней

Средний

9 мин

3.4K

Блог компании VKРаспределённые системы*Хранение данных*Базы данных*

Кейс

Привет, Хабр! Последние несколько лет я занимаюсь разработкой баз данных ВКонтакте. Аудитория такой крупной соцсети ежедневно генерирует огромные массивы информации.

В этой статье я расскажу про хранилище ВКонтакте: как оно менялось, что мы делаем для оптимизации занятого места и как гарантируем сохранность данных.

+40

Doctor_IT 14 фев в 11:46

Реальная замена Notion или просто хороший продукт? Обзор и установка NocoDB

5 мин

17K

Блог компании SelectelIT-компанииБазы данных*Контент и копирайтинг*

Обзор

Notion успел стать одним из самых популярных инструментов для управления проектами. Его часто используют для организации контент-планов, календарей, Kanban-досок и не только. Однако 9 сентября 2024 года продукт ушел из России.

Компании, которые плотно работали с Notion, были вынуждены искать альтернативные решения и мигрировать свои данные. Именно тогда на слуху стали фигурировать сервисы вроде Yonote, Weeek, Teamly и другие. У каждого решения есть свои плюсы и минусы, но идеальной замены нет: все сервисы разные, со своей историей и спецификой.

Если вы до сих пор не нашли альтернативу Notion, но не оставляете попыток, посмотрите в сторону NocoDB. Это платформа с открытым исходным кодом, которая позволяет создавать базы данных и управлять ими в знакомом интерфейсе. И, как оказалось, решение отлично подходит для нетехнических команд и предоставляет альтернативный для Notion функционал. В этой статье мы познакомимся с NocoDB и посмотрим, как развернуть проект на облачном сервере.

Читать дальше →

+40

mizhka 20 фев 2024 в 09:00

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 1

12 мин

16K

Блог компании Postgres ProfessionalБазы данных*PostgreSQL*Системное администрирование*

✏️ Технотекст 7

Привет, Хабр! Недавно мы делали доклад на конференции HighLoad 2023 — «Мифы и реалии Мультимастера в архитектуре СУБД PostgreSQL». Мы — это Павел Конотопов (@kakoka) и Михаил Жилин (@mizhka), сотрудники компании Postgres Professional. Павел занимается архитектурой построения отказоустойчивых кластеров, а Михаил — анализом производительности СУБД. У каждого за плечами более десяти лет опыта в своей области.

Порассуждаем о том, как развивалась технология «Мультимастер» в экосистеме PostgreSQL, остановимся на том, что она из себя представляет, на каких внутренних механизмах PostgreSQL основана и как её можно использовать.

Мы также поговорим о том, существует ли «Честный Мультимастер» (само понятие «Честный Мультимастер» достаточно специфично и в основном употребляется в кругу разработчиков), какие реализации у него есть и как его следует применять.

+40

Kilor 13 апр 2022 в 13:30

«Импортозамещаем» анализ планов PostgreSQL

4 мин

11K

Блог компании ТензорPostgreSQL*SQL*Базы данных*Визуализация данных*

Вчера Hubert 'depesz' Lubaczewski закрыл доступ с российских IP ко всем своим сайтам, включая широко известный визуализатор планов PostgreSQL-запросов explain.depesz.com.

Но это не беда, потому что в компании "Тензор" мы разработали сервис explain.tensor.ru, функционал которого гораздо обширнее, и которым можете воспользоваться и вы.

+40

Kilor 24 мар 2021 в 13:40

DBA: когда почти закончился serial

10 мин

8.3K

Блог компании ТензорВысоконагруженные системы*PostgreSQL*SQL*Базы данных*

Туториал

"Шеф, всё пропало, у нас serial на мегатаблице кончился!" - а это значит, что либо вы его неаккуратно накрутили сами, либо у вас действительно данных столько, что разрядности integer-столбца уже не хватает для вашей большой и активной таблицы в PostgreSQL-базе.

Да и столбец этот не простой, а целый PRIMARY KEY, на который еще и ряд других немаленьких таблиц по FOREIGN KEY завязан. А еще и приложение останавливать совсем не хочется, ибо клиентам 24x7 обещано...

В общем, надо как-то с минимальными блокировками увеличить размер PK-поля в большой таблице, на которое многое завязано.

+40

Kilor 23 сен 2020 в 07:25

PostgreSQL 13: happy pagination WITH TIES

2 мин

12K

Блог компании ТензорPostgreSQL*SQL*Базы данных*Высоконагруженные системы*

На прошедшей неделе вышло сразу две статьи (от Hubert 'depesz' Lubaczewski и автора самого патча Alvaro Herrera), посвященные реализованной в грядущей версии PostgreSQL 13 поддержке опции WITH TIES из стандарта SQL:2008:

OFFSET start { ROW | ROWS } FETCH { FIRST | NEXT } [ count ] { ROW | ROWS } { ONLY | WITH TIES }

Что это, и как оно избавляет от проблем с реализацией пейджинга, о которых я рассказывал в статье «PostgreSQL Antipatterns: навигация по реестру»?

Читать дальше →

+40

imschur 24 июн 2020 в 12:40

Подозрительные типы

8 мин

14K

Блог компании ТензорPostgreSQL*SQL*Базы данных*

Из песочницы

В их внешнем облике ничто не вызывает подозрений. Более того, они даже кажутся тебе хорошо и давно знакомыми. Но это только до тех пор, пока ты их не проверишь. Вот тут-то они и проявят свою коварную сущность, сработав совсем не так, как ты ожидал. А иногда выкидывают такое, от чего волосы просто встают дыбом — к примеру, теряют доверенные им секретные данные. Когда ты делаешь им очную ставку, они утверждают, что не знают друг друга, хотя в тени усердно трудятся под одним колпаком. Пора уже наконец-то вывести их на чистую воду. Давайте же и мы разберемся с этими подозрительными типами.

Типизация данных в PostgreSQL, при всей своей логичности, действительно преподносит порой очень странные сюрпризы. В этой статье мы постараемся прояснить некоторые их причуды, разобраться в причине их странного поведения и понять, как не столкнуться с проблемами в повседневной практике. Сказать по правде, я составил эту статью в том числе и в качестве некоего справочника для самого себя, справочника, к которому можно было бы легко обратиться в спорных случаях. Поэтому он будет пополняться по мере обнаружения новых сюрпризов от подозрительных типов. Итак, в путь, о неутомимые следопыты баз данных!

Читать дальше →

+40

Data_center_MIRAN 17 янв 2020 в 07:36

Китай принял свой «пакет Яровой»

4 мин

26K

Блог компании Дата-центр «Миран»Базы данных*Законодательство в ITИнформационная безопасность*Облачные вычисления*

В конце прошлого года китайское правительство представило новый закон о киберпезопасности, так называемую Многоуровневую схему кибебезопасности (Cybersecurity Muti-Level Protection Scheme, MLPS 2.0). Закон, вступивший в силу в декабре, фактически означает, что правительство имеет неограниченный доступ ко всем данным внутри страны, независимо от того, хранятся ли они на китайских серверах или передаются через китайские сети.

Это означает, что не будет никаких анонимных VPN (а многие популярные VPN принадлежат китайским компаниям). Никаких личных или зашифрованных сообщений. Никаких анонимных онлайн-аккаунтов и конфиденциальных данных. Любые данные будут доступны и открыты для китайского правительства, в том числе и данные иностранных компаний на китайских серверах или проходящие через Китай, поясняется в комментарии юридической фирмы Reed Smith. В каком-то смысле MLPS 2.0 и сопутствующие законы можно сравнить с российским «пакетом законов Яровой».

Читать дальше →

+40

GrishinAlex 7 фев в 08:35

Зачем запускать облачную СУБД на выделенном сервере

Простой

6 мин

5.6K

Блог компании SelectelХранение данных*Облачные сервисы*Базы данных*IT-инфраструктура*

Обзор

Когда речь заходит о выборе инфраструктуры, возникает классический вопрос: использовать готовый сервис в облаке или собрать свой на выделенных серверах. На первый взгляд, все просто: облако — это про скорость и удобство, а выделенные серверы — про мощность и производительность. Но все не так просто.

Облако — это не монолит, а набор кубиков (сервисов), из которых можно собирать решения под любые задачи — в том числе под очень требовательные к производительности. В этой статье мы проверим, насколько вариативно облако, сравним плюсы и минусы двух принципиально разных подходов к инфраструктуре и посмотрим на новый «кубик» в экосистеме Selectel — DBaaS на выделенном сервере. Разберемся, как он появился, зачем нужен и как сочетает производительность выделенного сервера с удобством облака. Готовы? Я Гришин Александр продакт менеджер облачных баз данных и объектного хранилища в Selectel, и сегодня я предлагаю собрать это облачное «LEGO» вместе!

Читать дальше →

+39

MsDoos 24 янв в 08:00

Настройка бэкапов в S3 через Microsoft SQL Server без скриптов и стороннего ПО

Средний

8 мин

5.2K

Блог компании SelectelIT-инфраструктура*Microsoft SQL Server*Базы данных*Хранение данных*

✏️ Технотекст 7

Привет, Хабр! Меня зовут Даниил, я дежурный системный инженер в Selectel. Но так было не всегда. Несколько лет назад я работал системным администратором в маленькой компании. И в какой-то момент мы решили внедрять 1С. А так как все вокруг у нас было на Windows, выбор пал на Microsoft SQL Server. Связка казалась самой очевидной и простой. В то время опыта у меня было маловато, многого я не знал, но прекрасно понимал, что резервное копирование — наше все. Так я без должного опыта занялся настройкой бэкапирования через MS SQL. Путь оказался не самым простым, поэтому я решил поделиться с новичками набитыми шишками и полученным опытом.

Читать дальше →

+39

Titsubishi 25 сен 2024 в 08:15

Obsidian: синхронизация без боли

Простой

6 мин

127K

Базы данных*Софт

Из песочницы

Легкий и простой способ настроить бесплатную синхронизацию Obsidian между всеми своими устройствами.

+39

164

Bright_Translate 28 июн 2024 в 13:00

Как нормализовывать телефонные номера

5 мин

11K

Блог компании RUVDS.comIT-стандарты*Базы данных*Сотовая связьХранение данных*

Перевод

Замечали когда-нибудь, что все записывают телефонные номера по-разному? Некоторые пишут их через пробелы, другие через дефис, а кто-то использует скобки. Разные люди по-разному группируют цифры номеров в числа.

И это становится реальной проблемой, когда вам нужно сохранить телефонные номера в базе данных и затем извлекать из неё записи по ним.

Читать дальше →

+39

1 2 ...

6 7

9 10 ...

81 82

Базы данных *

Просто выберите Postgres

Отказоустойчивая архитектура: почему Tarantool не падает?

Clickhouse — непростая жизнь в продакшене

Сможет ли Event Sourcing перерасти базы данных?

«Ваша устаревшая база данных перерастает сама себя». Опыт chess.com

«Представь, что ты нашел решение, про которое можешь сказать: оно лучшее в мире» — интервью с создателем ClickHouse

Мониторинг Tarantool: логи, метрики и их обработка

Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице

Эволюция хранилища ВКонтакте: от первой реализации до наших дней

Реальная замена Notion или просто хороший продукт? Обзор и установка NocoDB

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 1

«Импортозамещаем» анализ планов PostgreSQL

DBA: когда почти закончился serial

Ближайшие события

PostgreSQL 13: happy pagination WITH TIES

Подозрительные типы

Китай принял свой «пакет Яровой»

Зачем запускать облачную СУБД на выделенном сервере

Настройка бэкапов в S3 через Microsoft SQL Server без скриптов и стороннего ПО

Obsidian: синхронизация без боли

Как нормализовывать телефонные номера

Вклад авторов