Базы данных *

Все об администрировании БД

EFS_programm 10 ноя 2017 в 15:02

Не трогайте логи руками. Часть 2: как мы внедряли Unified Logfile Analyser

7 мин

6.6K

Блог компании СберБазы данных * Тестирование IT-систем * Тестирование веб-сервисов *

В прошлой статье мы рассказали о созданной нами системе под названием ULA (Unified Logfile Analyser) — анализаторе, основными функциями которого являются сбор и агрегация входящих сообщений об ошибках c использованием алгоритма shingles, принятие решений по ним и автоматическая нотификация при проблемах с тестовой средой. Сегодня мы поделимся практикой обнаружения/решения багов раскатки этой системы и нашими планами.

Читать дальше →

jobgemws 22 сен 2017 в 21:31

Автоматизация по сбору данных о росте таблиц и файлов всех баз данных MS SQL Server

8 мин

11K

Microsoft SQL Server * SQL * Базы данных *

Туториал

Предисловие

Часто возникает потребность контролировать рост всех таблиц и файлов всех баз данных.

В данной статье будет рассмотрен пример того, как можно автоматизировать сбор данных о росте таблиц и файлов баз данных.

Читать дальше →

neznayuktoya 16 авг 2017 в 13:54

Установка и настройка MongoDB на Debian, а также ReplicaSet и пара других мелочей

6 мин

39K

Базы данных * Системное администрирование *

Из песочницы

Это руководство описывает пошаговую установку и настройку реплики из 3 узлов mongoDB на базе движка WiredTiger. А также несколько полезных мелочей для людей, впервые столкнувшихся с MongoDB.

Читать дальше →

kompas_3d 17 мая 2017 в 16:20

Как система управления инженерными данными спасает файлы от уничтожения криптовирусами

3 мин

13K

Блог компании АСКОНХранение данных * Системное администрирование * Восстановление данных * Базы данных *

Может ли Pilot-ICE спасти данные от вирусов-шифровальщиков? Чтобы ответить на этот вопрос, мы провели экспериментальное заражение нашумевшим вирусом Wana Decrypt0r 2.0 изолированной тестовой системы, на которой запущен сервер Pilot-Server и клиент Pilot-ICE. Другие криптовирусы действуют по схожему принципу, отличается только способ заражения. Рассматриваем самый экстремальный случай, когда резервной копии нет.

Рассказывает Дмитрий Поскребышев — руководитель отдела разработки систем управления инженерными данными.

Читать дальше →

rdruzyagin 10 мая 2017 в 08:58

Решение проблем с правами доступа в MySQL: вопросы и ответы

7 мин

14K

Блог компании PG Day'17 RussiaDevOps * Хранение данных * Базы данных *

Перевод

В феврале этого года Света Смирнова (ведущий инженер компании Percona) провела вебинар, посвященный решению проблем с правами доступа в MySQL. Запись и слайды с вебинара доступны здесь. Предлагаем вашему вниманию небольшой обзор самых популярных вопросов на эту тему.

Читать дальше →

jobgemws 4 ноя 2016 в 18:48

Автоматизация дефрагментации индексов в базе данных MS SQL Server

6 мин

25K

Microsoft SQL Server * SQL * Базы данных *

Туториал

Предисловие

В интернете можно найти массу информации о дефрагментации или перестроению индексов. Однако, большинство рекомендаций направлены на базы данных, у которых есть время минимальной нагрузки (в основном ночью).

А как быть с базами данных, которые постоянно используются как для изменения данных, так и для получения информации 24 часа в сутки, 7 дней в неделю?

В данной статье приведу реализованный механизм автоматизации дефрагментации индексов в базе данных для поддержки базы данных у нас на предприятии. Этот механизм позволяет все время дефрагментировать нужные индексы, т к в системе 24x7 фрагментация индексов происходит постоянно. И часто дефрагментация даже 1 раз в день для индексов недостаточна.

Читать дальше →

NetAngels 10 окт 2016 в 07:35

Autoscaling — инструмент автоматического вертикального масштабирования ресурсов (CPU|RAM|HDD)

13 мин

8.8K

Блог компании «NetAngels»Облачные вычисления * Настройка Linux * Базы данных * *nix *

В начале этого года у наших облачных VDS появился публичный API. Он позволяет клиенту делать практически все те же действия с облачными виртуальными машинами и дисками, что и в панели: создавать, удалять диски и ВМ, изменять тарифы и размер диска и тп.

Вместе с появлением API появилась и идея на его основе реализовать систему мониторинга за ресурсами виртуальной машины (ВМ), работающую внутри машины, и автоматического увеличения/уменьшения необходимых ресурсов по необходимости — автоскейлинг (autoscaling, АS).

Некоторые пояснения по AS

Здесь стоит уточнить, что поскольку система AS основана на API, в ее задачи не входит мгновенное предоставление ресурсов по требованию, в момент появления необходимости в них, или угадывание/предсказывание будущей необходимости в ресурсах. Суть AS заключается в том, что он должен зафиксировать момент, когда можно с уверенностью сказать, что ресурсов текущего тарифного плана становится недостаточно для гарантированного* и своевременного** выполнения запущенных на виртуальной машине процессов, и автоматически перевести ВМ на следующий тариф.

**Своевременного — потому что, если выполнение запущенных процессов упирается в процессорный ресурс, то процессы так или иначе выполнятся. Но время их завершения становится непредсказуемым.
*Гарантированного, потому что если оперативная память ВМ близка к исчерпанию и на ВМ не настроен swap, то это означает, что близка ситуация, когда какой-то из запущенных на ВМ процессов будет аварийно завершен операционной системой, если суммарное потребление памяти всеми процессами превысит ее общий объем. Если же swap настроен, то пока он также не исчерпается, никто убит не будет, но быстродействие ВМ также сильно просядет, т.к. будет зависеть от скорости работы swap-раздела, которая в любом случае на порядок меньше, чем скорость работы оперативной памяти.

Читать дальше →

softline_services 9 июл 2015 в 06:10

Горизонтальное масштабирование серверов баз данных для OLTP-систем, или что есть на рынке

5 мин

14K

Базы данных * Серверная оптимизация *

Как правило, в крупных и средних компаниях существуют высоконагруженные транзакционные информационные системы, которые являются важнейшей составляющей бизнеса, их называют OLTP-системами. С ростом бизнеса нагрузка увеличивается очень быстро, поэтому задача увеличения производительности имеющихся ресурсов под серверы баз данных, стоит очень остро. Зачастую для решения задачи увеличения производительности серверов баз данных приобретается более мощное оборудования (так называемое «вертикальное» масштабирование), но этот способ имеет очень существенный минус: компания рано или поздно купит сервер баз данных максимальной производительности по приемлемой цене, и что делать дальше? Дальше перспективы для бизнеса могут быть не такие радужные – во многих случаях речь идет об ухудшении репутации компании, невозможности обслужить клиентов в моменты повышенного спроса, значительной потере прибыли.

Читать дальше →

dmkan 31 июл в 14:00

Ускоренная экстракция данных из SAP-систем в DWH и Lakehouse: наш опыт интеграции

Средний

5 мин

931

Блог компании Sapiens solutionsData Engineering * ERP-системы * Базы данных *

В современных условиях возрастает актуальность выгрузки данных из SAP ERP в хранилища данных DWH или Data Lakehouse сторонних вендоров. Интеграция с системами, не входящими в экосистему SAP, зачастую сопровождается сложностями: поставщики программного обеспечения, как правило, не поддерживают использование конкурентных продуктов. Нативный механизм выгрузки данных в SAP BW (Business Warehouse) не может быть применен к системам, не принадлежащим к экосистеме SAP.

На нашем проекте внедрения хранилища данных на основе Arenadata DB для одного из крупных банков мы столкнулись со сложностями при интеграции с SAP S/4HANA.

В статье рассматривается решение, которое позволяет быстро и надежно производить выгрузку больших объемов данных.

alserok 30 июл в 14:54

Практический CQRS и Event Sourcing на Go

Простой

4 мин

2.5K

Базы данных * Алгоритмы * IT-инфраструктура * Go * Параллельное программирование *

Event Sourcing и CQRS — это мощные архитектурные подходы, которые заменяют традиционное CRUD-управление состоянием на журналирование событий и разделение операций записи и чтения для масштабируемости и надежности. Вместо прямого изменения данных система сохраняет каждое изменение как событие, что обеспечивает полный аудит, контроль конкурентности и гибкость в обработке данных.

Nexign 24 июл в 13:55

Как мы научили PostgreSQL автоматически создавать партиции: опыт Nexign Nord

Средний

14 мин

4.5K

Блог компании NexignSQL * Базы данных * Хранение данных *

Кейс

Программисты, ежедневно решающие задачи оптимизации запросов и управления большими объемами данных, неизбежно сталкиваются с необходимостью освоения новых методов организации данных. Поэтому сегодня предлагаем поговорить об автоматизации партиционирования как об эффективном варианте решения.

codeyield 3 июл в 11:44

Развёртывание боевого кластера Cassandra. Часть 1

Сложный

6 мин

2.7K

Базы данных * DevOps * Big Data * IT-инфраструктура * Высоконагруженные системы *

Кейс

Это первая статья из цикла, рассказывающая о практике развёртывания небольшого кластера Cassandra: от дефолтного деплоя «из коробки» до готовности к производственной эксплуатации.

Apache Cassandra — это распределенная высокомасштабируемая NoSQL СУБД, предназначенная для надежного хранения огромных массивов данных. Cassandra используют такие гиганты как Netflix, Apple, Instagram*, Twitter* (*Запрещены в РФ), Spotify и множество других известных компаний и брендов.

Здесь не будет рассказа об архитектуре Cassandra — о ней опубликовано очень много статей и снято настолько же много видео. Особо отмечу суперский «Cassandra Day Russia» на Youtube на русском языке, записанный нашими соотечественниками из Datastax. Поэтому, если вы вообще ничего не знаете о Cassandra, то посмотрите, например, вебинар «Введение в фундаментальные принципы и основы Apache Cassandra», а уже затем добро пожаловать в подготовку боевого кластера.

Что касается самого кластера, который мы будем разворачивать, то мне достался раскатанный через Ansible деплой на 5 хост‑машин с единственным образом Cassandra 4.0 в docker‑compose и дефолтными настройками. Пятерка хост‑машин представляет собой Core i5 / 64 GB RAM / 2 x 512 GB NVMe SSD / 16 TB SATA c Debian 11.

Пожалуй, это небольшой кластер (большие кластера Cassandra могут включать десятки и сотни нод, раскиданных по многим ДЦ в разных странах мира), однако для наших задач он вполне достаточен и главное решает потребности бизнеса.

Приступим?

danolivo 30 июн в 11:34

Об управлении планами PREPARED-запросов в PostgreSQL

Средний

9 мин

1.6K

PostgreSQL * Серверное администрирование * Базы данных *

Мнение

Побывав на PGConf.DE’2025 и обсуждая там практику применения Postgres на больших базах данных, я к своему удивлению регулярно слышал мнение, что проблемой является время планирования запроса. Как разработчику, мне было странно узнать, что этот фактор может, например, тормозить принятие решения о переходе на партиционирование, что казалось бы естественный шаг, когда количество записей в таблице переваливает за сотню миллионов. Что ж, давайте разбираться.

TantorLabs 30 мая в 11:55

Как провести нагрузочное тестирование БД PostgreSQL и ничего не забыть

Простой

14 мин

4.4K

Блог компании Тантор ЛабсБазы данных * Тестирование IT-систем * PostgreSQL * Высоконагруженные системы *

Туториал

При нагрузочном тестировании баз данных Tantor Postgres или других на базе PostgreSQL с использованием стандартного инструмента pgbench отсутствие фиксации деталей окружения (таких как конфигурация СУБД, характеристики сервера, версии ПО) часто приводит к нерепрезентативным результатам и необходимости повторных тестов. В статье рассматривается разработанный автором инструмент pg_perfbench, который призван решить эту проблему.

daria-gal 22 мая в 12:09

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

6 мин

2.3K

Блог компании MWS AIИскусственный интеллектМашинное обучение * Базы данных *

Способность открытых LLM шутить, причем по-доброму, могла бы расширить применение ИИ во многих сферах – образовании, терапии, обслуживании клиентов. Так что мы с коллегами из Лаборатории естественного языка НИУ ВШЭ задались этим вопросом и попытались разработать собственную методологию курирования (фильтрации и аннотирования) наборов данных для генерации доброго юмора на малых LM. По всем научным канонам мы ее описали и оценили в этом препринте. А здесь я постараюсь рассказать о ней чуть короче и менее научно.

OlegIct 22 апр в 05:09

Параметры конфигурации мастера, отслеживаемые репликами PostgreSQL

Средний

9 мин

1.9K

PostgreSQL * Базы данных *

Обзор

Значения восьми параметров конфигурации мастера (primary, ведущего сервера PostgreSQL) сохраняются в управляющих файлах и изменения их значений передаются через журнал (WAL) на реплики. Если реплика открыта для запросов (hot_standby=on), то значения пяти числовых параметров на реплике должны быть не меньше, чем на мастере, иначе процесс startup прекратит накат (replay) журнальных записей. А после рестарта экземпляры реплик не запустятся. В статье рассматриваются эти параметры особенности изменения их значений.

Значения пяти числовых параметров конфигурации, сохраненных в управляющем файле кластера, можно посмотреть утилитой pg_controldata:

Artemm44 20 фев в 11:17

SIGNAL 11 или как спасти Percona MySQL-сервер от спонтанных перезагрузок

Средний

5 мин

2.2K

Блог компании КОРУС КонсалтингMySQL * Базы данных *

Туториал

Привет, Хабр! Меня зовут Артем Майоров, я администратор баз данных в компании MONS (КОРУС Консалтинг).
Расскажу, как мы не дали упасть больше 100 ПВЗ России благодаря спасению Percona
MySQL-сервера.
Подробнее, как это сделать и почему вообще его пришлось спасать, я рассказал в тексте!

stas_makarov 24 янв в 08:55

Достижение согласованности без менеджеров транзакций

Средний

8 мин

3.6K

Анализ и проектирование систем * Базы данных * Управление проектами *

Мнение

Перевод

Вам нужно интегрировать несколько компонентов без помощи менеджеров транзакций с поддержкой ACID (атомарность, согласованность, изоляция и долговечность)? Тогда этот пост для вас.

Я сначала кратко объясню, что такое менеджеры транзакций и почему вы можете не иметь их под рукой в современных архитектурах. Затем я опишу решение, как работать без менеджеров транзакций в целом, а также рассмотрю проект, который я знаю лучше всего, как конкретный пример: движок процессов Camunda.

Documen-Terra 2 дек 2024 в 13:32

Документы под контролем: Как выбрать идеальную платформу и не сойти с ума

Простой

7 мин

2.4K

Блог компании ДокументерраПодготовка технической документации * Облачные сервисы * Базы данных * CMS *

Кейс

Запутались в выборе платформы для работы с документацией? Функций море, терминология запутанная, а вариантов столько, что глаза разбегаются—даже опытные специалисты порой теряются! Мы собрали для вас 10 ключевых критериев, которые помогут найти идеальную систему управления документацией без лишней головной боли. Давайте разберёмся вместе!

olivo4ka 16 сен 2024 в 14:31

Транзакции PostgreSQL, Требования ACID, примеры. Подготовка к собеседованию, изучение

Простой

10 мин

22K

PostgreSQL * Базы данных * Хранение данных * Анализ и проектирование систем *

Из песочницы

Приветствую тебя читатель, я решил написать про ACID и Транзакции PostgreSQL своим языком, с понятными примерами, эта статья ориентирована на людей готовящихся к собеседованию, кто захотел узнать нюансы транзакций в PostgreSQL или про ACID, а также для людей которые знают теорию, но сами ещё ни разу не писали транзакции. Я не ставил перед собой цели рассмотреть и объяснить работу транзакций на очень глубоком уровне. Была цель привести понятные примеры, дать макет работы с транзакциями, а также пощупать основные возможные проблемы при работе с транзакциями в PostgreSQL.

1 2 ...

66 67

69 70 ...

84 85

Базы данных *

Не трогайте логи руками. Часть 2: как мы внедряли Unified Logfile Analyser

Автоматизация по сбору данных о росте таблиц и файлов всех баз данных MS SQL Server

Предисловие

Установка и настройка MongoDB на Debian, а также ReplicaSet и пара других мелочей

Как система управления инженерными данными спасает файлы от уничтожения криптовирусами

Решение проблем с правами доступа в MySQL: вопросы и ответы

Автоматизация дефрагментации индексов в базе данных MS SQL Server

Предисловие

Autoscaling — инструмент автоматического вертикального масштабирования ресурсов (CPU|RAM|HDD)

Горизонтальное масштабирование серверов баз данных для OLTP-систем, или что есть на рынке

Ускоренная экстракция данных из SAP-систем в DWH и Lakehouse: наш опыт интеграции

Практический CQRS и Event Sourcing на Go

Как мы научили PostgreSQL автоматически создавать партиции: опыт Nexign Nord

Развёртывание боевого кластера Cassandra. Часть 1

Об управлении планами PREPARED-запросов в PostgreSQL

Ближайшие события

Как провести нагрузочное тестирование БД PostgreSQL и ничего не забыть

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

Параметры конфигурации мастера, отслеживаемые репликами PostgreSQL

SIGNAL 11 или как спасти Percona MySQL-сервер от спонтанных перезагрузок

Достижение согласованности без менеджеров транзакций

Документы под контролем: Как выбрать идеальную платформу и не сойти с ума

Транзакции PostgreSQL, Требования ACID, примеры. Подготовка к собеседованию, изучение

Вклад авторов