Базы данных *

Все об администрировании БД

СтатьиПостыНовостиАвторыКомпании

o6CuFl2Q 9 апр 2021 в 09:20

Как использовать ClickHouse не по его прямому назначению

10 мин

21K

Блог компании Конференции Олега Бунина (Онтико)Высоконагруженные системы * MySQL * Базы данных * Big Data *

Алексей Миловидов делает ClickHouse и, конечно, знает его вдоль и поперек. В том числе и о том, как его можно использовать дополнительно к его штатным и всем хорошо известным функциям.

И сегодня расскажет про эти необычные способы его использования и, может быть, даже не для хранения и обработки данных.

+47

ru_vds 29 окт 2020 в 09:15

Неожиданное влияние текстов среднего размера на производительность PostgreSQL

18 мин

18K

Блог компании RUVDS.comPostgreSQL * Базы данных *

Перевод

В схеме любой базы данных, наверняка, будет множество текстовых полей. Я, для целей этой статьи, разделил текстовые поля на три категории:

Маленькие тексты. Имена и фамилии людей, заголовки страниц, имена пользователей, адреса электронной почты и прочее подобное. Обычно на размер таких полей накладываются определённые ограничения, довольно сильные. Возможно, это даже не поля типа text, а поля типа varchar(n).
Большие тексты. Это, например, содержимое публикаций в блогах, тексты статей, HTML-код. Такие данные представляют собой большие фрагменты текста неограниченной длины, хранящиеся в базе данных.
Тексты среднего размера. Это — описания, комментарии, отзывы о товарах, данные о трассировке стека и так далее. В сущности это — любые текстовые поля, размер которых находится между размерами «маленьких» и «больших» текстов. Обычно размер таких полей не ограничен, но их содержимое, по естественным причинам, меньше, чем содержимое полей категории «большие тексты».

В этом материале я хочу рассказать о неожиданном влиянии текстов среднего размера на производительность запросов в PostgreSQL. В частности, мы поговорим о TOAST (The Oversized-Attribute Storage Technique, Техника хранения больших атрибутов)

Читать дальше →

+47

jobgemws 12 июл 2019 в 06:48

Некоторые аспекты оптимизации LINQ-запросов в C#.NET для MS SQL Server

6 мин

24K

Базы данных * SQL * Microsoft SQL Server * C# * .NET *

Туториал

LINQ вошел в .NET как новый мощный язык манипуляции с данными. LINQ to SQL как часть его позволяет достаточно удобно общаться с СУБД с помощью например Entity Framework. Однако, достаточно часто применяя его, разработчики забывают смотреть на то, какой именно SQL-запрос будет генерировать queryable provider, в вашем случае — Entity Framework.

Читать дальше →

+47

379

jobgemws 30 июн 2019 в 10:10

Исследование быстродействия СУБД MS SQL Server Developer 2016 и PostgreSQL 10.5 для 1С

25 мин

48K

Базы данных * SQL * PostgreSQL * Microsoft SQL Server * .NET *

Туториал

Цели и требования к тестированию «1С Бухгалтерии»

Основной целью проводимого тестирования является сравнение поведения системы 1С на двух разных СУБД при прочих одинаковых условиях. Т.е. конфигурация баз данных 1С и первоначальная заполненность данными должны быть одинаковыми при проведении каждого тестирования.

Основными параметрами, которые должны быть получены при тестировании:

Время выполнения каждого теста (снимается отделом Разработки 1С)
Нагрузка на СУБД и серверное окружение во время выполнения теста снимается- администраторами СУБД, а также по серверному окружению системными администраторами

Тестирование системы 1С должно выполняться с учетом клиент-серверной архитектуры, поэтому необходимо произвести полноценную эмуляцию работы пользователя или нескольких пользователей в системе с отработкой ввода информации в интерфейсе и сохранением этой информации в базе данных. При этом, необходимо, чтобы большой объем периодической информации был разнесен по большому отрезку времени для создания итогов в регистрах накопления.

Для выполнения тестирования разработан алгоритм в виде скрипта сценарного тестирования, для конфигурации 1С Бухгалтерия 3.0, в котором выполняется последовательный ввод тестовых данных в систему 1С. Скрипт позволяет указать различные настройки по выполняемым действиям и количеству тестовых данных. Детальное описание ниже по тексту.

Описание настроек и характеристик тестируемых сред

Мы в компании Fortis решили перепроверить результаты, в том числе с помощью известного теста Гилева.

Также нас подстегнуло к тестированию в том числе и некоторые публикации по результатам изменения производительности при переходе от MS SQL Server к PostgreSQL. Такие как: 1С Батл: PostgreSQL 9,10 vs MS SQL 2016.

Читать дальше →

+47

113

EvgeniyRyzhkov 23 фев 2019 в 10:49

RethinkDB: почему мы закрылись

10 мин

24K

Базы данных * Развитие стартапа

Перевод

Перевод статьи опубликован с разрешения автора.

Когда мы объявили, что RethinkDB закрывается, я пообещал написать критический анализ посмертно. Я взял некоторое время, чтобы переосмыслить полученный опыт, и сейчас могу его четко изложить.

Читать дальше →

+47

Flampanzer 11 июл в 12:36

Руководство по pgcrypto — шифрование внутри PostgreSQL. Часть 2

Средний

9 мин

2.4K

Блог компании SelectelPostgreSQL * Базы данных * Криптография * Информационная безопасность *

Обзор

Привет, Хабр! На связи снова Антон Дятлов, инженер по защите информации в Selectel. Буквально несколько дней назад мы с вами рассмотрели установку и безопасную настройку pgcrypto и изучили его основные возможности. Пришло время перейти к практическому применению этих знаний.

В этой статье разберем конкретные сценарии использования pgcrypto в реальных проектах и углубимся в вопросы производительности и проблемы индексирования зашифрованных данных. Отдельно я сформулировал чек-лист лучших практик безопасности и сравнил pgcrypto с альтернативными подходами, чтобы вы могли сделать осознанный выбор для своей архитектуры. Прошу под кат!

+46

kostja 13 мая в 06:54

Picodata: вторая жизнь in-memory баз данных

Сложный

17 мин

5.6K

Блог компании ArenadataБазы данных * Open source * Высоконагруженные системы * PostgreSQL *

Обзор

Привет, меня зовут Костя Осипов, и я занимаюсь разработкой СУБД. На Хабре есть несколько моих статей про MySQL, Tarantool и про всякое-разное. Кроме того, я веду Telegram-канал, где делюсь инсайтами в области управления базами данных. Сегодня я выступаю в роли основателя компании Picodata, создающей одноимённую открытую СУБД, и управляющего директора ПАО Arenadata по исследованиям и разработке. Ниже — вольный пересказ моего недавнего доклада на HighLoad. Он про то, что нас ждёт в мире СУБД завтра, и, в частности, про место резидентных СУБД в архитектурах будущего.

+46

omyhosts 20 ноя 2022 в 17:30

Чему мы научились после того, как я случайно уничтожил продуктивную базу данных

9 мин

34K

Блог компании ISPsystemБазы данных * Управление проектами *

Перевод

«Собственно, б***ь, вот…», думал я, пока в телефонной трубке звучали длинные гудки. Я звонил своему боссу — не сомневаюсь, этим ясным пятничным утром он только и мечтал услышать, как его старший разработчик только что своими руками, не нарочно, удалил базу данных бэк-офиса.

Гудки напомнили мне писк больничной аппаратуры — когда монитор отмеряет последние пульсы умирающего больного. В данном случае, речь шла о моей карьере. Наконец, трубку на том конце кто-то снял. Мне оставалось уповать лишь на мудрость моего начальника. В глубине души я верил, что, выслушав меня, он произнесет какую-нибудь вдохновляющую речь, после которой я найду в себе силы всё исправить. Но он сказал: «Как это, мать твою, вообще случилось?!».

Что ж, сейчас я расскажу вам, как.

+46

akaDuality 27 янв 2021 в 09:10

Быстрый, простой, сложный: как мы выпилили Realm

18 мин

21K

Блог компании Dodo EngineeringБазы данных * Разработка мобильных приложений * iOS * Swift *

Технотекст 2021

Когда на собеседованиях я спрашиваю у кандидата с какими базами он работал и что делал, то чаще всего слышу про Realm. Типичный ответ: он быстрее и с ним проще работать: создал конфиг, описал модель, готово. Последствия, недостатки и проблемы обычно обсудить не получается: нужен опыт использования в пару лет, а его обычно нет.

Мы тоже использовали Realm — 3 года подряд. Сначала он помогал, потом раздражал, пару раз выстрелил и в конце чуть не вогнал команду в депрессию. В итоге мы удалили Realm из проекта. Это сложный инструмент — простота интеграции обманчива, а за все удобства придётся расплачиваться.

Почему и как мы его удалили

+46

andreios 30 дек 2020 в 09:29

Аварии как опыт #1. Как сломать два кластера ClickHouse, не уточнив один нюанс

7 мин

11K

Блог компании ФлантСистемное администрирование * Базы данных * DevOps *

Технотекст 2021

Про некоторые свои failure stories мы уже писали и раньше, но теперь мне выпала честь формально открыть специальный цикл из таких статей. Ведь аварии, их причины и последствия — это тоже часть нашей жизни, и исследовать эту «тёмную сторону» не менее интересно, чем всё остальное. Тем более, что они всё больше влияют даже на повседневный быт, так что из любой аварии можно и нужно извлекать уроки. Да и читатели не раз просили нас рассказывать о таком почаще — давайте попробуем!

Первая история — о том, как плоха и к каким последствиям может привести недостаточная коммуникация. Мы, конечно, высоко ценим и поддерживаем культуру открытого, качественного и (при необходимости) максимально плотного взаимодействия. Однако и на старуху бывает проруха. Произошедшее здесь — отличная иллюстрация того, как проблема скорее организационного характера находит слабое место в технических особенностях и выливается в неожиданный сбой.

Перейдем к технической стороне…

+46

vmrm 19 фев 2020 в 10:35

Одна история с оператором Redis в K8s и мини-обзор утилит для анализа данных этой БД

17 мин

15K

Блог компании ФлантDevOps * Kubernetes * NoSQL * Базы данных *

Что будет, если использовать всем известное in-memory-хранилище ключей и значений в качестве персистентной базы данных, не используя TTL? А если оно запущено с помощью надёжного, казалось бы, оператора в Kubernetes? А если в процессе увеличения реплик Redis мы внесём ещё одно маленькое и безобидное изменение?.. Отвечая на эти вопросы в данной статье, мы попутно расскажем, какие утилиты помогут найти пути к оптимизации размеров большой БД в Redis.

Проблемный кейс

Redis у нас используется внутри кластера Kubernetes в разных проектах. Для удобства управления и применения единых практик в рамках компании мы остановились на операторе от Spotahome. По нашему опыту, это наиболее стабильный вариант, хотя и у него есть свои проблемы, некоторые из которых будут затронуты далее в статье.

Читать дальше →

+46

gen 2 дек 2019 в 12:47

Ускоряем PHP-коннекторы для Tarantool с помощью Async, Swoole и Parallel

6 мин

4.9K

Блог компании VKPHP * SQL * Базы данных * Высоконагруженные системы *

В экосистеме PHP на данный момент существует два коннектора для работы с сервером Tarantool ― это официальное расширение PECL tarantool/tarantool-php, написанное на С, и tarantool-php/client, написанный на PHP. Я являюсь автором последнего.

В этой статье я хотел бы поделиться результатами тестирования производительности обеих библиотек и показать, как с помощью минимальных изменений в коде можно добиться 3-5 прироста производительности (на синтетический тестах!).

Читать дальше →

+46

olegbunin 28 авг 2019 в 10:23

Time series данные в реляционной СУБД. Расширения TimescaleDB и PipelineDB для PostgreSQL

21 мин

68K

Блог компании Конференции Олега Бунина (Онтико)Хранение данных * Визуализация данных * Базы данных * PostgreSQL *

Time series данные или временные ряды — это данные, которые изменяются во времени. Котировки валют, телеметрия перемещения транспорта, статистика обращения к серверу или нагрузки на CPU — это time series данные. Чтобы их хранить требуются специфичные инструменты — темпоральные базы данных. Инструментов — десятки, например, InfluxDB или ClickHouse. Но даже у самых лучших решений для хранения временных рядов есть недостатки. Все time series хранилища низкоуровневые, подходят только для time series данных, а обкатка и внедрение в текущий стек — дорого и больно.

Но, если у вас стек PostgreSQL, то можете забыть о InfluxDB и всех остальных темпоральных БД. Ставите себе два расширения TimescaleDB и PipelineDB и храните, обрабатываете и проводите аналитику time series данных прямо в экосистеме PostgreSQL. Без внедрения сторонних решений, без недостатков темпоральных хранилищ и без проблем их обкатки. Что это за расширения, в чем их преимущества и возможности, расскажет Иван Муратов (binakot) — руководитель отдела разработки в «Первой Мониторинговой Компании».

+46

MaxRokatansky 20 дек 2024 в 15:09

Мы ускорили JOIN в ClickHouse… в 100 раз

Средний

8 мин

18K

Блог компании OTUSБазы данных *

Перевод

Недавно мы представили два новых пул-реквеста в ClickHouse, которые будут доступны в ClickHouse 24.4. Эти изменения повышают производительность JOIN'ов во многих производственных сценариях, в некоторых случаях увеличивая скорость выполнения запросов на несколько порядков.

+45

ru_vds 21 окт 2024 в 14:09

Почему многие пользуются древними версиями Postgres?

Простой

5 мин

17K

Блог компании RUVDS.comPostgreSQL * Базы данных * Хранение данных *

Обзор

Перевод

Postgres 17.0 уже вышла, и она замечательная, но реальность такова: большинство пользователей Postgres не выполняют апгрейд сразу же. Многие, вероятно, сейчас даже не на 16.4, и даже не на 16, они пользуются Postgres 15 или ещё более старой версией. Ситуация с Postgres не такая же, как с новыми Call of Duty, когда каждый хочет скачать обновление сразу же после его выхода.

Почему же люди так неохотно идут на апгрейд?

На то есть множество причин, но всё сводится к двум основным: качество работы Postgres и неудобство апгрейдов.

Читать дальше →

+45

bit_10 28 сен 2023 в 09:15

Tarantool: как избавиться от «зоопарка технологий» с помощью потоков событий

14 мин

5.6K

Блог компании VKTarantool * Базы данных * Высоконагруженные системы *

Каждый проект рано или поздно обрастает разными технологиями, часть из которых может выполнять схожие или даже одинаковые функции. Наряду с развитием продукта это несет и скрытые трудности, в первую очередь для команды, которая должна поддерживать и развивать весь «зоопарк».

Меня зовут Иван Банников, я ведущий разработчик VK Tech. В этом материале я расскажу об основных предпосылках разрастания используемого стека, а также на примере IoT-платформы, которую мы поддерживали, поделюсь опытом избавления от «зоопарка технологий» в области обработки сообщений.

Читать дальше →

+45

Doctor_IT 28 мар 2023 в 09:12

Способы организации инфраструктуры с базами данных: от простого к сложному и эффективному

Простой

6 мин

11K

Блог компании SelectelСетевые технологии * Базы данных * IT-инфраструктура *

Обзор

За простыми UML- и ER-диаграммами архитектур скрываются витиеватые способы организации IT-инфраструктуры. Самый яркий пример — связь между веб-сервером и базой данных.

Какие есть варианты организации инфраструктуры с базами данных? Чем они отличаются и какие у них преимущества и недостатки? С такими же вопросами к нам приходят клиенты. Поэтому мы постарались расставить все по полочкам, а также показать, как связать сервер с базой данных через L3 VPN-соединение. Подробности под катом.

Читать дальше →

+45

trublast 25 ноя 2022 в 06:20

Наша новая удачная попытка бесшовной замены Redis на KeyDB

5 мин

17K

Блог компании ФлантKubernetes * DevOps * Базы данных *

Технотекст 2022

Мы уже как-то рассказывали о базе данных KeyDB — форке Redis, разработка которого началась в 2019 году. Проект распространяется под свободной лицензией BSD, и у него уже почти 6k звезд на GitHub. Авторы в свое время столкнулись с проблемами производительности оригинала и пошли хардкорным путём: взяли всё в свои руки и привнесли много нового как в части многопоточности, так и в других областях.

В статье делимся еще одним положительным опытом замены Redis на KeyDB.

+45

codesign 6 авг 2020 в 16:00

Архитектура S3: 3 года эволюции Mail.ru Cloud Storage

12 мин

22K

Блог компании VKБазы данных * Хранение данных * Tarantool *

Storage Corridor by St-Pete

Всем привет! Я Mons Anderson, архитектор платформы Mail.ru Cloud Solutions, расскажу, как мы построили наше S3-хранилище, как оно работает, какие решения оказались удачными, а какие стоило изменить, если бы мы начали такой же проект с нуля сейчас.

Статья подготовлена на основе доклада на @Databases Meetup by Mail.ru Cloud Solutions & Tarantool. В статье поговорим:

как было устроено хранилище Mail.ru, поверх которого мы строили S3-хранилище;
что мы добавили, чтобы сделать Mail.ru Cloud Storage;
как работает объектная модель хранения и какие сделаны шаги для выхода в продакшен;
про доработки боевой системы: фейловер и масштабирование;
как мы реализовали шардирование и решардинг;
а также про работу с SSL-сертификатами.

Если не хотите читать, можно посмотреть.

Читать дальше →

+45

Joyjey 3 мар 2020 в 13:07

Как мы Elasticsearch в порядок приводили: разделение данных, очистка, бэкапы

8 мин

32K

Блог компании ФлантСистемное администрирование * Серверное администрирование * Базы данных *

Эта статья — практическая история о том, как мы столкнулись с проблемой разделения логов, хранимых в Elasticsearch, из-за которой пришлось поменять подход к бэкапам и управлению индексами.

Всё началось вскоре после того, как было поднято production-окружение. У нас был «боевой» кластер Kubernetes, все логи из которого собирал fluentd и направлял их напрямую в индексы logstash-yyy.mm.dd…

Читать дальше →

+45

1 2 3 4 5

7 8 ...

84 85

Базы данных *

Как использовать ClickHouse не по его прямому назначению

Неожиданное влияние текстов среднего размера на производительность PostgreSQL

Некоторые аспекты оптимизации LINQ-запросов в C#.NET для MS SQL Server

Исследование быстродействия СУБД MS SQL Server Developer 2016 и PostgreSQL 10.5 для 1С

Цели и требования к тестированию «1С Бухгалтерии»

Описание настроек и характеристик тестируемых сред

RethinkDB: почему мы закрылись

Руководство по pgcrypto — шифрование внутри PostgreSQL. Часть 2

Picodata: вторая жизнь in-memory баз данных

Чему мы научились после того, как я случайно уничтожил продуктивную базу данных

Быстрый, простой, сложный: как мы выпилили Realm

Аварии как опыт #1. Как сломать два кластера ClickHouse, не уточнив один нюанс

Одна история с оператором Redis в K8s и мини-обзор утилит для анализа данных этой БД

Проблемный кейс

Ускоряем PHP-коннекторы для Tarantool с помощью Async, Swoole и Parallel

Time series данные в реляционной СУБД. Расширения TimescaleDB и PipelineDB для PostgreSQL

Ближайшие события

Мы ускорили JOIN в ClickHouse… в 100 раз

Почему многие пользуются древними версиями Postgres?

Tarantool: как избавиться от «зоопарка технологий» с помощью потоков событий

Способы организации инфраструктуры с базами данных: от простого к сложному и эффективному

Наша новая удачная попытка бесшовной замены Redis на KeyDB

Архитектура S3: 3 года эволюции Mail.ru Cloud Storage

Как мы Elasticsearch в порядок приводили: разделение данных, очистка, бэкапы

Вклад авторов