Базы данных *

Все об администрировании БД

СтатьиПостыНовостиАвторыКомпании

Bright_Translate 10 янв в 13:01

Эксперимент по ускорению SQLite

Средний

5 мин

7.7K

Блог компании RUVDS.comБазы данных*Хранение данных*

Обзор

Перевод

SQLite быстра, но можно ли сделать её ещё быстрее? Исследователи из Университетов Хельсинки и Кембриджа задались этим вопросом и опубликовали работу Serverless Runtime / Database Co-Design With Asynchronous I/O. В ней они продемонстрировали возможность 100-кратного снижения времени задержки, и ниже я в общих чертах эту их работу прокомментирую.

Речь пойдёт об исследовании возможностей Limbo — переписанной на Rust версии SQLite.

Читать дальше →

+51

MG88 18 мая 2021 в 07:02

Как из одной базы данных сделать 10 разных, храня только инкременты: обзор решения

3 мин

7.2K

Блог компании КРОКХранение данных*Анализ и проектирование систем*Базы данных*

История очень простая: есть большая продуктовая база данных. Она нужна пяти-шести командам разработки, тестировщикам и другим командам. Можно сделать штук 10 разных инстансов + БД, но обычно это дорого и долго. Гораздо лучше взять одну мастер-базу и хранить её инкременты для тех команд, которые с ней работают. Для этого есть специальные утилиты. Если лет пять назад они только начинали распространяться в России, то теперь их использование — абсолютно нормальная практика.

Давайте посмотрим, как это работает, на примере Actifio:

Слева — Shapshots, на их основе можно создавать виртуальные БД (VDB).

Итак, берём продуктовую базу и начинаем её клонировать. Нужно это для того, чтобы, в частности, получать тестовую базу за 15 минут, а не за две недели (а бывает и дольше), как обычно в крупных компаниях.

Читать дальше →

+51

EasyGrow 20 мар 2018 в 08:03

#PostgreSQL. Ускоряем деплой в семь раз с помощью «многопоточки»

11 мин

18K

Блог компании ГК ЛАНИТGo*PostgreSQL*Базы данных*

Всем привет! Мы на проекте ГИС ЖКХ используем PostgreSQL и недавно столкнулись с проблемой долгого выполнения SQL скриптов из-за быстрого увеличения объема данных в БД. В феврале 2018 года на PGConf я рассказал, как мы решали эту проблему. Слайды презентации доступны на сайте конференции. Предлагаю вашему вниманию текст моего выступления.

Читать дальше →

+51

n_bogdanov 18 мар 2021 в 09:35

Тест производительности PostgreSQL на AWS EC2-инстансах на ARM

7 мин

8.8K

Блог компании ФлантDevOps*Базы данных*PostgreSQL*

Перевод

Прим. перев.: в конце января Percona опубликовала результаты своего небольшого сравнения производительности для СУБД PostgreSQL, запущенной на x86- и ARM-инстансах AWS. Результаты получились интересными даже с учетом всех допущений, сделанных самими авторами и отмеченных комментаторами оригинальной статьи. А чтобы вы могли сделать собственные выводы, предлагаем вниманию перевод этого материала.

Ожидаемый рост количества ARM-процессоров в дата-центрах уже довольно давно является горячей темой для обсуждения, и нам было любопытно узнать, как они справятся с PostgreSQL. Основным препятствием на этом пути была недоступность в целом серверов на базе ARM-чипов для тестирования и оценки. Все изменилось после того, как в 2018 году AWS представила линейку инстансов на основе ARM-процессоров. Впрочем, особого ажиотажа не последовало: многие посчитали их "экспериментальным" предложением. Мы тоже опасались рекомендовать эти инстансы для критически значимого применения и не прилагали особых усилий для их оценки. Но когда в мае 2020 было анонсировано второе поколение инстансов на основе Graviton2, решили пересмотреть свое отношение. Нужно было объективно взглянуть на показатель цена/производительность новых машин при работе с PostgreSQL.

+50

GrishinAlex 26 июн в 08:07

Раздувание таблиц в PostgreSQL: работа с vacuum и pg_repack

Простой

8 мин

6.1K

Блог компании SelectelPostgreSQL*Базы данных*Облачные сервисы*Хранение данных*

Обзор

Когда вы в последний раз очищали БД от старых записей? А ведь раздувание таблиц и индексов в PostgreSQL из-за неактуальных данных — один из часто недооцениваемых источников «тихих» деградаций. Запросы потихоньку становятся медленнее, бэкапы — тяжелее, а место на диске расходуется неэффективно. В итоге любое лишнее уведомление от алерта или доля секунды задержки могут обернуться сбоем системы.

Привет, Хабр! На связи Александр Гришин. Я руководитель по развитию продуктов хранения данных Selectel: облачных баз данных и S3-хранилища. В этой статье предлагаю разобраться с одной из тех проблем, которые редко попадают в мониторинг, но легко становятся причиной инцидентов в проде. Посмотрим, чем pg_repack отличается от VACUUM FULL, какие особенности есть у каждого подхода и как использовать repack без дополнительных телодвижений. Статья будет полезна инженерам, поддерживающим PostgreSQL в продакшене, разработчикам облачных приложений и SaaS-сервисов и просто любопытным, кто стремится лучше понять, что происходит под капотом PostgreSQL в разных ситуациях. Погнали!

Читать дальше →

+49

miruzzy 3 мар 2024 в 18:45

PostgreSQL и временные таблицы

Средний

9 мин

43K

Блог компании lsFusionOpen source*PostgreSQL*Базы данных*1С*

Мы много лет уже используем в качестве основной базы данных PostgreSQL. За это время он зарекомендовал себя быстрой и надежной СУБД. Однако, есть в PostgreSQL одна проблема, с которой приходится сталкиваться достаточно часто. К сожалению, реализация логики временных таблиц в нем имеет ряд недостатков, которые отрицательно сказываются на производительности системы.

Одним из свидетельств наличия проблемы является то, что для временных таблиц в Postgres Pro была добавлена специальная функция fasttrun, а в Postgres Pro Enterprise существенно доработана работа с ними (см. пункт 4).

Наиболее активно временные таблицы используют платформы, в которых разработчик не работает напрямую с базой данных, а таблицы и запросы генерируются непосредственно самой платформой. В частности, к ним относится платформа 1С или ее открытый и бесплатный аналог - платформа lsFusion.

В этой статье я опишу почему приходится использовать временные таблицы, в чем суть проблемы, и как улучшить производительность путем настроек операционной системы и PostgreSQL.

+49

S_ILya 7 июл 2021 в 12:00

Интервью с создателем SQLite (часть 2): Android 2005, хвала Кнуту, 100% тестовое покрытие, собственная CVS

10 мин

17K

Блог компании МаклаудSQLite*Базы данных*ИнтервьюИстория IT

Перевод

«… я раньше думал, что могу писать программы без ошибок»

Это вторая часть интервью. Первую часть можно прочитать здесь.

Адам: Привет и добро пожаловать в CoRecursive. Я Адам Гордон Белл. В каждом эпизоде CoRecursive кто-то делится увлекательной историей создания собственного программного обеспечения.

Что произойдет, если сайд-проект, который вы делали по фану, вдруг станет популярным во всём мире? Как вы будете монетизировать его? Будете ли вы уделять ему всё своё время? Будете ли вы париться на счёт его обслуживания или просто оставите сервера включёнными и соберёте для них шкаф? Мой специальный гость Ричард Хипп — разработчик SQLite — продолжает отвечать на эти и многие другие вопросы.

Во второй части интервью вы узнаете:

почему Ричард считает себя причастным к провалу Motorola и Nokia;
к каким проблемам привело масштабирование СУБД SQLite;
сколько тест-кейсов нужно, чтобы обеспечить ей 100-процентное покрытие;
о том, как Ричард добавил покрывающие индексы в SQLite;
почему и как Ричард разрабатывает собственную систему контроля версий;
какой совет он может дать младшим коллегам.

Читать дальше →

+49

S_ILya 6 июл 2021 в 12:00

Интервью с создателем SQLite (часть 1): история создания SQLite и Консорциума, сотрудничество с Motorola, AOL и Nokia

8 мин

14K

Блог компании МаклаудSQLite*Базы данных*ИнтервьюИстория IT

Перевод

Адам: Привет и добро пожаловать в CoRecursive. Я Адам Гордон Белл. В каждом эпизоде CoRecursive кто-то делится увлекательной историей создания собственного программного обеспечения.

Что произойдет, если сайд-проект, который вы делали по фану, вдруг станет популярным во всём мире? Как вы будете монетизировать его? Будете ли вы уделять ему всё своё время? Будете ли вы париться на счёт его обслуживания или просто оставите сервера включёнными и соберёте для них шкаф? У меня есть специальный гость, который ответит на эти и многие другие вопросы.

Ричард: Привет, я Ричард Хипп — разработчик SQLite.

Адам: СУБД SQLite вы можете встретить где угодно: в веб-браузере, в вашем телефоне, возможно, в вашей машине и даже в авиалайнерах. SQLite используют для хранения ваших сообщений в iMessages и WhatsApp. Попробуйте поискать на своём девайсе файлы с расширением .db, и вы удивитесь, насколько много баз данных SQLite окажется на борту.

Читать дальше →

+49

pzrnqt1vrss 17 окт 2023 в 13:00

Простой ORM для sqlite3

Средний

12 мин

16K

Блог компании RUVDS.comPython*Базы данных*ООП*

Туториал

ORM, или объектно-реляционное отображение — это программная технология, которая позволяет взаимодействовать с базами данных с использованием объектно-ориентированной парадигмы. Вместо того чтобы писать SQL-запросы напрямую для работы с данными в базе данных, можно использовать ORM, чтобы взаимодействовать с данными, как если бы они были объектами в вашем коде.

Не бывало ли вам интересно, как работает изнутри такая идейно простая концепция? Благодаря чему достигается удобство работы? Сегодня мы напишем ORM самостоятельно и узнаем, какие инструменты python нам для этого понадобятся.

Читать дальше →

+48

sudoroot 17 ноя 2021 в 09:19

Как я на порядок ускорил переподключение к мастер-узлу в Redis Sentinel

5 мин

27K

Блог компании ФлантСистемное администрирование*Серверное администрирование*Базы данных*

Не так давно, развернув в Kubernetes уже привычный инфраструктурный компонент в виде кластера Redis Sentinel + redis-sentinel-proxy, мы столкнулись с интересными проблемами. При тестировании времени переключения мастера выяснилось, что оно составляет полторы минуты. Это очень долго.

Расскажу, как получилось ускорить процесс.

+48

stratnevpy 15 окт 2021 в 06:41

Опыт миграции кластера PostgreSQL на базе Patroni

17 мин

25K

Блог компании ФлантБазы данных*PostgreSQL*Системное администрирование*

Туториал

Недавно мне посчастливилось заниматься переносом кластера PostgreSQL под управлением Patroni на новое железо. Задача казалась простой — я и не думал, что могут возникнуть проблемы. Но в процессе реализации встретились некоторые сложности, которые натолкнули на мысль поделиться полученным опытом. В этой работе описываются практические шаги и нюансы, которые встретились во время переноса кластера на новую платформу. Использовались следующие версии ПО: PostgreSQL 11.13, Patroni 2.1.1, etcd 3.2.17 (API version 2). Итак, поехали!

+48

n_bogdanov 7 мая 2020 в 11:27

Обновление MySQL (Percona Server) с 5.7 до 8.0

8 мин

19K

Блог компании ФлантMySQL*Базы данных*Системное администрирование*

Прогресс не стоит на месте, поэтому причины обновиться на актуальные версии MySQL становятся всё более весомыми. Не так давно в одном из наших проектов настало время обновлять уютные кластеры Percona Server 5.7 до 8-й версии. Всё это происходило на платформе Ubuntu Linux 16.04. Как выполнить подобную операцию с минимальным простоем и с какими проблемами мы столкнулись при обновлении — читайте в этой статье.

Читать дальше →

+48

ogurtsov 25 мар 2019 в 16:09

Quick Draw Doodle Recognition: как подружить R, C++ и нейросетки

32 мин

6.9K

Блог компании Open Data ScienceR*Базы данных*Машинное обучение*Обработка изображений*

Привет, Хабр!

Осенью прошлого года на Kaggle проходил конкурс по классификации нарисованных от руки картинок Quick Draw Doodle Recognition, в котором среди прочих поучаствовала команда R-щиков в составе Артема Клевцова, Филиппа Управителева и Андрея Огурцова. Подробно описывать соревнование не будем, это уже сделано в недавней публикации.

С фармом медалек в этот раз не сложилось, но было получено много ценного опыта, поэтому о ряде наиболее интересных и полезных на Кагле и в повседневной работе вещей хотелось бы рассказать сообществу. Среди рассмотренных тем: нелегкая жизнь без OpenCV, парсинг JSON-ов (на этих примерах рассматривается интеграция кода на С++ в скрипты или пакеты на R посредством Rcpp), параметризация скриптов и докеризация итогового решения. Весь код из сообщения в пригодном для запуска виде доступен в репозитории.

Содержание:

Эффективная загрузка данных из CSV в базу MonetDB
Подготовка батчей
Итераторы для выгрузки батчей из БД
Выбор архитектуры модели
Параметризация скриптов
Докеризация скриптов
Использование нескольких GPU в облаке Google Cloud
Вместо заключения

Читать дальше →

+48

levashove 19 июл 2024 в 10:24

Go Tarantool: как построить Key-value-хранилище на сотни тысяч запросов в секунду

8 мин

17K

Блог компании VKTarantool*Распределённые системы*Базы данных*Высоконагруженные системы*

✏️ Технотекст 7

С увеличением сложности ИТ-систем все больше становится очевидной ограниченность привычных реализаций с простой архитектурой компонентов. Особенно это заметно в случае систем, которые должны стабильно работать с большими и интенсивными нагрузками.

Чтобы понять это, достаточно рассмотреть механику разворачивания большинства высоконагруженных систем. Например, разобрать построение системы авторизации пользователей для последующей сквозной аналитики авторизации/аутентификации между связанными сервисами компании.

Разбираемся на примере клиентского кейса, как может выглядеть такая система в части хранения данных, почему для таких задач оптимальна комбинация реляционной БД и Tarantool, а также показываем, какие показатели может обеспечить система с Tarantool.

+47

jobgemws 11 дек 2023 в 09:49

Как использовать ClickHouse не по его прямому назначению

10 мин

21K

Блог компании Конференции Олега Бунина (Онтико)Big Data*Базы данных*MySQL*Высоконагруженные системы*

Алексей Миловидов делает ClickHouse и, конечно, знает его вдоль и поперек. В том числе и о том, как его можно использовать дополнительно к его штатным и всем хорошо известным функциям.

И сегодня расскажет про эти необычные способы его использования и, может быть, даже не для хранения и обработки данных.

+47

ru_vds 29 окт 2020 в 09:15

Неожиданное влияние текстов среднего размера на производительность PostgreSQL

18 мин

18K

Блог компании RUVDS.comPostgreSQL*Базы данных*

Перевод

В схеме любой базы данных, наверняка, будет множество текстовых полей. Я, для целей этой статьи, разделил текстовые поля на три категории:

Маленькие тексты. Имена и фамилии людей, заголовки страниц, имена пользователей, адреса электронной почты и прочее подобное. Обычно на размер таких полей накладываются определённые ограничения, довольно сильные. Возможно, это даже не поля типа text, а поля типа varchar(n).
Большие тексты. Это, например, содержимое публикаций в блогах, тексты статей, HTML-код. Такие данные представляют собой большие фрагменты текста неограниченной длины, хранящиеся в базе данных.
Тексты среднего размера. Это — описания, комментарии, отзывы о товарах, данные о трассировке стека и так далее. В сущности это — любые текстовые поля, размер которых находится между размерами «маленьких» и «больших» текстов. Обычно размер таких полей не ограничен, но их содержимое, по естественным причинам, меньше, чем содержимое полей категории «большие тексты».

В этом материале я хочу рассказать о неожиданном влиянии текстов среднего размера на производительность запросов в PostgreSQL. В частности, мы поговорим о TOAST (The Oversized-Attribute Storage Technique, Техника хранения больших атрибутов)

Читать дальше →

+47

jobgemws 12 июл 2019 в 06:48

Некоторые аспекты оптимизации LINQ-запросов в C#.NET для MS SQL Server

6 мин

24K

SQL*Microsoft SQL Server*C#*.NET*Базы данных*

Туториал

LINQ вошел в .NET как новый мощный язык манипуляции с данными. LINQ to SQL как часть его позволяет достаточно удобно общаться с СУБД с помощью например Entity Framework. Однако, достаточно часто применяя его, разработчики забывают смотреть на то, какой именно SQL-запрос будет генерировать queryable provider, в вашем случае — Entity Framework.

Читать дальше →

+47

379

jobgemws 30 июн 2019 в 10:10

Исследование быстродействия СУБД MS SQL Server Developer 2016 и PostgreSQL 10.5 для 1С

25 мин

48K

.NET*Microsoft SQL Server*PostgreSQL*SQL*Базы данных*

Туториал

Цели и требования к тестированию «1С Бухгалтерии»

Основной целью проводимого тестирования является сравнение поведения системы 1С на двух разных СУБД при прочих одинаковых условиях. Т.е. конфигурация баз данных 1С и первоначальная заполненность данными должны быть одинаковыми при проведении каждого тестирования.

Основными параметрами, которые должны быть получены при тестировании:

Время выполнения каждого теста (снимается отделом Разработки 1С)
Нагрузка на СУБД и серверное окружение во время выполнения теста снимается- администраторами СУБД, а также по серверному окружению системными администраторами

Тестирование системы 1С должно выполняться с учетом клиент-серверной архитектуры, поэтому необходимо произвести полноценную эмуляцию работы пользователя или нескольких пользователей в системе с отработкой ввода информации в интерфейсе и сохранением этой информации в базе данных. При этом, необходимо, чтобы большой объем периодической информации был разнесен по большому отрезку времени для создания итогов в регистрах накопления.

Для выполнения тестирования разработан алгоритм в виде скрипта сценарного тестирования, для конфигурации 1С Бухгалтерия 3.0, в котором выполняется последовательный ввод тестовых данных в систему 1С. Скрипт позволяет указать различные настройки по выполняемым действиям и количеству тестовых данных. Детальное описание ниже по тексту.

Описание настроек и характеристик тестируемых сред

Мы в компании Fortis решили перепроверить результаты, в том числе с помощью известного теста Гилева.

Также нас подстегнуло к тестированию в том числе и некоторые публикации по результатам изменения производительности при переходе от MS SQL Server к PostgreSQL. Такие как: 1С Батл: PostgreSQL 9,10 vs MS SQL 2016.

Читать дальше →

+47

113

1 2 3 4

6 7 ...

83 84

Базы данных *

Эксперимент по ускорению SQLite

Как из одной базы данных сделать 10 разных, храня только инкременты: обзор решения

#PostgreSQL. Ускоряем деплой в семь раз с помощью «многопоточки»

Тест производительности PostgreSQL на AWS EC2-инстансах на ARM

Раздувание таблиц в PostgreSQL: работа с vacuum и pg_repack

Рекомендации при работе с PostgreSQL

PostgreSQL и временные таблицы

Интервью с создателем SQLite (часть 2): Android 2005, хвала Кнуту, 100% тестовое покрытие, собственная CVS

Интервью с создателем SQLite (часть 1): история создания SQLite и Консорциума, сотрудничество с Motorola, AOL и Nokia

Простой ORM для sqlite3

Как я на порядок ускорил переподключение к мастер-узлу в Redis Sentinel

Опыт миграции кластера PostgreSQL на базе Patroni

Обновление MySQL (Percona Server) с 5.7 до 8.0

Ближайшие события

Quick Draw Doodle Recognition: как подружить R, C++ и нейросетки

Содержание:

Go Tarantool: как построить Key-value-хранилище на сотни тысяч запросов в секунду

Рекомендации по ведению SQL-кода

Как использовать ClickHouse не по его прямому назначению

Неожиданное влияние текстов среднего размера на производительность PostgreSQL

Некоторые аспекты оптимизации LINQ-запросов в C#.NET для MS SQL Server

Исследование быстродействия СУБД MS SQL Server Developer 2016 и PostgreSQL 10.5 для 1С

Цели и требования к тестированию «1С Бухгалтерии»

Описание настроек и характеристик тестируемых сред

Вклад авторов