Администрирование баз данных *

Все об администрировании БД

Статьи Посты Новости Авторы Компании

gle4er 24 ноя 2023 в 12:55

Организуем High Availability PostgreSQL

7 мин

17K

Блог компании AvitoTechPostgreSQL*IT-инфраструктура*Администрирование баз данных*

Чтобы система долго работала без сбоев и перерывов, нужно поработать над отказоустойчивостью. В статье дадим несколько способов её построить и покажем готовое решение.

+14

Loxmatiymamont 21 ноя 2023 в 11:04

Как мы судили на чемпионате России по спортивному программированию

Простой

8 мин

2.3K

Блог компании Postgres ProfessionalPostgreSQL*Программирование*Администрирование баз данных*Карьера в IT-индустрии

В начале ноября так сложились обстоятельства, что мне с коллегой довелось поучаствовать в качестве судей на мероприятии под строгим названием «Отборочный этап чемпионата России по спортивному программированию» в дисциплине «Продуктовое программирование». Или, говоря более простым языком — студенческий трехдневный онлайн-хакатон, победители которого поедут на финал чемпионата страны в Москву.

Вот об этом мероприятии, что на нём было интересного и каких-то выводах из увиденного сегодня и поговорим.

AndreyMitrofanov 15 ноя 2023 в 11:14

Системы управления базами данных: новая жизнь после Oracle

Простой

5 мин

Блог компании Группа компаний X-ComСистемное администрирование*Администрирование баз данных*

Системы управления базами данных (далее по тексту – СУБД) – набор компонентов, с помощью которого можно создавать, хранить, передавать и управлять базами данных. Они нужны практически на любом предприятии, которому приходится иметь дело с большими массивами информации: это могут быть данные о товарах магазина или производителя, данные о клиентах, данные о сотрудниках, данные о вашем сайте – в общем, всё, что по какой-то причине нужно хранить для решения разных бизнес-задач.

-3

BinCat 14 ноя 2023 в 12:59

Сколько нужно ядер cpu, чтобы выдержать 30k+ rps?

Средний

6 мин

8.6K

Высокая производительность*MongoDB*Администрирование баз данных*

Кейс

Меня зовут Вадим Ивахин, я техлид в Vi.Tech — это IT-дочка ВсеИнструменты.ру.

Я и мои коллеги трудимся над большим количеством проектов и используем в своей работе различные инструменты, в том числе MongoDB. В этой статье я не стану рассказывать о том, что такое MongoDB. Хочу рассказать о её интересной и удобной особенности — механизме Watch, и о том, как с его помощью спроектировать приложение, способное выдержать десятки тысяч rps.

+17

koloskovv 13 ноя 2023 в 12:55

Записки оптимизатора 1С (часть 4). Параллелизм в 1С, настройки, ожидания CXPACKET

Простой

10 мин

8.2K

Блог компании SOFTPOINTВысокая производительность*Microsoft SQL Server*Администрирование баз данных*1С*

Кейс

Параллелизм – это возможность выполнения запросов сервером СУБД в нескольких потоков. По умолчанию в настройках SQL Server параллелизм не ограничен и потенциально для выполнения запроса могут использоваться все ядра всех процессоров (max degree of parallelism= 0). В то же время, в системах 1С вендор настоятельно рекомендует установить max degree of parallelism = 1, и, соответственно, один запрос будет использовать только одно ядро.

Почему так и что же с этим всем делать? Давайте разбираться.

MaxRokatansky 11 ноя 2023 в 15:45

ClickHouse: Передовой инструмент для оперативной обработки данных

17 мин

32K

Блог компании OTUSАдминистрирование баз данных*

Перевод

ClickHouse — система управления базами данных с открытым исходным кодом, построенная на основе колонок. Это означает, что данные хранятся и обрабатываются не по строкам, а по столбцам. Она стала широко популярной среди ИТ-организаций благодаря своим способностям по быстрой обработке данных и масштабируемости. Высокопроизводительная обработка запросов в ClickHouse делает ее идеальным выбором для работы с большими объемами данных и оперативной аналитики.

В данной статье мы подробно рассмотрим, что представляет собой разработка ClickHouse, а также как организации используют ее для хранения и обработки данных. Еще мы обсудим недостатки этой системы и разберемся, насколько подходит она под ваши потребности.

-1

dmserebr 9 ноя 2023 в 18:41

Почему вам стоит отказаться от использования timestamp в PostgreSQL

10 мин

61K

PostgreSQL*Программирование*Администрирование баз данных*

Из песочницы

Не секрет, что работа с часовыми поясами — боль, и многие разработчики объяснимо стараются ее избегать. Тем более что в каждом языке программирования / СУБД работа с часовыми поясами реализована по-разному.

Среди тех, кто работает с PostgreSQL, есть очень распространенное заблуждение про типы данных timestamp (который также именуется timestamp without time zone) и timestamptz (или timestamp with time zone). Вкратце его можно сформулировать так:

Мне не нужен тип timestamp with time zone, т.к. у меня все находится в одном часовом поясе — и сервер, и клиенты.

В статье я постараюсь объяснить, почему даже в таком довольно простом сценарии можно запросто напороться на проблемы. А в более сложных (которые на самом деле чаще встречаются на практике, чем может показаться) баги при использовании timestamp практически гарантированы.

+90

136

SergeyDubna 9 ноя 2023 в 16:45

Развертывание базы данных Oracle в Docker в условиях санкций

Простой

3 мин

4.4K

Администрирование баз данных*

Из песочницы

По определенным обстоятельствам потребовалось создать имитацию всего контура тестируемого нами ПО, контур включает в себя множество различных сервисов, но в этой статье остановимся на базе данных, так как процесс ее развертывания наиболее нитереснен.

В статье освещен процесс решения проблем при сборке образа и запуске контейнера

-5

BiktorSergeev 8 ноя 2023 в 13:10

OpenVMS: операционная система для атомных станций. Redis

7 мин

Блог компании МТСАдминистрирование баз данных*СофтОперационные системы

Мы продолжаем погружение в основы операционной системы OpenVMS. В прошлых статьях мы установили её в качестве виртуальной машины, настроили сеть и активировали лицензии. Бонусом поставили туда SSH и даже организовали Web-интерфейс для удобного управления. Теперь пришла пора попробовать раскатать какой-нибудь простой сервис вроде Redis.

Уверены, что большинство наших читателей c Хабра знает, что это такое. Но если вы впервые слышите эту аббревиатуру, немного расскажем о ней. Расшифровывается она как Remote Dictionary Server. Это скоростная in-memory NoSQL СУБД, используемая для работы с парами «ключ:значение». Чаще всего её используют в качестве кэша перед основными БД, такими как MariaDB или PostgreSQL.

+34

RukInDaHouse 2 ноя 2023 в 14:56

Это база: нюансы работы с Redis. Часть 1

Средний

15 мин

33K

Блог компании NixysСистемное администрирование*NoSQL*Администрирование баз данных*DevOps*

Обзор

Привет! Меня зовут Петр и мы в компании Nixys очень любим Redis. Эта база используется, если не на каждом нашем проекте, то на подавляющем большинстве. Мы работали как с разными инсталляциями Redis, так и с разными версиями, вплоть до самых дремучих, вроде 2.2. Несмотря на то, что в Интернете очень много статей и докладов по этой БД, мы в своей практике достаточно часто встречаемся с непониманием некоторых основных концепций Redis и со стороны разработчиков, и со стороны системных администраторов.

В серии статей я попытаюсь осветить неочевидные нюансы при работе с Redis и сегодня начну с основных концепций и понятий. А еще в конце статьи приведу небольшой чек-лист, который может помочь вам в оптимизации этого NoSQL решения.

+79

FirstJohn 2 ноя 2023 в 11:16

Использование табличных тестов в go для тестирования запросов к БД + testify

11 мин

2.5K

Блог компании FirstVDSАдминистрирование баз данных*Go*

Туториал

При написании бэкенда работа с базой данных зачастую составляет большую часть кода в проекте. Но несмотря на то, что в го стандартная библиотека для тестирования довольно удобная, она требует написания большого количества кода. Поэтому иногда вместо того, чтобы писать тесты разработчики могут ограничить тестирование при помощи какого-либо клиента (например, при помощи tableplus или другого sql-клиента), либо тестируют уже конечные точки API используя postman. С одной стороны, это, конечно может быть быстрее для первого тестирования, но с другой — такие методы не обеспечивают должного покрытия тестами приложения.

Решить проблему с написанием большого количества кода может помочь библиотека testify, которая позволяет писать тесты более выразительно и с меньшим количеством кода. В testify есть пакеты require и assert, в первом случае выполнение теста будет прервано, а во втором — продолжено. В статье будет использоваться пакет assert. Для облегчения понимания кода можно использовать табличное тестирование, которое поможет определить, какие случаи проверяются даже при беглом взгляде на код.

Kilor 2 ноя 2023 в 09:45

PostgreSQL Antipatterns: ходим по JSON-граблям

Простой

3 мин

15K

Блог компании ТензорВысокая производительность*PostgreSQL*SQL*Администрирование баз данных*

Кейс

Недавно попался на глаза примерно такой кусок запроса, и тут прекрасно примерно все:

• множество чтений из CTE (хоть и единственной записи, но все же);

• извлечение по каждому ключу текста с раскастовкой в jsonb;

• извлечение каждого отдельного json-ключа в каждое отдельное одноименное поле;

• "ручное" преобразование текстового представления массива в json в текстовое представление PostgreSQL.

А как - правильно?

+26

badcasedaily1 30 окт 2023 в 17:02

Индексирование полнотекстовых данных в PostgreSQL с использованием модуля pg_trgm

Простой

11 мин

9.7K

Блог компании OTUSPostgreSQL*Программирование*Анализ и проектирование систем*Администрирование баз данных*

Обзор

Привет, Хабр!

PostgreSQL, одна из самых мощных и гибких реляционных СУБД, предлагает нам свой модуль pg_trgm, чтобы решить сложную задачу полнотекстового поиска.

Когда речь идет о поиске, просто LIKE запросы больше не всегда могут удовлетворить технические требования. Полнотекстовый поиск подразумевает не только поиск точных соответствий, но и учет схожести слов, учет морфологии, а также поддержку более сложных запросов. PostgreSQL, конечно, предоставляет средства для выполнения таких задач, и модуль pg_trgm - один из инструментов, с помощью которого это можно сделать.

Итак, что такое pg_trgm? Этот модуль PostgreSQL предоставляет набор функций и операторов, которые позволяют работать с трехграммами (триграммами) - это последовательности из трех символов. Для понимания, давайте взглянем на пример...

+19

Andrey_Biryukov 27 окт 2023 в 16:28

Установка и безопасная настройка Redis

Простой

5 мин

12K

Блог компании OTUSАдминистрирование баз данных*

Туториал

Сегодня мы поговорим о СУБД Redis, рассмотрим процесс установки и настройки. В отличие от реляционных систем управления базами данных, Redis является СУБД класса NoSQL с открытым исходным кодом, работающей со структурами данных типа «ключ — значение».

Разберемся для начала с тем, что такое NoSQL. Представим, что у нас есть приложение, которому необходимо быстро и без задержек обрабатывать разные по структуре данные, не имеющие определенной структуры. В таком случае использование “классических”, реляционных баз данных будет не самым лучшим решением, так как нам необходимо будет сначала каким-то образом структурировать эти данные, а уже потом с ними работать. При использовании NoSQL мы можем использовать структуру “ключ-значение” и иметь возможность быстро обрабатывать неструктурированные данные. NoSQL используются как для баз данных, так и для реализации кэшей, брокеров сообщений. При этом, NoSQL стала популярным решением из-за простоты разработки, функционала, высокой производительности и возможности горизонтального масштабирования.

Но, вернемся к СУБД Redis. Redis - это хранилище значений ключей в памяти, известное своей гибкостью, производительностью и широкой языковой поддержкой. Данная система ориентирована на достижение максимальной производительности на атомарных операциях (заявляется о приблизительно 100 тыс. SET- и GET-запросов в секунду на Linux-сервере начального уровня). Написана на Си, интерфейсы доступа созданы для большинства основных языков программирования. Далее мы поговорим о том, как установить и безопасно настроить Redis на сервере Ubuntu 22.04.

anton_esh 27 окт 2023 в 13:08

История одной Real-Time-рекомендательной системы: пример построения решения от нуля до реализации

9 мин

2.4K

Блог компании VKВысокая производительность*Администрирование баз данных*Tarantool*

Real-Time-рекомендательные системы — сложный с точки зрения реализации и поддержания продукт. Его разработка требует тщательной проработки архитектуры и этапов, качественной работы с данными и обеспечения возможности масштабирования решения. Причём большинство подобных задач приходится решать уже в процессе, с учётом реалий и возникающих подводных камней.

Читать дальше →

+17

vaintrub 24 окт 2023 в 12:01

Отказоустойчивая архитектура: почему Tarantool не падает?

8 мин

6.7K

Блог компании VKВысокая производительность*Администрирование баз данных*Распределённые системы*Tarantool*

Туториал

Основная проблема в высоконагруженных приложениях — отказоустойчивость. Нагрузка с упавших узлов в кластере должна переключаться на живые. Это кажется несложной задачей, но на практике появляется много подводных камней. Мы с yngvar_antonsson потратили много времени на поддержку различных кластеров, построенных на Tarantool и наших кластерных фреймворках Cartridge и TDG, и сегодня расскажем вам, как обеспечивается отказоустойчивость в наших приложениях. Будет интересно всем, кто хочет подробнее узнать, как устроен фейловер в Cartridge, и тем, кто хочет узнать о нашем опыте создания автоматических фейловеров.

Читать дальше →

+41

kucev 19 окт 2023 в 12:32

Размерности качества данных: обеспечение качества данных с помощью Great Expectations

7 мин

1.9K

Data Mining*Администрирование баз данных*Big Data*Хранение данных*Data Engineering*

Перевод

Качество данных играет критически важную роль в любом процессе управления данными. Организации используют данные для принятия решений и улучшения различных бизнес-показателей. Однако если данные усеяны неточностями, ошибками или несогласованностями, то они могут нанести больше вреда, чем пользы.

Согласно опросу Gartner за 2020 год, в среднем потери из-за низкого качества данных составляют примерно $12,8 миллиона за год. Как сообщается в последнем отчёте State of Data Quality, задержки продакшена (задержки с выпуском продукта) — характерный симптом низкого качества данных. Высококачественные и безошибочные данные повышают надёжность и верность полученных из них выводов.

Для повышения качества данных необходима система его оценки. В достижении этой цели вам помогут размерности качества данных. Размерности позволяют измерять покрытие и выявлять компоненты, требующие тестирования качества данных.

В этой статье рассматриваются шесть размерностей качества данных: полнота, согласованность, целостность, вневременная актуальность, уникальность и валидность. Определив их, вы сможете обеспечить исчерпывающее понимание качества данных и выявить аспекты, требующие совершенствования. И здесь нам на помощь приходит Great Expectation (GX).

Читать дальше →

pzrnqt1vrss 17 окт 2023 в 16:00

Простой ORM для sqlite3

Средний

12 мин

12K

Блог компании RUVDS.comPython*Администрирование баз данных*ООП*

Туториал

ORM, или объектно-реляционное отображение — это программная технология, которая позволяет взаимодействовать с базами данных с использованием объектно-ориентированной парадигмы. Вместо того чтобы писать SQL-запросы напрямую для работы с данными в базе данных, можно использовать ORM, чтобы взаимодействовать с данными, как если бы они были объектами в вашем коде.

Не бывало ли вам интересно, как работает изнутри такая идейно простая концепция? Благодаря чему достигается удобство работы? Сегодня мы напишем ORM самостоятельно и узнаем, какие инструменты python нам для этого понадобятся.

Читать дальше →

+48

ITSumma 16 окт 2023 в 14:27

Потоковая обработка данных: анализ альтернативных решений

8 мин

3.4K

Блог компании ITSummaАдминистрирование баз данных*Apache*Big Data*Data Engineering*

Обзор

Всем привет! Я Алексей Пономаревский, разработчик решений для платформ сбора и обработки больших данных.

Два года назад мы в ITSumma создали решение для потоковой обработки данных с помощью Apache Spark и базы данных Greenplum — spark-greenplum-connector. Это многофункциональный плагин для Spark, на его основе инженеры могут строить ETL-решения и анализировать данные in-memory.

Изначально мы разработали его, как часть клиентской платформы потоковой обработки данных. Но со временем он прирос одной интересной функциональностью, которая недоступна сейчас в других подобных решениях. В этой статья я хочу сделать краткое сравнение между двумя opensource-продуктами Apache Spark и Flink, а также рассказать об одной интересной особенности Spark, которую мы реализовали в коннекторе.

+21

itglobalcom 16 окт 2023 в 12:00

Как организовать облачную DR-площадку для крупного бизнеса

Простой

4 мин

654

Блог компании ГК ITGLOBAL.COMСистемное администрирование*Восстановление данных*Администрирование баз данных*Облачные сервисы*

Кейс

На стабильную работу ИТ-инфраструктуры компании в локальном дата-центре влияет много факторов: резервирование по схеме N+1, работа инженерных систем, экспертиза технических специалистов. Однако есть и внешние. К ним относится отказ оборудования, природные катаклизмы и геополитические конфликты.

В статье мы рассказали, как специалисты ITGLOBAL.COM запустили резервную площадку для восстановления данных после сбоев (Disaster Recovery) в облаке для ГК «Интерлизинг». А на YouTube выпустили видео с интервью участников проекта.

1 2 3 4 5

7 8 ...

67 68

Администрирование баз данных *

Организуем High Availability PostgreSQL

Как мы судили на чемпионате России по спортивному программированию

Системы управления базами данных: новая жизнь после Oracle

Сколько нужно ядер cpu, чтобы выдержать 30k+ rps?

Истории

Записки оптимизатора 1С (часть 4). Параллелизм в 1С, настройки, ожидания CXPACKET

ClickHouse: Передовой инструмент для оперативной обработки данных

Почему вам стоит отказаться от использования timestamp в PostgreSQL

Развертывание базы данных Oracle в Docker в условиях санкций

OpenVMS: операционная система для атомных станций. Redis

Это база: нюансы работы с Redis. Часть 1

Использование табличных тестов в go для тестирования запросов к БД + testify

PostgreSQL Antipatterns: ходим по JSON-граблям

Индексирование полнотекстовых данных в PostgreSQL с использованием модуля pg_trgm

Ближайшие события

Установка и безопасная настройка Redis

История одной Real-Time-рекомендательной системы: пример построения решения от нуля до реализации

Отказоустойчивая архитектура: почему Tarantool не падает?

Размерности качества данных: обеспечение качества данных с помощью Great Expectations

Простой ORM для sqlite3

Потоковая обработка данных: анализ альтернативных решений

Как организовать облачную DR-площадку для крупного бизнеса

Вклад авторов

Работа