Базы данных *

Все об администрировании БД

СтатьиПостыНовостиАвторыКомпании

Deleted-user 9 мар 2023 в 13:58

Поиск и устранение повреждений данных

Средний

24 мин

18K

Microsoft SQL Server * Базы данных *

Туториал

Перевод

Это выдержка из восьмой главы книги Rodney Landrum: «SQL Server Tacklebox», в которой описывается, как DBA может устранить последствия повреждения данных. Будут продемонстрированы инструменты и сценарии, необходимые для своевременного поиска и устранения повреждений данных и предотвращения их попадания в резервные копии.

Toor3-14 2 мар 2023 в 13:36

MapReduce: как и зачем?

Простой

3 мин

35K

Java * Базы данных * Hadoop * Big Data *

Туториал

Cезон big data

Из песочницы

Пример задачи.

Хотим автоматизировать огромный фруктовый рынок. На каждое событие будем писать строчку в структурированный лог. Этот лог не является частью runtime функционирования рынка, но может быть полезен для изучения статистики и аналитики.

Например, на основании лога продавец может сделать вывод, что свежие яблоки выгоднее привозить к 13:00.

randall 13 фев 2023 в 10:07

Матч Postgres vs Redis — как выбрать правильный инструмент для разных задач

Средний

6 мин

11K

Блог компании MWSPostgreSQL * Базы данных * Высоконагруженные системы * Тестирование IT-систем *

Обзор

PostgreSQL и Redis — распространенные СУБД, которые «обросли» аудиторией. Их популярность варьируется от задачи к задаче, а сами они имеют свои сильные и слабые стороны.

Нашим клиентам бесплатно на тест доступны PostgreSQL и Redis по модели DBaaS, поэтому мы решили подробнее рассмотреть эти инструменты с точки зрения надежности, производительности и простоты настройки, а также обсудить тематические кейсы.

Читать дальше →

Kilor 26 дек 2022 в 07:25

PostgreSQL в «Тензоре» — публикации за год (#3)

3 мин

3.7K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Под занавес уходящего года предлагаю традиционно вспомнить, про какие интересные возможности и особенности работы с PostgreSQL мы рассказали в нашем блоге.

Если не видели дайджест за прошлый год — время наверстать упущенное!

deadfoster 9 дек 2022 в 07:11

Влияние сбора статистик на скорость выполнения запросов в СУБД TERADATA

18 мин

3.9K

Блог компании Axenix (ex-Accenture)Базы данных * SQL *

Расскажу о такой важной особенности работы СУБД TERADATA, как сбор и использование статистик при выполнении запросов и как их наличие или отсутствие может повлиять на скорость выполнения таких запросов. Попытаюсь объяснить, что представляют собой статистики и для чего они нужны TERADATA.

om_8 29 ноя 2022 в 07:14

Как мы с минимальными затратами создали каталог данных над хранилищем

8 мин

5.3K

Блог компании Magnit TechБазы данных * Big Data * Хранение данных *

Привет! Меня зовут Олег, я руководитель направления по метаданным в департаменте по работе с данными розничной сети «Магнит». В этой статьй я расскажу про Каталог витрин корпоративного хранилища данных. Всё описанное ниже — наш практический опыт: решение конкретных задач и болей. Наш инструмент получил массу позитивных отзывов коллег, и что самое главное — им регулярно пользуются.

dmitriizolotov 31 окт 2022 в 14:23

PostgreSQL для звездочетов

5 мин

5.5K

Блог компании OTUSБазы данных * АстрономияPostgreSQL *

Свободная СУБД PostgreSQL известна не только как высокопроизводительное решение для выполнения запросов и хранения данных в реляционной модели, но также своим механизмом расширения, который позволяет создавать дополнительные функции, типы данных, индексы и иные структуры данных для разных предметных областей. В этой статье мы рассмотрим некоторые подходы к сохранению и обработки данных астрономических каталогов (альманахов) с использованием возможностей PostgreSQL.

edeshina 6 окт 2022 в 12:21

Основы CI/CD. Знакомство с Jenkins

8 мин

183K

Блог компании СлёрмСистемное администрирование * IT-инфраструктура * Базы данных * DevOps *

В новой статье рассмотрим основы CI/CD и познакомимся Jenkins. Вы узнаете, где применяется Jenkins и какие проблемы помогает решить, поймёте логику архитектурных решений и особенности структуры каталогов. А ещё научитесь устанавливать Jenkins и производить базовую конфигурацию.

За основу статьи взят первый урок нашего практического курса «CI/CD с Jenkins».

Anna_sokol22 9 июн 2022 в 15:42

Реальные примеры применения Kafka в автопроме

8 мин

6.7K

Блог компании СлёрмПрограммирование * Базы данных * Apache *

Перевод

Apache Kafka широко используется в самых разных сферах автопрома. В этой статье мы рассмотрим реальные примеры развёртывания в разных контекстах, включая подключенные транспортные средства, умное производство и инновационные услуги перевозок, и в разных компаниях, включая автопроизводителей, вроде Audi, BMW, Porsche и Tesla, и провайдеров сервисов мобильности — Uber, Lyft и Here Technologies.

Stedihabr 19 апр 2022 в 09:33

Авторизация в PostgreSQL. Часть 1 — Роли и Привилегии

11 мин

45K

Блог компании Timeweb CloudPostgreSQL * Базы данных * Системное администрирование *

Перевод

Никто не будет спорить с тем, как важно понимать механизмы прав доступа и безопасности в базах данных. Если вы не продумываете логику авторизации в вашей БД, то, вероятно, вы не следуете принципу наименьших привилегий — к вашей базе данных могут получить доступ коллеги (например, разработчики, аналитики данных, маркетологи, бухгалтеры), подрядчики, процессы непрерывной интеграции или развернутые службы, которые имеют больше привилегий, чем должны. Это увеличивает риск утечек, неправомерного доступа к данным (например, личной информации), а также случайного или злонамеренного повреждения и потери данных.

Несмотря на важность темы, авторизация в базе данных являлась моим слабым местом в начале карьеры. NoSQL был самым крутым парнем на районе, а мир веб-разработки соблазняли фреймворки (например Rails), которые давали более приятный опыт разработки, нежели сложные SQL-скрипты. Но мир меняется. SQL и реляционные базы данных снова оказались в центре внимания, поэтому важно научиться пользоваться ими безопасно и эффективно. В этой серии статей я раскрою основные области авторизации в базах данных с акцентом на PostgreSQL, поскольку это одна из самых зрелых и функциональных СУБД с открытым исходным кодом.

Читать дальше →

netcracker_team 22 фев 2022 в 12:05

Как миграция с Oracle на PostgreSQL в облако влияет на сторадж?

8 мин

3.4K

Блог компании NetcrackerПрограммирование * PostgreSQL * Облачные сервисы * Базы данных *

Перевод

Вы когда-нибудь задумывались о том, чтобы перенести крупномасштабное программное решение с Oracle на PostgreSQL, а затем развернуть его в общедоступном облаке? Если Вы планируете реализовать подобное, возможно, Вам поможет наш опыт. Данная статья подробно рассказывает о нашем опыте настройки облачного хранилища, используемого PostgreSQL и оптимизации его производительности.

edgar-dev20 23 дек 2021 в 06:00

Как мы логшипим в Elasticsearch и что думаем о Filebeat

11 мин

24K

Блог компании МегаФонАнализ и проектирование систем * Базы данных * DevOps *

Туториал

Привет, я - Эдгар, backend-разработчик личного кабинета МегаФон, поделюсь решением проблемы log shipping-процесса в централизованное хранилище Elasticsearch, которое мы нашли вместе с командой.

axel_rus 6 дек 2021 в 05:30

Что случилось с High Availability в Oracle 19c Standard Edition, что такое SE2HA и при чём тут репликация

3 мин

2.7K

Блог компании Gals SoftwareСистемное администрирование * Базы данных * SQL * Oracle *

Если вы уже используете Oracle Standard Edition (SE) или планируете перейти на эту редакцию, чтобы сократить расходы на Oracle, вы, наверняка, знаете, что там урезаны опции HA и DR. Поскольку DataGuard недоступен для Standard Edition, RAC — единственный вариант обеспечения высокой доступности без использования сторонних решений. Так было до тех пор, пока компания Oracle не убрала его поддержку в Oracle 19c и не объявила о новой опции под названием Standard Edition High Availability (SE2HA), которая при внимательном рассмотрении оказывается даунгрейдом с RAC.

В этой статье я расскажу об отличиях технологий SE2HA и RAC, а также расскажу как тут может пригодиться инструмент для репликации Quest Shareplex. Погнали!

Читать дальше →

SITibekin 8 ноя 2021 в 09:56

Альтернативы HashiCorp Boundary

5 мин

6.8K

Блог компании NixysDevOps * IT-инфраструктура * Базы данных * Системное администрирование *

Перевод

HashiCorp Boundary — это пропускная система с открытым исходным кодом, которая обеспечивает пользователю безопасный доступ к динамическим хостам и критически важной инфраструктуре в разных средах. Однако, если вам нужен простой и безопасный способ управления доступом к базам данных, кластерам Kubernetes, облачным интерфейсам командной строки, коммутаторам, маршрутизаторам или внутренним веб-приложениям, можно рассмотреть и другие сервисы. В этой статье, мы рассмотрим несколько альтернатив и обсудим сильные и слабые стороны каждой из них. Итак, сделаем экспресс-анализ фичей каждого сервиса, которые, возможно, вас заинтересуют.

Читать дальше →

Sber 12 окт 2021 в 12:04

Изменить сохранения Spark Часть вторая: реализация партишенера

44 мин

2.8K

Блог компании СберБазы данных * Big Data *

Изменить сохранения Spark! Часть вторая: реализация партишенера!

unfilled 13 сен 2021 в 17:54

Computed Columns и nvarchar(max)

7 мин

4.2K

SQL * Microsoft SQL Server * Базы данных *

Недавно столкнулся с проблемным запросом, который делал отбор по столбцу с типом nvarchar(max). Про производительность отборов по nvarcar(max) я уже писал, а сейчас решил сделать пост о том, как можно решить проблему, если фильтр по nvarchar(max) нужен.

В первой части я покажу что можно сделать, если на самом деле nvarchar(max) не был нужен, а хватило бы "нормальной" длины, с которой столбец можно проиндексировать. А во второй - что делать, если строка на самом деле такая длинная, что проиндексировать столбец с ней не представляется возможным.

На помощь приходят Computed Columns

severstal 31 мар 2021 в 09:37

Админ, погладь LaMa: как мы прокачали SAP и избавились от рутинных задач

7 мин

3.9K

Блог компании СеверстальERP-системы * Базы данных * IT-инфраструктура *

Привет, Хабр! Я Сергей Маслаков из команды администраторов SAP BASIS в «Северсталь-Инфоком». Хочу рассказать о том, как мы научились управлять всеми ландшафтами SAP-систем из единого интерфейса, автоматизировали значительную часть рутинных задач и ускорили их выполнение. Под катом история о нашем опыте внедрения SAP Landscape Management (LaMa) 3.0, а также подробный гайд по оптимизации процесса обновления систем HANA продуктивными данными.

Приручить LaMa

S0mbre 17 дек 2020 в 01:37

Статистика в кармане: Портативная СУБД с базой Росстата для исследователей и не только

45 мин

13K

Базы данных * Python * PostgreSQL * Big Data *

Возможно, глядя на этот старый советский плакат, вы подумаете, что я здесь буду агитировать сознательных граждан России участвовать в переписи населения… Но спешу вас разуверить: статья вовсе не об этом. Скорее это рассказ о том, какая официальная статистика собирается в России, где ее искать и как скачать все данные к себе на компьютер или портативное устройство (отсюда и название) и удобно ей пользоваться. Если вам это интересно, читайте дальше!

Читать дальше →

flashyua 9 дек 2020 в 17:01

Репликация баз данных MySQL. Введение

9 мин

53K

MySQL * Базы данных *

Редкая современная продакшн система обходится без репликации баз данных. Это мощный инструмент на пути к повышению производительности и отказоустойчивости системы, и современному разработчику очень важно иметь хотя бы общее представление о репликации. В данной статье я поделюсь базовыми знаниями о репликации, и покажу простой пример настройки репликации в MySQL с помощью Docker.

Читать дальше →

felix0id 7 дек 2020 в 11:21

Генератор диаграмм таблиц ClickHouse для PlantUML

4 мин

5.2K

Open source * Python * Базы данных * Визуализация данных * Подготовка технической документации *

Когда появляется необходимость документировать схемы баз данных, разные DBMS предоставляют свои инструменты для подобных задач. И большинство из них поддерживает DESC table_name, в том числе и ClickHouse. Однако, результат этой команды не столь выразителен, как хотелось бы.

DESCRIBE TABLE data_lr

name        type      default_type   default_expression   comment   codec_expression   ttl_expression
Path        String                                                  ZSTD(3)
Value       Float64                                                 Gorilla, LZ4
Time        UInt32                                                  DoubleDelta, LZ4
Date        Date                                                    DoubleDelta, LZ4
Timestamp   UInt32                                                  DoubleDelta, LZ4

При этом, системные таблицы tables и columns содержат исчерпывающую информацию, объединив которую, можно получить вот такой симпатичный результат:

Читать дальше →

1 2 ...

68 69

71 72 ...

84 85

Базы данных *

Поиск и устранение повреждений данных

MapReduce: как и зачем?

Матч Postgres vs Redis — как выбрать правильный инструмент для разных задач

PostgreSQL в «Тензоре» — публикации за год (#3)

Влияние сбора статистик на скорость выполнения запросов в СУБД TERADATA

Как мы с минимальными затратами создали каталог данных над хранилищем

PostgreSQL для звездочетов

Основы CI/CD. Знакомство с Jenkins

Реальные примеры применения Kafka в автопроме

Авторизация в PostgreSQL. Часть 1 — Роли и Привилегии

Как миграция с Oracle на PostgreSQL в облако влияет на сторадж?

Как мы логшипим в Elasticsearch и что думаем о Filebeat

Что случилось с High Availability в Oracle 19c Standard Edition, что такое SE2HA и при чём тут репликация

Ближайшие события

Альтернативы HashiCorp Boundary

Изменить сохранения Spark Часть вторая: реализация партишенера

Computed Columns и nvarchar(max)

Админ, погладь LaMa: как мы прокачали SAP и избавились от рутинных задач

Статистика в кармане: Портативная СУБД с базой Росстата для исследователей и не только

Репликация баз данных MySQL. Введение

Генератор диаграмм таблиц ClickHouse для PlantUML

Вклад авторов