Обновить
132.38

Базы данных *

Все об администрировании БД

Сначала показывать
Порог рейтинга
Уровень сложности

Когда незаконно использовали базу данных: 5 судебных процессов и чем это закончилось

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели4.4K

База данных по российскому гражданскому законодательству — это ряд самостоятельных систематизированных материалов, которые можно найти и обработать, используя ЭВМ (статья 1260 Гражданского Кодекса РФ). База данных защищается юридически, виновные в ее незаконном заимствовании могут быть привлечены к гражданско-правовой, административной и даже уголовной ответственности.

Читать далее

Новости

GraphRAG: 8 способов укротить расширенный контекст у LLM

Уровень сложностиСложный
Время на прочтение24 мин
Охват и читатели3.5K

В 22% случаев онкологи не могут назначить лечение из-за рисков, связанных с хроническими заболеваниями. Сегодня разбираем кейс, в котором ИИ помогает врачам решать сложнейшие когнитивные задачи, связанные с лечением различных видов рака. Рассказываем про методологию GraphRAG, разбираем, как устроены и работают решения из кейса и проводим сравнительный анализ всех способов решить эту сложнейшую задачу.

Привет, Хабр! Это Андрей Носов, AI-архитектор из Raft. Я проектирую и создаю системы, которые должны стоять годами — сегодня речь пойдёт именно о них. В этой статье по мотивам моего доклада на AI Сonf 2025 я расскажу, как превратить стандартные RAG-системы из простых источников знаний в управляемый инструмент, способный справиться со сложным контекстом. Вас ждёт не просто технический обзор, а практическое руководство, где мы пойдём от прода к проду.

Читать далее

CDC своими руками: Kafka + Debezium в домашней лаборатории

Время на прочтение9 мин
Охват и читатели10K

Третья статья цикла о построении CDC-пайплайна с нуля. Сегодня — самое интересное: захватываем изменения из PostgreSQL и отправляем в Kafka. И разбираемся, почему WAL может съесть весь диск, даже если данные не меняются.

Читать далее

Проектирование быстрых кубов: ключевые принципы производительной архитектуры многомерных БД

Время на прочтение6 мин
Охват и читатели4.3K

Многомерные базы данных (MDB) — это незаметные, но критически важные механизмы практически всех систем корпоративного управления эффективностью (EPM): Oracle EPM Cloud и Essbase, IBM Planning Analytics (TM1), Anaplan, Microsoft SSAS, Optimacros и многих других. Именно они лежат в основе бюджетирования, прогнозирования, моделей прибыльности и управленческой отчетности, позволяя анализировать показатели в разрезе времени (периодов), бизнес‑подразделений (организаций), продуктов, сценариев, версий и иных измерений. При этом, несмотря на огромную аналитическую мощность, MDB чрезвычайно чувствительны к архитектуре. Разница между кубом (MDB), который отвечает мгновенно, и кубом, который «думает» минутами, чаще всего определяется не железом и не ПО, а тем, как он спроектирован.

В своей основе MDB переводят сложную реальность бизнеса в формализованные измерения, иерархии и элементы. Каждое измерение — время, организация, счет, продукт, сценарий — добавляет гибкости анализа, но одновременно экспоненциально увеличивает сложность. Каждый новый элемент или узел иерархии умножает количество потенциальных пересечений данных. Большинство из них останутся пустыми, но всё равно будут потреблять ресурсы хранения, расчётов и обработки запросов. Поэтому хорошая размерностная модель — это не просто вопрос структуры, а фундамент производительности.

Меня зовут Кирилл Паршин, я ведущий консультант в департаменте EPM «КОРУС Консалтинг». Эта статья посвящена архитектурным аспектам производительности многомерных баз данных: как количество и состав измерений влияют на объём, как иерархии и агрегации нагружают систему, и почему стратегии выборки и расчётов могут либо ускорить модель, либо сделать её неработоспособной. Это не разбор конкретной технологии — здесь собраны универсальные принципы, одинаково применимые к Essbase, TM1, Anaplan, SSAS, Optimacros и другим MDB‑движкам.

Читать далее

Разбираемся в функциональных зависимостях БД

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели11K

Привет Хабр! Возможно вас, как и меня, первое знакомство с функциональными зависимостями в базах данных повергло в легкий ступор. Длинные определения, которые не давались даже после третьего прочтения, излишняя абстрактность, когда на простые и понятные примеры поскупились, и прочее прелести «научного» подхода к объяснению сложных тем.

Пора раз и навсегда разобраться во всем этом. Тем не менее, я постараюсь не упускать детали и, где это уместно, углубиться в тему с головой. Без претензии на академичность, но с претензией на ясность. Начнем.

Читать далее

Как перенести свои данные в Digital Q.DataBase из других СУБД

Время на прочтение9 мин
Охват и читатели4.7K

Привет, Хабр!

В предыдущей статье мы рассказали, как установить Digital Q.DataBase на Astra Linux 1.8 и начать работу с этой российской СУБД, которая поддерживает нативную работу с диалектами MS SQL, PostgreSQL и Oracle. Сегодня мы поговорим о том, как перенести уже существующие данные в Digital Q.DataBase из других систем управления базами данных. 

Для решения поставленной задачи мы разработали инструмент – Мастер переноса БД. Он позволяет выгрузить структуру, данные и хранимую логику из уже развернутой БД на одной из трех СУБД (Oraсle, MS SQL и PostgreSQL) и загрузить их в Digital Q.DataBase без переписывания кода приложений в отличие от любых миграторов-конверторов.

Читать далее

Django ORM: как QuerySet ленится, цепляется и генерирует SQL

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.9K

Django ORM прячет SQL за красивым Python-интерфейсом. Пишешь User.objects.filter(active=True).order_by('name')[:10] — получаешь список пользователей. Круто. Но когда запросы тормозят или N+1 пожирает базу, приходится понимать, что вообще происходит.

Разберём внутренности QuerySet: почему он ленивый, как работает chaining, когда запрос реально выполняется, и чем select_related отличается от prefetch_related на уровне SQL.

Читать далее

Postgres Pro Enterprise 18: встроенный in-memory кеш и новые горизонты отказоустойчивости

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8.6K

Асинхронный ввод-вывод, ML-оптимизация планов запросов и встроенный пулинг соединений — ключевые особенности новой Postgres Pro Enterprise 18. Релиз объединил возможности ванильного ядра PostgreSQL 18 и Enterprise-инструменты для работы с большими данными. Расскажем про технические детали, новые стратегии сканирования индексов и механизмы масштабирования записи.

Читать далее

Как запрос из DuckDB упёрся в PostgreSQL: 507 секунд по EXPLAIN ANALYZE

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели7.5K

Оконные функции в SQL выглядят безобидно ровно до того момента, пока не попадают на реальные объёмы данных. В этой статье разбирается конкретный аналитический запрос в PostgreSQL: от формулировки задачи и использования lead() до детального анализа плана выполнения с EXPLAIN ANALYZE. Без абстракций и «магии оптимизатора» — только факты, цифры, сортировки на диск, буферы и выводы, которые полезно уметь делать любому аналитику, работающему с большими таблицами.

Читать далее

Я решил написать ухудшенный UUID по ничтожнейшим из причин

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.4K

Вчера я баловался с проектом API, которым занимаюсь уже долгое время. Подобные проекты мы обычно переписываем снова и снова на протяжении многих лет, чтобы поддерживать высокий уровень дофамина от рефакторинга. Вы понимаете, о чём я. На этот раз совершенно внезапно я кое-что осознал. Мне нужно отрефакторить одну вещь. Я достаточно активно пользуюсь UUID, поэтому URL моих ресурсов очень длинные и некрасивые.

В зависимости от версии и варианта в UUID есть множество разной информации, но по большей мере это куча случайных битов, которые и обеспечивают свойство «универсальной уникальности», которое нам так нравится. Но если по какой-то причине вам не нравится проверенный временем стандарт с огромной экосистемой нативной поддержки... то эта статья для вас!

Читать далее

Postgres по-русски: где наши Aurora, AlloyDB и Neon?

Время на прочтение6 мин
Охват и читатели7.5K

Базы данных давно являются фундаментом цифровой экономики. От их архитектуры и производительности во многом зависят скорость вывода продуктов на рынок, стабильность сервисов и итоговая стоимость ИТ-инфраструктуры. В мировой практике одним из основных стандартов де-факто, вокруг которого формируются экосистемы серьезных решений, стала открытая СУБД PostgreSQL. В России она используется во множестве корпоративных приложений, есть целый ряд отечественных форков и дистрибутивов. Но у ряда зарубежных компаний( есть серьезные прорывные реализации, интенсивно развивающие Postgres (например, Aurora, AlloyDB и Neon, об этом ниже), а у российских этого почему-то не наблюдается. Это противоречие между массовым использованием PostgreSQL в нашей стране и отсутствием технологического прорыва задает остроту сегодняшней повестки отечественного СУБД-строения.

Читать далее

Как организовать Базу знаний с пользой для авторов и читателей. Часть 2. Ревью

Время на прочтение12 мин
Охват и читатели4K

Ситуация: открываете базу знаний и понимаете — что-то с ней не так, и каждый раз кто-то приходит с одними и теми же вопросами. Вы — тимлид/техлид/knowledge-менеджер, который знает ответы на все вопросы. Но времени на работу не остаётся как раз из-за разрешения всяких мелочей. Знакомо?

Привет, Хабр! Меня зовут Анастасия Граф. Я руковожу отделом разработки технической документации в Maxim Technology — компания делает Ride Tech сервис для такси Maxim. Мы первыми в России запустили цифровую платформу. Этот материал готовился по мотивам доклада для TeamLead Conf.

В предыдущей части статьи об организации Базы знаний мы сформулировали универсальные требования к ней и разобрались, с чего начать в принципе на примере процессов в Maxim Technology. Сегодня выясним, зачем нужно ревью любой документации и как оно поможет повысить уровень знаний в командах.

Читать далее

Горизонтальное масштабирование 1С: переносим отчеты на реплику без потери производительности

Время на прочтение13 мин
Охват и читатели8.7K

В статье рассматриваются текущие возможности горизонтального масштабирования СУБД для 1С, а также какое решение предлагает Tantor Postgres.

Читать далее

Ближайшие события

Когда gfix бессилен: инструмент восстановления БД Firebird, спасаем данные

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели5K

Разбираем бинарный формат Firebird по байтам: структура страниц, транзакции, MVCC. Пишем утилиту на Delphi для восстановления данных, когда gfix и gbak бессильны.

Читать далее

PostgreSQL для CDC-пайплайна: настраиваем logical replication за 30 минут

Время на прочтение9 мин
Охват и читатели7.6K

Вторая статья цикла «CDC Pipeline в домашней лаборатории». В первой мы сделали Telegram-бота для парсинга банковских скриншотов. Теперь подготовим PostgreSQL к тому, чтобы Debezium мог захватывать изменения в реальном времени.

Читать далее

Распространенные ошибки при создании приложений с генеративным ИИ

Время на прочтение8 мин
Охват и читатели6.5K

Поскольку мы все еще только осваиваем создание приложений с использованием базовых моделей, ошибки вполне нормальны. Это краткая заметка с примерами некоторых из наиболее распространенных ошибок, которые я видел как в публичных кейсах, так и в своем личном опыте.

Эти ошибки являются распространенными, поэтому, если вы работали над каким-либо продуктом, связанным с ИИ, вы, вероятно, уже сталкивались с ними.

Читать далее

Базы данных-2025: ретроспектива

Уровень сложностиПростой
Время на прочтение23 мин
Охват и читатели9.1K

Базы данных прибыльнее нефти? В 2025 году Ларри Эллисон стал самым богатым человеком в истории человечества, обойдя Рокфеллера. Тем временем на рынке M&A настоящий пожар: миллиардные сделки, банкротства и судебные иски MongoDB против конкурентов. Перевели подробный разбор того, кто выиграл, а кто проиграл в битве за данные в этом году.

Читать далее

Как я ускорил наш Prisma API в 5 раз без переписывания запросов

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели6.4K

Путь разработчика от «Prisma — это магия» через «почему это так медленно?» к решению, которое сохраняет и DX, и производительность.

Читать далее

Как организовать базу знаний с пользой для авторов и читателей. Часть 1: проектирование или реинжиниринг

Время на прочтение9 мин
Охват и читатели5.3K

Контент в базе знаний не может существовать сам по себе — его нужно организовать и им нужно управлять. Именно этому я посвятила серию статей.

Привет, Хабр! Меня зовут Анастасия Граф, я руковожу отделом разработки технической документации в Maxim Technology. За плечами — 16 лет преподавания математического моделирования в вузе и восемь в управлении и реинжиниринге базы знаний службы поддержки большой государственной информационной системы, разработке и внедрении методологии наполнения, актуализации, верификации базы знаний разработки, юротдела и нескольких торговых предприятий.

В этой части разберёмся с универсальными требованиями к базе знаний на примере Confluence и с чего начать  «уборку»: как сортировать содержания накопленных знаний, что учесть и как это может в итоге выглядеть. Статья подготовлена по мотивам доклада на Saint TeamLead Conf.

Читать далее

Интерактивный SQL в браузере: как я создал встраиваемую песочницу с поддержкой 20+ СУБД

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.5K

В статье разбирается техническая реализация SQLize Embed — легковесного JS-компонента для создания интерактивных песочниц прямо в тексте технических статей. Автор подробно описывает архитектуру решения: от использования MutationObserver для инициализации редакторов на фронтенде до обеспечения безопасности и изоляции запросов в Docker-контейнерах на бэкенде.

Вы узнаете, как реализована поддержка более 20 СУБД (включая PostgreSQL 18, MS SQL 2025 и Oracle 23ai) и как встроить «живые» примеры кода в свой проект всего парой строк HTML.

Читать далее
1
23 ...