Все потоки

SQL *

Формальный непроцедурный язык программирования

48,11

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Antony_Glyzin 30 апр в 08:15

Пишем свой SQL query builder на Python: DSL, кеширование в Redis и защита от инъекций

Сложный

7 мин

5.4K

SQL * Python * Базы данных * Программирование * Open source *

Туториал

Из песочницы

Объектный построитель SQL-запросов без ORM и моделей. Позволяет писать сложные SQL-запросы в виде цепочек Python-методов (table[‘person’].filter(…).join(…).get()) и получать результат в виде списка словарей. Под капотом — параметризованные запросы для защиты от инъекций, продуманная система кеширования с инвалидацией по таблицам (in-memory и Redis), поддержка синхронного и асинхронного кода из коробки. Для тех случаев, когда ORM избыточна, а сырой SQL небезопасен.

Читать далее

0

svusov 30 апр в 07:09

Объектная модель Sigla Vision

Средний

16 мин

5.3K

Блог компании ГазпромбанкВизуализация данных * SQL * Системное администрирование * Анализ и проектирование систем *

Продолжаем серию публикаций «Адаптивное администрирование Sigla Vision». Часть наших подходов будет полезна и другим ИТ-специалистам, которые развивают или сопровождают аналитические системы — особенно те, что хранят метаданные во внешних СУБД.

В этой статье подробно разберем объектную модель BI-системы. Она помогает лучше понимать работу системы, следить за ее состоянием и контролировать изменения.

В предыдущей статье «Адаптивное администрирование Sigla Vision» мы посмотрели на BI-систему «из коробки» глазами тех, кто ее сопровождает: объяснили, зачем нужны дополнительные данные о работе системы и для чего создавать объектную модель, привели примеры задач, где она используется.

Тема нынешней статьи — основа всего нашего дальнейшего опыта работы с Sigla Vision.

Читать далее

+1

PPR 29 апр в 10:48

Скрытая цена JSONB в PostgreSQL: что происходит при обновлении больших документов

11 мин

9.8K

Блог компании Программный ПродуктSQL * PostgreSQL * Базы данных *

Кейс

jsonb легко полюбить. Он даёт гибкую схему, позволяет не плодить десятки мелких колонок, хорошо подходит для полуструктурированных данных и обычно очень удобен на старте проекта. Пока документы маленькие и меняются редко, кажется, что всё отлично.

Проблемы начинаются позже. Данные растут, в документ добавляются новые поля, часть из них начинает часто обновляться, а потом внезапно выясняется, что вроде бы безобидный UPDATE одного ключа внутри jsonb стоит заметно дороже, чем ожидалось.

В этой статье мы не собираемся доказывать, что jsonb плохой тип данных. Наоборот: jsonb – один из самых полезных инструментов PostgreSQL. Хотелось бы разобраться в более узком вопросе:

что именно происходит, когда мы обновляем один ключ внутри большого JSONB-документа, и чем это отличается от обновления обычной колонки рядом с таким же большим документом?

Читать далее

+16

OWIII 29 апр в 07:08

SQL‑тренажер с автопроверкой и AI‑генерацией задач

Простой

3 мин

8.8K

SQL * Тестирование веб-сервисов *

Кейс

У меня школа тестировщиков. SQL — обязательный блок, потому что без него на собеседовании в любую серьёзную компанию делать нечего, и в реальной работе тестировщику регулярно нужно залезать в базу. На рынке уже существуют (хоть и не так много) SQL‑тренажеры, но мне хотелось сделать удобнее и иметь возможность полностью управлять сервисом и адаптировать под наши нужды. Собственно, ниже, моя разработка.

Читать далее

+1

ph_piter 28 апр в 09:30

Книга: «Антипаттерны PostgreSQL и как их избежать»

3 мин

10K

Блог компании Издательский дом «Питер»Профессиональная литература * PostgreSQL * SQL * Базы данных *

Привет, Хаброжители! Исправление ошибок в базах данных PostgreSQL может быть трудоемким и рискованным процессом — особенно при внесении изменений в работающую систему в реальном времени. К счастью, можно учиться на ошибках, которые уже совершили другие! Автор подробно описывает, как выявлять и предотвращать самые распространенные, опасные и скрытые антипаттерны проектирования при работе с PostgreSQL.

Читать далее

+9

wicsion 27 апр в 15:55

At-least-once. Это не баг провайдера. Это ваша архитектурная проблема

Сложный

37 мин

8.1K

Python * PostgreSQL * SQL * Проектирование и рефакторинг * Высоконагруженные системы *

Кейс

✏️ Технотекст 8

Думал, зайду в крипту и буду просто дёргать API блокчейна. Не вышло.

Захожу в проект. Стек: FastAPI, PostgreSQL, Redis как Celery broker, Celery workers, Docker, Web3. Стартап на хайпе, деньги реальные, архитектура собрана на коленке. Смотрю на архитектуру платёжного процессинга и первая мысль: ребята, вы серьёзно? Финансовые операции с реальными деньгами, без idempotency вообще, Redis как брокер без persistence, Web3.py синхронные вызовы внутри Celery тасков.

Разговор был короткий: задача такая, чини что есть. Сроки горели.

Читать далее

0

jobgemws 24 апр в 11:40

Реализация автоудаления блокирующих сессий в MS SQL

Сложный

35 мин

13K

Блог компании VKMicrosoft SQL Server * SQL * Базы данных * Программирование *

Туториал

✏️ Технотекст 8

Привет, Хабр! Меня зовут Евгений Грибков, я ведущий разработчик в центре технологий VK. В этой статье я покажу решение, к которому мы с коллегами пришли при работе над одной из наших внутренних систем.

Достаточно часто бывает так, что нужно сохранить стабильность работы системы вне зависимости от того, какие запросы выполняются в СУБД. Достичь этого можно разными способами. Я покажу одно из специфических решений — реализацию автокиллера: удаление сессий, которые достаточно долго блокируют запросы других сессий, исходящие от пользователей информационной системы.

Показать реализацию автокиллера

+44

Analytiq 23 апр в 16:26

Как объединить данные Яндекс Метрики и CRM: от загрузки данных до дашборда в DataLens

Простой

6 мин

10K

SQL * Data Engineering * Анализ и проектирование систем * Визуализация данных * Базы данных *

Кейс

Всем привет!

На одном из проектов я настраивал дашборд в Yandex DataLens, который объединяет данные о трафике из Яндекс Метрики с данными о заказах из CRM и позволяет анализировать доход в разрезе источников трафика.

В этой статье расскажу, как был выстроен процесс обработки данных и к какому результату в итоге пришёл.

Читать далее

+1

gg1ZmO 23 апр в 06:45

Black Box пентест: как один домен привёл к полной компрометации инфраструктуры. Часть 1

Средний

5 мин

7.6K

CTF * Joomla * Microsoft SQL Server * SQL * Информационная безопасность *

Кейс

Привет, Хабр! В этой статье я хочу поделиться опытом проведения внешнего black-box пентеста и разобрать методологию, которая позволяет находить критические уязвимости даже при минимальном входном скоупе. Статья будет разбита на две части, про внешний расскажу я, а про внутренний расскажет мой коллега.

Black-box подразумевает, что у пентестера нет никакой внутренней информации: ни списков IP, ни учётных данных, ни описания архитектуры. Только доменное имя - и вперёд. Звучит как ограничение, но на практике это зачастую преимущество: вы смотрите на инфраструктуру глазами реального злоумышленника.

Целью данного пентеста является проверка возможности компрометации внутренней инфраструктуры через веб-приложения.

Читать далее

+5

natalia_ostapenko 22 апр в 10:47

Эти три буквы никого не оставляют равнодушными

Простой

5 мин

7.4K

SQL * Базы данных * Карьера в IT-индустрииУчебный процесс в IT

Туториал

Разберем топ вопросов на знание SQL, которые чаще всего задают на собеседованиях. Я собрала в этот топ свой опыт и опыт коллег, которые недавно проходили собеседования.

Читать далее

-5

kmoseenk 17 апр в 15:05

Как читать BUFFERS в EXPLAIN ANALYZE и находить I/O-узкие места в PostgreSQL

Средний

11 мин

7.2K

Блог компании OTUSБазы данных * SQL * PostgreSQL *

Туториал

Перевод

EXPLAIN ANALYZE часто воспринимается как инструмент, который показывает план выполнения запроса. Но если посмотреть внимательнее на блок BUFFERS, он начинает отвечать на более прикладной вопрос — где именно запрос упёрся в I/O и почему это произошло. В этой статье разберём, как читать эту статистику на уровне отдельных узлов плана, как интерпретировать hit/read в контексте нагрузки и почему сами числа почти ничего не значат без сравнения во времени.

Читать далее

+17

natalia_ostapenko 17 апр в 11:04

Метрики упали в лужу

Средний

8 мин

5.2K

Big Data * SQL * Машинное обучение * Статистика в ITPython *

Кейс

✏️ Технотекст 8

Метрики могут «упасть» даже если вы ничего не меняли в модели.
Разбираемся, как распознать distribution shift и что с ним делать в продакшене.

Читать далее

0

grozauf 16 апр в 17:20

Фитнес план для PostgreSQL своими руками: как похудеть, когда нет доступа к pg_repack и pgcompacttable

Средний

13 мин

12K

Блог компании AvitoTechSQL * PostgreSQL * Базы данных *

Кейс

Привет! В этой статье мы, Павел Лобанов — старший инженер в платформе отправлений и Дмитрий Сидоренко — старший инженер в логистической платформе доставки Авито, расскажем, как решили проблему раздувания размера данных в хранилище без прерывания работы сервиса, сохранив лояльность пользователей и деньги компании.

Эта история о том, как мы придумали и реализовали свой собственный метод, когда никакие другие сторонние инструменты не позволяли сохранять работоспособность сервиса и гарантировать надёжность. Его можно применять во всём мире, где используются платформы на базе PostgreSQL.

Читать далее

+36

ManticoreSearch 16 апр в 12:03

Почему важно мониторить поисковую систему: Manticore → Prometheus → Grafana

4 мин

5.6K

Open source * Поисковая оптимизация * Поисковые технологии * SQL * Базы данных *

Один из наших пользователей недавно пришёл к нам со знакомой проблемой: поиск внезапно стал заметно медленнее, хотя внешне ничего явно не ломалось.

Сервис работал, ошибок в логах не было, загрузка CPU выглядела нормально, но пользователи уже начали жаловаться, что поиск тормозит.

Так обычно и проявляются проблемы с поиском в продакшене. Не как драматичный сбой, а как медленное, ползучее ухудшение. Чуть больше трафика здесь, чуть больше индексации там, и прежде чем вы это заметите, производительность уже просела.

К тому моменту, когда пользователи это замечают, настоящая проблема нередко копится уже несколько часов. Без хорошей видимости остаётся только гадать: система перегружена? Одна таблица съедает ресурсы? Или незаметно что-то идёт не так?

Вот почему мониторинг важен. С ним расплывчатое «поиск стал медленным» превращается в проблему, которую можно диагностировать и исправить.

Читать далее

+2

svusov 16 апр в 07:16

Адаптивное администрирование Sigla Vision / FineBI

9 мин

6.1K

Блог компании ГазпромбанкСистемное администрирование * Визуализация данных * SQL * Анализ и проектирование систем *

Меня зовут Сергей Усов. В Газпромбанке я в составе небольшой команды занимаюсь развитием и сопровождением корпоративной BI-системы на базе решения Sigla Vision (российский форк FineBI).

Мы хотим поделиться практическими наработками с сообществом пользователей Sigla Vision / FineBI — сделать работу с системой удобнее и облегчить жизнь администраторам. При этом часть наших подходов может пригодиться и тем ИТ-специалистам (разработчикам, дата-инженерам, аналитикам), которые сопровождают работу технических систем, имеющих в своем составе БД с репозиториями метаданных. Описанные решения являются общеинженерными и могут быть применены не только к корпоративным аналитическим системам.

Это первая статья из цикла, посвященного нашему опыту администрирования Sigla Vision.

Читать далее

+5

ManticoreSearch 15 апр в 03:53

Мониторинг Manticore Search в Grafana одной командой

4 мин

9.6K

Open source * SQL * Поисковая оптимизация * Поисковые технологии *

Самый неприятный тип инцидента — когда база данных не падает полностью, а просто начинает работать медленнее.

Пользователи замечают это сразу. Жалобы начинают поступать. Технически всё по-прежнему работает, но явно что‑то не так.

И обычно самое сложное здесь не заметить проблему, а понять, что на самом деле происходит.

Читать далее

+11

dimacgka 14 апр в 11:29

Обмен авто на авто: как мы строим Tinder для автомобилей, архитектура Go-монолита за 3 месяца

Средний

11 мин

5.4K

Блог компании PaybeamGo * Развитие стартапаSQL *

Кейс

Я Шевкопляс Дмитрий, технический руководитель проекта Swapno — сервис для обмена автомобилями ключ-в-ключ, без дилеров. Механика — как в Tinder: свайпаешь чужие авто, если оба владельца лайкнули машины друг друга — Swap Match, начинается обмен. В этой статье расскажу, как мы спроектировали и написали бэкенд на Go за 3 месяца: от выбора архитектуры до matching engine, AI-модерации фото и observability в продакшене. С реальными ошибками, которые мы допустили, и тем, как их чинили.

Читать далее

+1

KarimAbushaev 14 апр в 08:31

БАЗЫ ДАННЫХ db. SQL, REDIS, СУБД

Простой

7 мин

5.9K

SQL * SQLite * PostgreSQL * Java * MongoDB *

Туториал

Если серьезно, то сегодня мы поговорим про БАЗЫ данных. Как-то один мой друг разработчик сказал, что программирование можно понимать как

Читать далее

-9

ManticoreSearch 13 апр в 11:18

Параллельное слияние чанков в Manticore Search

6 мин

6.6K

Open source * SQL * Поисковые технологии * Базы данных * Поисковая оптимизация *

Начиная с Manticore Search 24.4.0, компактизация RT-таблиц использует более эффективную модель выполнения. Вместо последовательного слияния пар чанков оптимизация теперь поддерживает два важных улучшения:

Читать далее

+4

badcasedaily1 13 апр в 09:35

GIN‑индексы для JSONB в PostgreSQL: jsonb_ops vs jsonb_path_ops

Средний

7 мин

6.5K

Блог компании OTUSPostgreSQL * SQL * Программирование * Базы данных *

Туториал

С JSONB в PostgreSQL есть одна довольно коварная ловушка: GIN‑индекс вроде бы поставили, запросы вроде бы работают, EXPLAIN не пугает — и на этом многие успокаиваются. Но как только данных становится действительно много, выясняется, что выбор между jsonb_ops и jsonb_path_ops — это не нюанс из документации, а вполне ощутимая разница в размере индекса, количестве лишних проверок и времени выполнения запросов. В этой статье разберём, как устроены оба оператор‑класса, почему один считается универсальным, а второй часто оказывается выгоднее на практике, и в каких случаях дефолтный выбор в PostgreSQL оказывается далеко не лучшим.

Читать далее

+13

1

2 3 ...