SQL *

Формальный непроцедурный язык программирования

chemtech 14 окт 2020 в 07:14

Оператор в Kubernetes для управления кластерами БД. Владислав Клименко (Altinity, 2019)

22 мин

12K

Высоконагруженные системы * Системное администрирование * SQL * Big Data * Хранение данных *

Доклад посвящен практическим вопросам разработки оператора в Kubernetes, проектированию его архитектуры и основных принципов функционирования.

В первой части доклада рассмотрим:

что такое оператор в Kubernetes и зачем он нужен;
как именно оператор упрощает управление сложными системами;
что оператор может, а что оператор не может.

Далее, перейдём к обсуждению внутреннего устройства оператора. Рассмотрим архитектуру и функционирование оператора по шагам. Подробно разберём:

взаимодействие между оператором и Kubernetes;
какие функции оператор берет на себя, а что делегирует в Kubernetes.

Рассмотрим управление шардами и репликами БД в Kubernetes.
Далее, обсудим вопросы хранения данных:

как работать с Persistent Storage с точки зрения оператора;
подводные камни использования Local Storage.

В заключительной части доклада рассмотрим практические примеры применения clickhouse-operator с Amazon или Google Cloud Service. Доклад строится на примере разработки и опыта эксплуатации оператора для ClickHouse.

+11

vlstrochkov 13 окт 2020 в 16:00

Восемь интересных возможностей PostgreSQL, о которых вы, возможно, не знали

8 мин

30K

Блог компании OTUSPostgreSQL * SQL * Базы данных *

Перевод

Привет, Хабр! Приглашаем на бесплатный Demo-урок «Параллельный кластер CockroachDB», который пройдёт в рамках курса «PostgreSQL». Также публикуем перевод статьи Тома Брауна — Principal Systems Engineer at EnterpriseDB.

В этой статье рассмотрим несколько полезных советов по работе с PostgreSQL: ссылка на всю строку целиком, сравнение нескольких столбцов, общие табличные выражения, пользовательские параметры конфигурации, сравнение логических значений без "равно", изменение типа столбца без лишних затрат, информация о секции, в которой находится строка, таблицы — это типы.

+33

chemtech 13 окт 2020 в 10:02

Что и зачем мы делаем в Open Source базах данных. Андрей Бородин (Яндекс.Облако)

19 мин

5.4K

PostgreSQL * SQL * Базы данных * Серверное администрирование * Системное администрирование *

Будет рассмотрен вклад Яндекса в следующие базы данных.

ClickHouse
Odyssey
Восстановление на точку во времени (WAL-G)
PostgreSQL (включая logerrors, Amcheck, heapcheck)
Greenplum

+10

erogov 12 окт 2020 в 15:59

«Жизнь» на PostgreSQL

4 мин

21K

Блог компании Postgres ProfessionalНенормальное программирование * SQL * PostgreSQL *

Недавно на Хабре была опубликована статья Морской бой в PostgreSQL. Должен признаться: я обожаю решать на SQL задачи, для SQL не предназначенные. Особенно одним SQL-оператором. И полностью согласен с авторами:

Использование специальных инструментов не по назначению часто вызывает негатив со стороны профессионалов. Однако решение бессмысленных, но интересных задач тренирует нестандартное мышление и позволяет изучить инструмент с разных точек зрения в поиске подходящего решения.

И еще. Будем честны: всегда использовать SQL по назначению — тоска зеленая. Вспомните, какие примеры приводятся во всех учебниках, начиная с той самой статьи Кодда? Поставщики да детали, сотрудники да отделы… А где же удовольствие, где же фан? Для меня один из источников вдохновения — сравнение процедурных решений с декларативными.

Я, позвольте, не буду объяснять, что такое Жизнь Джона Конвея. Скажу только, что — оказывается — используя клеточный автомат Жизни, можно построить универсальную машину Тьюринга. Мне кажется, это грандиозный факт.

Так вот, можно ли реализовать игру Жизнь одним оператором SQL?

Конечно можно

+74

chemtech 9 окт 2020 в 10:55

Odyssey roadmap: что ещё мы хотим от пулера соединений. Андрей Бородин (2019)

15 мин

5.1K

PostgreSQL * SQL * Базы данных * Серверное администрирование * Системное администрирование *

В докладе Андрей Бородин расскажет, как они учли опыт масштабирования PgBouncer при проектировании пулера соединений Odyssey, как выкатывали его в production. Кроме того, обсудим какие функции пулера хотелось бы видеть в новых версиях: нам важно не только закрывать свои потребности, но развивать сообщество пользователей Одиссея.

+13

Kilor 7 окт 2020 в 16:00

PostgreSQL Antipatterns: убираем медленные и ненужные сортировки

5 мин

22K

Блог компании ТензорВысоконагруженные системы * Базы данных * SQL * PostgreSQL *

«Просто так» результат SQL-запроса возвращает записи в том порядке, который наиболее удобен серверу СУБД. Но человек гораздо лучше воспринимает хоть как-то упорядоченные данные — это помогает быстро сравнивать соответствие различных датасетов.

Поэтому со временем у разработчика может выработаться рефлекс «Дай-ка я на всякий случай это вот отсортирую!» Конечно, иногда подобная сортировка бывает оправдана прикладными задачами, но обычно такой случай выглядит как в старом анекдоте:

Программист ставит себе на тумбочку перед сном два стакана. Один с водой — на случай, если захочет ночью пить. А второй пустой — на случай, если не захочет.

Давайте разбираться — когда сортировка в запросе точно не нужна и несет с собой потерю производительности, когда от нее можно относительно дешево избавиться, а когда сделать из нескольких — одну.

Читать дальше →

+24

Leono 6 окт 2020 в 07:59

Базы данных: большой обзор типов и подходов. Доклад Яндекса

28 мин

89K

Блог компании ЯндексSQL * Базы данных * Анализ и проектирование систем * Хранение данных *

Это конспект лекции Татьяны Денисовой tdenisova — бэкенд-разработчика в Яндекс.Учебнике. Вы узнаете, какие бывают базы данных, какие их особенности важно помнить, как в работе с данными учитывать характеристики системы и планы масштабирования, в какую из тем нужно углубиться для решения конкретной задачи. А также как при возникновении багов определить, является ли работа с БД источником проблемы (и если да, то в какую сторону копать).

— О чем именно мы будем говорить? Не о примитивных селектах и джойнах — о них, я думаю, большинство из вас уже знает.

Читать дальше →

+28

shmelev-1987 6 окт 2020 в 00:10

Импорт/экспорт баз данных. Что нужно в подобных приложениях? Опрос

1 мин

6.7K

SQL * Microsoft SQL Server *

Приложений для конвертации данных в БД очень много и у каждого есть какая-то особенность. Так как сам пишу универсальное приложение ImportExportDataSql для импорта/экспорта данных (пока только Microsoft SQL Server и под Windows), то хочу собрать статистику о том, какими функциями вы пользуетесь в подобных приложениях и за что Вам нравится то или иное приложение?

Надеюсь, что у Вас найдется пару минут, чтобы принять участие в опросе.

Читать дальше →

MaxRokatansky 5 окт 2020 в 11:39

Шифрование в MySQL: хранилище ключей

6 мин

7.6K

Блог компании OTUSMySQL * SQL * Базы данных *

Перевод

В преддверии старта нового набора на курс «Базы данных» подготовили для вас перевод полезной статьи.

Прозрачное шифрование данных (Transparent Data Encryption, TDE) появилось в Percona Server for MySQL и MySQL довольно давно. Но задумывались ли вы когда-нибудь о том, как оно работает под капотом и какое влияние TDE может оказывать на ваш сервер? В этой серии статей мы рассмотрим, как TDE работает внутри. Начнем с хранения ключей, так как оно требуется для работы любого шифрования. Затем подробно рассмотрим как работает шифрование в Percona Server for MySQL/MySQL и какие дополнительные возможности есть в Percona Server for MySQL.

Читать дальше →

diego_milito 3 окт 2020 в 08:08

Мониторинг места в хранилищах

8 мин

5.3K

SQL * Microsoft SQL Server * Big Data * Хранение данных *

Всем привет Хабровчане!!

Одной из проблем хранилищ данных, которая часто возникает в процессе работы - это постоянное увеличение их размеров. А добавление все новых и новых источников данных только ускоряет заполнение места на дисках.

Да, конечно же настройка чистки самых больших таблицы и периода историцируемости позволяет сократить неконтролируемое увеличение места. Но если речь идет о хранилищах, которые бодро наполняются и добавляются всё новые "большие" таблицы, и количество их увеличивается то вопрос места в DWH всегда становится ребром....

Kilor 1 окт 2020 в 18:45

PostgreSQL Antipatterns: «Бесконечность — не предел!», или Немного о рекурсии

4 мин

9.4K

Блог компании ТензорPostgreSQL * SQL * Базы данных * Программирование *

Рекурсия — очень мощный и удобный механизм, если над связанными данными делаются одни и те же действия «вглубь». Но неконтролируемая рекурсия — зло, которое может приводить или к бесконечному выполнению процесса, или (что случается чаще) к «выжиранию» всей доступной памяти.

СУБД в этом отношении работают по тем же принципам — "сказали копать, я и копаю". Ваш запрос может не только затормозить соседние процессы, постоянно занимая ресурсы процессора, но и «уронить» всю базу целиком, «съев» всю доступную память. Поэтому защита от бесконечной рекурсии — обязанность самого разработчика.

В PostgreSQL возможность использовать рекурсивные запросы через WITH RECURSIVE появилась еще в незапамятные времена версии 8.4, но до сих пор можно регулярно встретить потенциально-уязвимые «беззащитные» запросы. Как избавить себя от проблем подобного рода?

Читать дальше →

+15

grichik 1 окт 2020 в 07:00

10 приёмов работы с Oracle

26 мин

74K

Блог компании СберSQL * Базы данных * Программирование *

В Сбере есть несколько практик Oracle, которые могут оказаться вам полезны. Думаю, часть вам знакома, но мы используем для загрузки не только ETL-средства, но и хранимые процедуры Oracle. На Oracle PL/SQL реализованы наиболее сложные алгоритмы загрузки данных в хранилища, где требуется «прочувствовать каждый байт».

Автоматическое журналирование компиляций
Как быть, если хочется сделать вьюшку с параметрами
Использование динамической статистики в запросах
Как сохранить план запроса при вставке данных через database link
Запуск процедур в параллельных сессиях
Протягивание остатков
Объединение нескольких историй в одну
Нормалайзер
Визуализация в формате SVG
Приложение поиска по метаданным Oracle

Читать дальше →

+16

olegbunin 29 сен 2020 в 14:37

Переезжаем на ClickHouse: 3 года спустя

19 мин

25K

Блог компании Конференции Олега Бунина (Онтико)Big Data * SQL * Базы данных * Системное администрирование *

Три года назад Виктор Тарнавский и Алексей Миловидов из Яндекса на сцене HighLoad++ рассказывали, какой ClickHouse хороший, и как он не тормозит. А на соседней сцене был Александр Зайцев с докладом о переезде на ClickHouse с другой аналитической СУБД и с выводом, что ClickHouse, конечно, хороший, но не очень удобный. Когда в 2016 году компания LifeStreet, в которой тогда работал Александр, переводила мультипетабайтовую аналитическую систему на ClickHouse, это была увлекательная «дорога из желтого кирпича», полная неведомых опасностей — ClickHouse тогда напоминал минное поле.

Три года спустя ClickHouse стал гораздо лучше — за это время Александр основал компанию Altinity, которая не только помогает переезжать на ClickHouse десяткам проектов, но и совершенствует сам продукт вместе с коллегами из Яндекса. Сейчас ClickHouse все еще не беззаботная прогулка, но уже и не минное поле.

Александр занимается распределенными системами с 2003 года, разрабатывал крупные проекты на MySQL, Oracle и Vertica. На прошедшей HighLoad++ 2019 Александр, один из пионеров использования ClickHouse, рассказал, что сейчас из себя представляет эта СУБД. Мы узнаем про основные особенности ClickHouse: чем он отличается от других систем и в каких случаях его эффективнее использовать. На примерах рассмотрим свежие и проверенные проектами практики по построению систем на ClickHouse.

+32

Kilor 23 сен 2020 в 07:25

PostgreSQL 13: happy pagination WITH TIES

2 мин

13K

Блог компании ТензорВысоконагруженные системы * Базы данных * SQL * PostgreSQL *

На прошедшей неделе вышло сразу две статьи (от Hubert 'depesz' Lubaczewski и автора самого патча Alvaro Herrera), посвященные реализованной в грядущей версии PostgreSQL 13 поддержке опции WITH TIES из стандарта SQL:2008:

OFFSET start { ROW | ROWS } FETCH { FIRST | NEXT } [ count ] { ROW | ROWS } { ONLY | WITH TIES }

Что это, и как оно избавляет от проблем с реализацией пейджинга, о которых я рассказывал в статье «PostgreSQL Antipatterns: навигация по реестру»?

Читать дальше →

+37

Firemoon 22 сен 2020 в 09:00

Морской бой в PostgreSQL

5 мин

13K

Блог компании SelectelPostgreSQL * SQL * Ненормальное программирование * Разработка игр *

Программисты ведут ожесточенные споры о вреде и пользе хранимых процедур в базах данных. Сегодня мы отвлечемся от них и снова сделаем невероятное в невозможных условиях.

Сегодня разработчики по возможности стараются не выстраивать бизнес-логику в базах данных. Тем не менее, находятся энтузиасты, которые бросают себе вызов и создают, например, матчер биржи, а иногда целые компании переводят серверную часть на хранимые процедуры БД. Авторы таких проектов утверждают, что на базах данных можно сделать все, что угодно, если захотеть.

Читать дальше →

+25

NewTechAudit 22 сен 2020 в 06:07

Машинное обучение в среде SQL Server

3 мин

6.1K

Microsoft SQL Server * R * SQL * Машинное обучение *

Инструментарий ML внутри SQL Server

В этой статье описаны шаги по созданию процедуры, которая использует набор данных mtcars, входящий в состав R, на основе которой создается простая обобщенная линейная модель (ОЛМ), способная прогнозировать вероятность оснащения автомобиля механической коробкой передач. Вторая процедура предназначена для оценки — она вызывает модель, созданную в первой процедуре, для вывода набора прогнозов на основе новых данных.

Читать дальше →

MaxRokatansky 21 сен 2020 в 09:19

Производительность вычисляемых столбцов в SQL Server

9 мин

16K

Блог компании OTUSSQL * Microsoft SQL Server *

Перевод

Перевод статьи подготовлен специально для студентов курса «MS SQL Server Developer».

Вычисляемые столбцы могут стать причиной сложнодиагностируемых проблем с производительностью. В этой статье рассматривается ряд проблем и некоторые способы их решения.

Вычисляемые столбцы представляют собой удобный способ для встраивания вычислений в определения таблиц. Но они могут быть причиной проблем с производительностью, особенно когда выражения усложняются, приложения становятся более требовательными, а объемы данных непрерывно увеличиваются.

Вычисляемый столбец — это виртуальный столбец, значение которого вычисляется на основе значений в других столбцах таблицы. По умолчанию вычисленное значение физически не сохраняется, а вместо этого SQL Server вычисляет его при каждом запросе столбца. Это увеличивает нагрузку на процессор, но уменьшает объем данных, которые необходимо сохранять при изменении таблицы.

Читать дальше →

RalfHacker 19 сен 2020 в 16:01

HackTheBox. Прохождение Multimaster. Burp+Sqlmap. AD users from MSSQL. Уязвимость в VSCode. AMSI bypass и CVE ZeroLogon

7 мин

10K

Информационная безопасность * SQL * Python * CTF *

Туториал

Привет, с вами Ральф. Продолжаю публикацию решений, отправленных на дорешивание машин с площадки HackTheBox.

В данной статье очень много всего. Посмотрим как для удобства совместить Burp Suite и sqlmap, узнаем как получить пользователей домена имея доступ к MSSQL, эксплуатируем уязвимость в Visual Studio Code, блокируем AMSI, выполняем AS-REP Roasting для получения учетных данных и повышаем привилегии из группы Server Operators. А в качестве демонстрации новой уязвимости ZeroLogon, захватим эту же машину другим путем меньше чем за 5 минут.

Подключение к лаборатории осуществляется через VPN. Рекомендуется не подключаться с рабочего компьютера или с хоста, где имеются важные для вас данные, так как Вы попадаете в частную сеть с людьми, которые что-то да умеют в области ИБ.

Организационная информация

Чтобы вы могли узнавать о новых статьях, программном обеспечении и другой информации, я создал канал в Telegram и группу для обсуждения любых вопросов в области ИиКБ. Также ваши личные просьбы, вопросы, предложения и рекомендации рассмотрю лично и отвечу всем.

Читать дальше →

+16

sahsAGU 17 сен 2020 в 07:00

С нуля до автоматизации контейнеров за 7 минут

6 мин

3.5K

Блог компании MicrosoftGit * GitHub * Microsoft Azure * SQL *

Перевод

В статье ранее (на португальском) я рассказал, как создать полнофункциональный бэкенд GraphQL, используя только образ Docker и файл конфигурации. Все это можно найти на сайте Azure. А сейчас давайте поговорим о том, как автоматизировать развертывания, созданные для нашего хостинга, и обновления нашей серверной части!

Целью всего этого проекта является создание серверной части для моего будущего архива содержимого, который будет размещен на моем сайте. Однако всякий раз, когда я обновляю серверную часть или меняю схему GraphQL, мне придется выполнять полное развертывание службы снова.

Вместо этого мне бы хотелось, чтобы с каждым push в главной ветке генерировалась новая версия файла и обновление отправлялось на сайт Azure. Однако я не хочу использовать для этого другие инструменты. Мне бы хотелось, чтобы весь стек был максимально простым, так как мы пользуемся только GitHub и Azure. Нет ничего проще, чем продолжать пользоваться GitHub для автоматизации, верно?

Вот почему мы будем использовать GitHub Actions

Читать дальше →

chemtech 15 сен 2020 в 07:23

Возможности ClickHouse для продвинутых разработчиков. Алексей Миловидов (2018г)

23 мин

21K

Высоконагруженные системы * Системное администрирование * SQL * Big Data * Хранение данных *

В докладе планируется рассмотреть малоизвестные или недостаточно хорошо освещённые в документации возможности ClickHouse: инкрементальная агрегация и манипуляции с состояниями агрегатных функций, межкластерное копирование, выполнение запросов без использования сервера и т.п. Будут приведены примеры из практики разработки сервисов Яндекса: как выжать из системы максимум возможного.

+12

1 2 ...

57 58

60 61 ...

106 107

SQL *

Оператор в Kubernetes для управления кластерами БД. Владислав Клименко (Altinity, 2019)

Восемь интересных возможностей PostgreSQL, о которых вы, возможно, не знали

Что и зачем мы делаем в Open Source базах данных. Андрей Бородин (Яндекс.Облако)

«Жизнь» на PostgreSQL

Odyssey roadmap: что ещё мы хотим от пулера соединений. Андрей Бородин (2019)

PostgreSQL Antipatterns: убираем медленные и ненужные сортировки

Базы данных: большой обзор типов и подходов. Доклад Яндекса

Импорт/экспорт баз данных. Что нужно в подобных приложениях? Опрос

Шифрование в MySQL: хранилище ключей

Мониторинг места в хранилищах

PostgreSQL Antipatterns: «Бесконечность — не предел!», или Немного о рекурсии

10 приёмов работы с Oracle

Переезжаем на ClickHouse: 3 года спустя

Ближайшие события

PostgreSQL 13: happy pagination WITH TIES

Морской бой в PostgreSQL

Машинное обучение в среде SQL Server

Производительность вычисляемых столбцов в SQL Server

HackTheBox. Прохождение Multimaster. Burp+Sqlmap. AD users from MSSQL. Уязвимость в VSCode. AMSI bypass и CVE ZeroLogon

С нуля до автоматизации контейнеров за 7 минут

Возможности ClickHouse для продвинутых разработчиков. Алексей Миловидов (2018г)

Вклад авторов