Safreliy 9 сен 2024 в 10:54

Нейронные оптимизаторы запросов в реляционных БД (Часть 1)

Средний

15 мин

8.5K

Блог компании Postgres ProfessionalМашинное обучение * Искусственный интеллектPostgreSQL * Алгоритмы *

Обзор

+33

Комментарии 9

Tzimie 9 сен 2024 в 14:34

А вот это интересно

cross_join 9 сен 2024 в 15:43

Первый вопрос, сколько понадобится ядер, чтобы оптимизация плана работало с приемлемой скоростью в реальном времени? Промышленная СУБД может обслуживать тысячи запросов в секунду на нескольких ядрах.

Tzimie 9 сен 2024 в 15:51

Скорее всего это может быть background process, который идёт по уже построенным планам, которые используются наиболее часто

Safreliy 9 сен 2024 в 16:32

В этой статье рассмотрены пионеры области, что отметил в заключении. Поэтому думать о серьёзном внедрении таких решений в прод я бы не стал. По скорости работы на единичных запросах стандартные оптимизаторы проигрывают нейросетевым. Однако в реальности есть много динамики - данные и структура БД постоянно меняются, частые запросы кэшируются, индексы перестраиваются и т.д. и т.п. В этих условиях нейросетям становится плохо и решение всех этих проблем - предмет следующих статей. Там уже будут показаны модели, протестированные в боевых условиях, которые либо сравниваются, либо превосходят существующие оптимизаторы по скорости и качеству работы на одном и том же железе.

cross_join 9 сен 2024 в 16:48

Видимо, я недостаточно точно задал вопрос. Откинем пока условия промышленной эксплуатации, инфраструктуру и вопросы динамики.
Допустим есть пакет запросов и статическая БД заданного объема. На условном SQL Server elapsed time и CPU time будут такими-то на N ядрах. Сколько потребуется ядер, чтобы достигнуть того же результата по времени на нейросети?

Safreliy 9 сен 2024 в 18:38

Для DQ, относительно сложной RL-модели, используют 32 ядра при сравнении стандартного и нейросетевого оптимизатора.

В других моделях чётко не указывали результаты эксперимента в связи с изменением количества ядер, что на самом деле является интересным вопросом. Могу, исходя из опыта, предположить, что в связи с небольшой способностью параллелиться на CPU, маленькие нейросети будут сравнительно эффективнее отрабатывать на небольших мощностях, порядка 8 ядер. Скорость инференса растёт нелинейно, следовательно, может быть момент, когда очередное добавленное CPU позволит перебрать варианты быстрее и получить лучший результат с использованием обычных оптимизаторов. Однако, это утверждение нужно проверять.

cross_join 10 сен 2024 в 08:15

Видимо, в этом основная проблема, подход слишком ресурсозатратный. Для сравнения, 2005 год, SQL Server на физических 8 ядрах обслуживает запросы от 1500 пользователей онлайн с приемлемым качеством (небольшой процент плохих планов корректируется руками). Каждое ядро лицензируется и обходится примерно в $3-5К. Если сюда добавить 32 ядра для небольшого улучшения оптимизации, то цена решения может стать неприемлемой.

Safreliy 10 сен 2024 в 08:26

Да, в этом есть смысл. Конечно, небольшая GPU для подобных задач обойдётся дешевле, но немногие готовы к кардинальным изменениям инфраструктуры ради не самой большой оптимизации. Облака отчасти решают данную проблему, однако везде есть свои "но".

cross_join 10 сен 2024 в 08:29

С облаками другая проблема, затраты нефиксированные. Да, можно легко добавить реурсы, но далеко не всегда это нужно. Если БД эксплуатируется в стабильном режиме, то аренда/покупка сервера будет гораздо выгоднее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий