qdreadknight19 фев 2017 в 17:46

Как спасти проект от закрытия, разобравшись с MySQL

4 мин

22K

MySQL * Разработка игр *

Туториал

+11

116

Комментарии 116

НЛО прилетело и опубликовало эту надпись здесь

poxvuibr 19 фев 2017 в 20:24

А есть такие ОРМ, которые могут анализировать запросы и давать рекомендации по добавлению индексов и всего такого?

НЛО прилетело и опубликовало эту надпись здесь

poxvuibr 19 фев 2017 в 20:33

Пока таких нет — БД таки наше всё. И, даже, если они появятся — выбор СУБД будет много значить, потому что в некоторых из них физически нет фич, которые в других — в наличии.

VolCh 20 фев 2017 в 06:34

Есть такие ОРМ, которые автоматически добавляют (вернее генерируют миграции и т. п.) индексы, первичные и внешние ключи в типовых случаях типа классических связей. Есть и такие, которые позволяют дополнительно описать какое-то подмножество индексов в схеме маппинга объектов на базу. Но вообще это дополнительная фича, лишь помогающая выстроить процесс работы с базой единообразно.

НЛО прилетело и опубликовало эту надпись здесь

poxvuibr 20 фев 2017 в 08:42

ORM отвечают за объекты, а не за бд.

ORM отвечают за преобразование записей из БД в объекты. Соответственно генерация оптимальных запросов для вытаскивания объектов тоже входит в задачу ORM. В связи с этим, как совершенно справедливо отметил VolCh, генерация первичных и внешних ключей в схеме тоже входит в задачи ORM.

Хотелось бы увидеть такой ORM, который посмотрел бы на запрос, собранный с помощью предлагаемых им средств, и выдал бы рекомендации про простановке аннотаций на поля замапленных объектов.

НЛО прилетело и опубликовало эту надпись здесь

poxvuibr 20 фев 2017 в 09:05

Если внутри ORM есть этот самый DBAL, то он, конечно отвечает. Но это часть ORM, без которой он работать не смог бы.

НЛО прилетело и опубликовало эту надпись здесь

poxvuibr 20 фев 2017 в 09:54

DBAL — самостоятельный компонент, и это его обязанность.

Если я правильно понимаю, обязанность DBAL — обеспечивать единообразный доступ к разным СУБД. Как PDO в php примерно. Плюс, видимо, генерация запросов с помощью, сюрприз, построителя запросов :).

DBAL не занимается генерированием запросов, он просто транслирует их из одной формы в другую. Генерирует запросы компонент, который берёт описание сущностей и на его основании строит запрос, который вытащит, например, сущность по ID.

Нормальная ОРМ скорей всего позволит заменить DBAL, если вас не устраивает существующий.

Я таких не знаю, если вы видели, подскажите, будет интересно.

mayorovp 20 фев 2017 в 09:58

Для того, чтобы заменить DBAL, нужна абстракция над DBAL. Но что делать когда понадобится заменить эту абстракцию?

qdreadknight 19 фев 2017 в 20:31

Ради интереса почитал что такое ОРМ… Напоминает сферического коня в вакууме. Прекрасные риски получить неработающий продукт, в котором ни один программист не сможет разобраться. Видел я один замечательный проект, где к базе данных запрос был длиной кажется в 20КБ…

НЛО прилетело и опубликовало эту надпись здесь

qdreadknight 19 фев 2017 в 20:39

Существует дикое количество способ как гарантированно завалить проект. Спору нет :)
Когда таблиц становится хотя бы 100+ начинается веселая жизнь…

poxvuibr 19 фев 2017 в 20:40

ОРМ и спецы по БД это вещи ортогональные. Если вы используете ОРМ — специалисты по БД всё равно будут нужны. И заморачиваться всё равно придётся. Ну и нормализация БД — это тоже никак не связано с ОРМ.

immaculate 20 фев 2017 в 04:49

Никто никогда не заявлял, что ORM — это серебряная пуля, по-моему. Я такого утверждения ни разу не видел. С ORM получается понятный читаемый код, гораздо лучше, чем простыни SQL разбросанные тут и там.

Ну а если возникают проблемы с производительностью, то приходится оптимизировать. Можно оптимизировать как на уровне ORM, так и на уровне SQL: посмотреть, какие запросы генерирует ORM и добавить/изменить индексы, настройки базы.

Конечно, когда неграмотные программисты с оплатой за еду пишут код, у них будет и 1000+ запросов на страницу, и запросы в мегабайт размером. Но так они не только с ORM плохой код пишут. Они и на чистом SQL и на любом другом языке сделают ровно то же самое. Потому что нет знаний, опыта и мотивации делать иначе.

poxvuibr 19 фев 2017 в 20:38

ОРМ позволяет сократить количество бойлерплейта за счёт автоматической генерации джойнов и маппинга таблиц в объекты. Если использовать грамотно, то риск получить неработающий продукт невелик.

knekrasov 20 фев 2017 в 08:32

Ключевой момент «грамотно». Бойлерплейт — это вопрос удобочитаемости кода, а не производительности.

poxvuibr 20 фев 2017 в 10:56

Ну да, ОРМ к производительности достаточно косвенно относится. Хотя его наличие, иногда, позволяет увеличить производительность за счёт кеширования.

VolCh 20 фев 2017 в 03:14

Прекрасные риски получить неработающий продукт, в котором ни один программист не сможет разобраться.

Странное у вас впечатление. ОРМ создаются, по сути, чтобы упростить продукт, вынеся процесс работы с СУБД в отдельный слой, единственная ответственность которого преобразование объектов в запросы и наоборот.

remzalp 20 фев 2017 в 04:55

Проблема в том, что не всё так уж хорошо в построенных с помощью ОРМ запросах. Руками запиленный запрос, который тыкает носом тот же MySQL, какие индексы ему именно сейчас надо использовать — способен ускорить работу в сотни раз. Правильно использованный подзапрос в качестве значения поля или в операции сравнения позволяет очень сильно сократить нагрузку.

Да, неправильно выполненный запрос DROP DATABASE поломает всё :)))

VolCh 20 фев 2017 в 06:17

Нормальные универсальные ORM позволяют писать любые raw SQL запросы для получения/обновления нужных данных. На самом деле автоматическая генерация SQL-запросов (включая DDL запросы при генерации миграций и т. п.) это фичи конкретных реализаций универсальных ORM, а не обязательная черта ORM как паттерна в целом. Автогенерация — лишь средство ускорения разработки на начальных этапах. Как только сгенерированный запрос становится узким местом, его можно и нужно оптимизировать, заменяя частично (подзапросы и т. д.) или целиком на вручную написанный SQL.

ilya-chumakov 20 фев 2017 в 07:34

+1 к VolCh, применение ORM вовсе не означает, что все ваши SQL-запросы автоматически становятся на порядки медленнее. Напротив, во многих случаях падения производительности по сравнению с хранимыми процедурами вообще нет, особенно для простого CRUD. Для сложных составных запросов — да, расхождения возможны, но вам никто не запрещает переписать обнаруженные узкие места на хранимках и view. Воспринимайте ORM как средство быстрого прототипирования, и не забывайте о известном высказывании касательно предварительной оптимизации.

VolCh 20 фев 2017 в 08:15

но вам никто не запрещает переписать обнаруженные узкие места на хранимках и view.

Или просто ткнуть СУБД, чтобы использовала индекс, о котором ОРМ либо не знает, либо не сочла нужным тыкать, написав для конкретного кейса запрос на голом SQL ручками.

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 20 фев 2017 в 10:29

Я все еще не понимаю почему наличие ORM вы воспринимаете как отсутствие проектирования.

НЛО прилетело и опубликовало эту надпись здесь

poxvuibr 20 фев 2017 в 10:54

У меня сложилось впечатление, что вы считаете наличие ORM — преджевременной оптимизацией. Я правильно понимаю? Просто, с моей точки зрения, преждевременная оптимизация это его отсутствие.

VolCh 20 фев 2017 в 11:01

Скорее сознательное избегание из-за потенциальных проблем в будущем.

poxvuibr 20 фев 2017 в 12:14

Сознательное избегание чего-либо из-за потенциальных проблем в будущем это же и есть преждевременная оптимизация. Если, конечно, вы не избегаете какого-нибудь широко известного антипаттерна.

VolCh 20 фев 2017 в 12:27

Само отсутствие ещё ни о чём не говорит. Может это своевременная оптимизация, если с самого старта ясно, что ORM будет узким местом. А вот избегания использования без такой ясности, просто из-за предубеждений каких-то — да, преждевременная

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 20 фев 2017 в 11:43

ORM не виновата что кто-то наговнокодил. И исправить ситуацию проще, чем вы думаете.

При изменении типа поля приложение падает потому что там стоит проверка соответствия схемы БД и объектной схемы. Надо либо исправить вторую (вписать туда те же длины строк), либо отключить проверку (да, так тоже можно делать!).
Страшный вид запросов — не повод для паники. Надо смотреть не на SQL, а на получившийся план запроса. Ну и на исходный (включаю телепатию) linq-запрос. Индексам все эти Extent1, Extent2, Extent3 — не помеха. И исходный linq-запрос, из которого все это было сгенерировано, точно так же поддается переписыванию. Только не вами.

В целом же, вместо того чтобы писать гневные комментарии на хабре, вам стоило бы сразу признать — задача вышла за рамки вашей компетенции. Варианта тут два — либо изучать C# самому, либо искать специалиста по ORM.

mayorovp 20 фев 2017 в 11:52

По поводу же преждевременных оптимизаций...

Поймите одну простую вещь. Прошлая команда сэкономила немало времени за счет того что не писала SQL-запросы вручную. И вы теперь это время тратите.

Если бы другая команда тратила время на SQL-запросы — они бы наворотили такого же кошмара на хранимках в БД. С такими же страшными запросами, построенными в конструкторе запросов. С такими же неиндексируемыми полями nvarchar(max). Вот только даже кое-как работающую программу они бы сделать не успели и разбежались бы раньше.

И вам бы никто не поручил эту самую БД доделывать. Потому-то вы такие БД и не видели :)

PS из того, над чем страдаем мы. Очередь сообщений на базе MS SQL. Выборка очередного сообщения из очереди требует двух вложенных вложенных циклов. Виноваты кривые хранимки и отсутствие индексов (вообще!). Переписывать нельзя — код генподрядчика.

mayorovp 20 фев 2017 в 11:56

UPD: вложенных полных проходов, конечно же

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 20 фев 2017 в 12:42

Какой смысл "приглашать базовика" в начале проекта, когда еще даже бизнес-аналитик не успел выпытать у заказчика что вообще этот проект будет делать?

Начинать оптимизировать базу имеет смысл только когда у проекта появились все его ответственности, написаны прототипы всех модулей. А до этого момента задача разработчиков — вовремя менять прототип под хотелки заказчика, и при этом не сорваться и никого не покусать. Специалист-базовик в таких условиях будет лишь тормозить команду и сорвется первым...

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 20 фев 2017 в 13:04

Когда внезапно выясняется, что надо ввести партионный учет (чтобы ни означал этот термин) — это и означает, что бизнес-аналитик все еще продолжает пытать заказчика на предмет что тому надо.

poxvuibr 20 фев 2017 в 12:45

Всех проблем можно было избежать пригласив проконсультировать грамотного базовика в начале проекта, что бы спроектировать БД и избежать элементарных ошибок.

Я думаю тут никто не будет с вами спорить. Единственное, что грамотного базовика хорошо бы иметь под рукой на протяжении всей работы над проектом, а не только в начале.

С вами не соглашаются только в том разрезе, что наличие ОРМ на проекте никак не приводит к отсутствию на нём ДБА.

pnovikov 20 фев 2017 в 05:22

Ох, я чувствую в этом комментарии взрывной потенциал :)

mayorovp 20 фев 2017 в 04:06

Вы теперь под каждой статьей о БД будете эту чушь писать? :)

ORM — это механизм формирования запросов к БД, а не индексов

GlukKazan 20 фев 2017 в 06:21

Есть мнение, что ОРМ, в описанном автором случае, никак не поможет.
ОРМ к этому случаю немного ортогонален.

diamond_nsk 19 фев 2017 в 18:07

Какой у вас размер базы и кол-во запросов в секунду в прайм-тайм, если не секрет? Чем держите нагрузку?

qdreadknight 19 фев 2017 в 18:15

Сейчас после рестарта бэкап весит около 700МБ. А год назад — 2.5 ГБ. Это только значимые данные без логов операций, развернутое — в три раза больше + индексы. Ну и каждый пересчет(7 раз в сутки) наверно по 50-100МБ пишем данных, а потом ночью стираем хвосты.
Мы показываем игрокам 300 тыс. страниц в сутки. Счетчики в публичном доступе. Нагрузку держим за счет хитрющей системы кэширования.

GarretUA 19 фев 2017 в 20:46

А на каком железе работает база? Перевели бы на InnoDB/XtraDB и с вашим объемом данных вообще все в память загнали. Пара часов времени и можно спать ночью.

qdreadknight 19 фев 2017 в 20:49

Работает RAID на 5 дисках.
Загнать всю базу в память… сейчас с трудом все залезет, но она же растет…
Может часть имеет смысл попробовать положить. Спасибо за идейку, подумаю на досуге.

НЛО прилетело и опубликовало эту надпись здесь

GlukKazan 20 фев 2017 в 06:20

Во многих случаях, да

wladyspb 20 фев 2017 в 09:59

Индекс тоже хранится в памяти, и если на одну таблицу весом 2гб приходится 1.5гб индексов в памяти — намного выгоднее перенести в память саму таблицу.

mayorovp 20 фев 2017 в 10:03

С чего бы индекс постоянно хранился в памяти целиком? Или это в MySQL такое поведение?

VolCh 20 фев 2017 в 10:05

Прочитался, закэшировался и лежит там :)

poxvuibr 20 фев 2017 в 10:10

Индекс тоже хранится в памяти, и если на одну таблицу весом 2гб приходится 1.5гб индексов в памяти — намного выгоднее перенести в память саму таблицу.

А как перенос таблицы в память решит проблему, которую решают индексы? Перенос в память, ведь не сделает её волшебным образом отсортированной по всем комбинациями полей, на которые делаются индексы. Операции, конечно побыстрее будут проходить, чем когда таблица без индексов хранится на диске, но full scan то не денется никуда.

Dreyk 21 фев 2017 в 13:26

наверное имеется в виду, что перенести таблицу в память, и пусть себе делает full scan

mayorovp 21 фев 2017 в 13:40

Для больших объемов индекс на диске будет работать быстрее чем full scan в памяти.

wert_lex 20 фев 2017 в 04:18

300 000 страниц в сутки это 3.5 запроса в секунду.
Парни, вам есть еще куда расти во-первых, а во-вторых положите уже всё в память, она по-прежнему быстрее любого SSD

qdreadknight 20 фев 2017 в 08:10

Нам есть куда расти, это факт.
SSD мы пытались воткнуть, но наш сервер через месяц стабильной работы пришел в полную негодность. Проект два дня не работал, еле вернули пациента к жизни, убрав новый диск. Видимо наше железо не смогло подружится с ним.

diamond_nsk 20 фев 2017 в 09:57

Как уже писали ниже:
1. Базу в оперативку;
2. Может всё же ИнноДБ? Даже просто из соображений той же целостности данных, игра всё-таки «БизнесМания», экономика, все дела;
3. Рэид 5? Он в произвольной записи порой проседает на четверть;
4. Что за «хитрющее кэширование»? Сфинкс штоле?
5. Основная масса запросов к базе — чтение?

НЛО прилетело и опубликовало эту надпись здесь

qdreadknight 19 фев 2017 в 18:22

Тут два аспекта. Пишет быстрее данные, чем InnoDB. Хотя я в курсе, что намного правильнее там использовать транзакции. Во-первых он там появился давным давно, я пробовал менять — но не понравилось как работает. А сейчас — работает, не трожь :)

Psih 19 фев 2017 в 22:26

у вас очень старая информация.

darkmind 20 фев 2017 в 08:40

Ну перестаньте уже эту городскую легенду таскать, тем более что у вас уже 5.7. Innodb прекрасно в нем работает, а недостатков у MyISAM столько, что я уже не знаю зачем его можно использовать.

В вашем случае переезд на Innodb как минимум даст
а) неблокирующее чтение вообще, т.к. данные читаются из снапшота
б) локи только на нужные строки

Это гарантированно улучшит общий перфоманс базы.

qdreadknight 20 фев 2017 в 08:43

MyISAM там появился во времена, когда InnoDB только набирал обороты. Проекту не 2 и на 5 лет :)
В следующей итерации попробуем все-все все-таки перенести на Inno, главное чтобы ничего не порушилось.
В лоб смена движка не прошла в свое время.

parpalak 20 фев 2017 в 15:10

Иногда MyISAM бывает полезен. Была в проекте на прошлой работе одна InnoDB-табличка на несколько сотен записей. Она пополнялась в триггере при изменении записей в другой таблице. Но иногда вставки по непонятным причинам не происходило. Я долго не мог докопаться до настоящей причины, пока не сделал добавление записей из кода. Оказалось, что вставка иногда не срабатывает из-за ошибки типа unique constraint violation на автоинкрементном первичном ключе. Админы подтвердили, что это известная проблема в MySQL 5.6, но быстро перевести production на 5.7 они не могли. Пришлось переключить тип таблицы с InnoDB на MyISAM. Проблема исчезла.

miksoft 20 фев 2017 в 15:14

это известная проблема в MySQL 5.6

А можно ссылочку на баг на bugs.mysql.com?

parpalak 21 фев 2017 в 08:34

Похоже на https://bugs.mysql.com/bug.php?id=76872

darkmind 21 фев 2017 в 11:56

Была в проекте на прошлой работе одна InnoDB-табличка на несколько сотен записей. Она пополнялась в триггере при изменении записей в другой таблице.

Т.е. по сути это логгер таблица. Вообщем да, это пожалуй единственный полезный кейс MyISAM т.к. нетранзакционная, а в mysql нет autonomous transaction. Если надо заллогировать фейл транзакции то выбора по сути нет.
Но такая лог таблица обычно а) не содержит критикал данных б) нет требований по производительности, так что по сути в вашем случае можно было взять любой другой движок на выбор.

robert_ayrapetyan 19 фев 2017 в 18:21

Зачем, если не секрет, вам понадобилась реляицонная БД в экономической игре?

qdreadknight 19 фев 2017 в 18:23

Какие есть варианты? В чем хранить?

robert_ayrapetyan 19 фев 2017 в 22:14

Объекты игрового мира — в памяти, в структурах специализированных, наиболее подходящих под вашу конкретную игру, это вы расскажите что именно вы там храните и зачем.

wladyspb 20 фев 2017 в 10:03

+1, разверну мысль robert_ayrapetyan, на мой взгляд его недопоняли.

Сам сейчас обдумываю как хранить данные, и реляционная таблица подходит для сырых данных, однако в игре нужно будет работать с обработанными данными, взятыми из многих таблиц, над которыми производятся рассчёты. Делать это на лету каждый раз не очень разумно, поэтому имеет смысл сформировать «игровое состояние» конкретного игрока, и хранить его в КВ или документарной базе, обновляя сырые данные в бд по мере необходимости.

robert_ayrapetyan 20 фев 2017 в 16:04

Тут в соседней статье по Hello world на PHP (https://habrahabr.ru/post/322170/) забавно написано: «Но прежде, чем его [фреймворк] устанавливать, надо бы создать базу данных. Зачем базу данных? Ну не хардкодить же строку «hello, world» прямо в тексте программы!»

youlose 19 фев 2017 в 21:19

Не понравился ваш костыль, во-первых логгируйте медленные запросы, там данные о долгих заблокированных запросах есть. А во-вторых поставьте MariaDB или Percona мускуль, там в логах медленных запросов больше информации, даже можно сразу explain туда выводить, если совсем всё грустно.

miksoft 19 фев 2017 в 22:04

По абзацу «Ох уж эти индексы» хотелось бы подробностей.
С DDL таблиц, тесткейсом, планом запроса до и после.

Maiami 20 фев 2017 в 03:38

В общем — ситуацию надо было спасать. Засучив рукава, мы начали с чистого листа искать решение.

Молодцы, что решение всё таки нашли. Но так как статья с меткой «tutorial», то стоит отметить, что в mysql для таких целей уже есть всё необходимое (youlose уже упоминал это). Достаточно добавить в my.cnf несколько строчек:

slow-query-log = 1 
slow-query-log-file = /var/log/mysql/slow.log
long_query_time = 1 
log-queries-not-using-indexes

В файл /var/log/mysql/slow.log будут попадать запросы которые выполняются медленнее 1 секунды, а так же запросы которые не используют индексы. Кроме самих запросов там много сопутствующей информации. В mariaDB или percona информации даже больше будет

VolCh 20 фев 2017 в 06:20

Плохо работает, когда есть запросы, штатно выполняющиеся минуты (аналитика, например).

qdreadknight 20 фев 2017 в 08:46

Мне показалось, что метка уместна. Возможно я не прав.
Но вдруг моя идея кому-то поможет.

Лог медленных запросов в моем случае ничего не показал.
Мой метод дал мне полную картину, когда и в какой момент времени у меня идет зависание, связано это с обсчетом игровой ситуации, или это повышенная активность людей.

jehy 20 фев 2017 в 04:53

Кстати с 5.5. на 5.7 сразу перейти нельзя, сначала надо 5.6 поставить.

Что-то?

Про использование MyISAM и про то, что профилировние длинных запросов делается настройками my.ini, здесь уже сказали.
Так что в целом я тут вижу только отсутствие внятного специалиста по СУБД, и метка «tutorial» смущает.

customtema 20 фев 2017 в 05:18

InnoDB, Percona, не?

Полчаса работы, и все ваши проблемы яйца выеденного не стоят. Неужели гуглеж не подсказал?..

gmaker 20 фев 2017 в 05:43

processListThread.run();

Вы уверены, что запускали потоки?

qdreadknight 20 фев 2017 в 08:14

Да, безусловно. Включал/выключал когда следил за проблемами.

gmaker 20 фев 2017 в 08:22

Просто, как бы вам это сказать. run() не запускает новый поток.

savostin 20 фев 2017 в 05:53

А потом они открыли для себя ssd диски, MariaDB и slow-query-log...

Akdmeh 20 фев 2017 в 10:57

Позвольте узнать, чем MariaDB лучше MySQL?

savostin 20 фев 2017 в 10:59

Они о себе
Хабр о них

Akdmeh 20 фев 2017 в 11:03

Извините, логично же было погуглить. Спасибо за ссылки!

romamo 20 фев 2017 в 06:07

Да ничего, норм. Пацаны только в школе учатся. Надо самому ощутить всю боль, прежде чем начнешь сразу строить правильную архитектуру.

qdreadknight 20 фев 2017 в 08:18

С архитектурой у нас все более чем в порядке.
Проблема-то от чего возникла — писали в быстром темпе какие-то вещи, и до поры до времени проблем не было. А потом бах — работает медленно. А никто не помнит, почему так написано. Откуда копать. Это хорошо назад рассуждать о том, что блин — ставь индексы правильно или кэшируй запросы. А когда ты считаешь, что все описанные вещи уже итак давно решены — что делать, с чего начинать копать.

romamo 20 фев 2017 в 08:23

Архитектура — это не нормализация таблиц, а описание всей схемы приложения в целом и взаимодействия всех его компонентов. И политика работы с бд в том числе (джойны нельзя, какие ключи можно и т.д.).

qdreadknight 20 фев 2017 в 08:24

Конечно. Я именно про это и говорю.

romamo 20 фев 2017 в 08:50

Описанная проблема как раз и является ошибкой архитектуры.

Kwisatz 20 фев 2017 в 08:18

Имхо слишком большие проблемы для такого малого количества данных. Нужно тщательно анализировать архитектуру бд целиком.
Но на вскидку несколько советов:
1. Если используете MyIsam старайтесь организовать логику так, чтобы бОльшая часть запроса была одного типа (insert/select/update)
2. в where столбцы должны идти ровно в том порядке, в каком указаны в составном ключе
3. Включите логирование запросов со временем выполнения более 1с. Если таковых много или очень встречаются часто — явно что-то делаете не так.
4. Прогоните explain всех запросов. У MySQL очень плохой оптимизатор. Есть тысяча и один способ сделать запрос быстрее и легче.
5. В идеале — перейдите на postgesql.
6. Наймите крутого специалиста по БД.

qdreadknight 20 фев 2017 в 08:23

Спасибо.
1. Так и сделано. Проблема возникла из-за того, что бизнес-логика работала не по тем данным.
2. Вроде это никогда не влияло.
3. Show slow query мне влоб в свое время не помог, может быть я неверно что-то там делал.
4. Все-все запросы, это проще повесится. Самые активно используемые — смотрел, с ними все более менее, кроме описанного в статье.
5. Это слишком дорого.
6. Пока у нас все проблемы относительно решены. Скорее купим более мощный и современный сервер.

TheRaven 20 фев 2017 в 11:42

InnoDB + SSD и на таких объемах вы еще долго просидите на текущем железе.
MyISAM с его table-level локами в 2017 году это нонсенс.

Kwisatz 20 фев 2017 в 21:19

2. Всегда влияло. Возможно за последний год и поправили но я сомневаюсь. На большой таблице сделайте индекс (fieldA, fieldB, fieldC) а затем explain select * from table where fieldC=1 and fieldB=2 and fieldA=3
3. Если он не пуст — у вас проблемы. За исключением отчетов ни один запрос не должен выполняться дольше 0.1с.
4. Для начала всех что попадают в slow query log.
5. Если уж покупать новый сервер то и на postgre неплохо бы. SQL почти тот же, только специалист нужен. Поставить как можно больше оперативной памяти и отдать ее всю для бд.
6. Тоже когда-то думал так же, после покупки второго сервера подряд одумался.
Касательно «проблемы относительно решены». Нужно оперативно мониторить. Ко мне очень часто обращаются люди как раз по таким проблемам и я каждый раз, после того как их сервисы начинают летать а не ползать, рекомендую полный аудит и выдаю бесплатно десяток рекомендаций. Каждый раз потом тянут до последнего и возвращаются уже с лежащим проектом, полудохлой базой и «нужно оченьсрочнотеряемденьги».

qdreadknight 21 фев 2017 в 06:05

Я думаю да, следующий апгрейд будет именно железячный, когда потребуется. Надеюсь с деньгами к тому моменту проблем не будет :)) я писал где-то, SSD в текущей конфигурации сервера сработал как троянский конь завалив вообще все.

Kwisatz 21 фев 2017 в 08:08

я не думаю что вина ssd, скорей с рейдом обращаться не умеет сисадмин.

miksoft 21 фев 2017 в 10:15

2. Всегда влияло. Возможно за последний год и поправили но я сомневаюсь. На большой таблице сделайте индекс (fieldA, fieldB, fieldC) а затем explain select * from table where fieldC=1 and fieldB=2 and fieldA=3

Именно в такой форме я такого не встречал, как минимум, с версии 4.1. Более ранние версии не застал.
Вероятно речь идет о случае, когда один из предикатов содержит не строгое равнство, а диапазон.
Вот тогда порядок полей в индексе имеет значение.
Для упомянутого индекса запрос where fieldC>1 and fieldB=2 and fieldA=3 сможет использовать индекс, а запрос where fieldC=1 and fieldB=2 and fieldA>3 — скорее всего нет.

darkmind 20 фев 2017 в 08:43

1. Не поможет. Вот к примеру идет поток insert'ов на MyISAM таблицу и каждый делает лок/инсерт/анлок. Т.е. происходит такая себе конвертация в serializable что все равно никак не ускорит процесс.
2. В MySQL оптимизатор конечно не идеальный, но такую оптимизацию даже он сделает.
4. На самом деле в 5.7 (да даже с 5.6) его неплохо так пилят и он уже вполне неплох.

Kwisatz 20 фев 2017 в 21:10

я очень много работал с Mysql (myisam/innodb): порядка 500млн записей на таблицу, 1.1 млн пользователей, 100 тысяч уникальных посещений в сутки. Вариантов для экспериментов было масса.
Способов руками сделать лучше чем оптимизатор для mysql я знаю не менее полусотни: это и танцы с параметрами и вложенные запросы там где они не нужны и много других «приятных» вещей. Одним из наиболее часто встречающихся сценариев является замена join с таблицей на join с подзапросом, такие вещи сразу видны по explan

Как кто-то умный сказал: «Oracle это база данных, а mysql это хер с гвоздями». Перед тем как перейти на postgesql я 12 часов баловался с различными запросами, начиная от однострочных и заканчивая такими что на распечатке займут страниц 10. Итог: хуже сделать получилось, лучше — нет.

darkmind 21 фев 2017 в 12:07

Ну скажем так — оно то может и можно подпинать оптимизатор в сторону более идеального запроса, но разница обычно небольшая ~1%. Я говорю про случаи когда запрос написан вдумчиво и правильно, а не абы как, тогда и подсказывать ненадо.

является замена join с таблицей на join с подзапросом,

Сколько не видел — всегда появление подзапроса портило план выполнения, вот уж где оптимизатор Mysql тупит вовсю. Из последних случаев — наличие подзапроса вызывало лок всех строк в таблице, как по выводу explain так и по факту. Выкидывание подзапроса и join таблицы на себя — получаем идеальный план выполнения.

У оптимизатора Oracle свои причуды. Например он очень котирует индексы по временным колонкам в партиционированной по времени таблицы и игнорит другой очень селективный индекс.

Kwisatz 20 фев 2017 в 21:21

Я дико извиняюсь, но меня мучает один вопрос: а зачем mysql то? Простой пример: как вы решаете проблемы с отсутствием рекурсивных запросов?

VolCh 21 фев 2017 в 04:52

Есть мнение, что для разработчиков хорошо знающих MySQL это не проблема. Я вот за много лет работы с MySQL ни разу с этой проблемой не сталкивался. Просто не приходило в голову решать какие-то задачи с помощью рекурсивных запросов. Собственно толком и не знаю что это, не смотря на то, что уже с полгода в продакшене крутится база на Постгрес.

Kwisatz 21 фев 2017 в 05:05

Без проблем: вывод одним списком трех уровней форума. Конечно решается через nested sets но подобных вещей непридумывать и посложней не проблема.
Есть и другие доводы: fts, функциональные индексы, схемы, instead of триггеры, нормальный оптимизатор и так далее.

VolCh 21 фев 2017 в 06:06

В нашем случае моим доводом перед руководством за переход были функциональные и частичные индексы, чтобы избавиться от триггеров, вычисляющих выражения (хотя бы банальное взятие даты от датывремени) или null если под условие не попадает и заносящие их в служебный столбец. WITH и WINDOW — бесплатный бонус для меня к индексам. Но админы меня потихоньку проклинают — для них в мускуле было всё понятно, да и я их практически не беспокоил, а теперь пользователей создают они.

А схемы в мускуле есть, просто их обычно называют базами данных, но нет того, что в постгресе называют базой данных.

Kwisatz 21 фев 2017 в 08:16

Кстати да, with вещ просто нереально удобная. А вот про window спасибо, все забывал прочесть про них.

Про админов немного не понял. На каждом углу лежат гайды с рекомендуемыми настройками postgesql и pgbouncer.

Схемы нереально удобны когда в них помещаешь только view или like таблицы и спокойно выставляешь овнером пользователя.

poxvuibr 21 фев 2017 в 08:42

Кстати да, with вещ просто нереально удобная.

Вы с этим осторожнее, в postgres with это optimization fence. Производительность может неслабо убить. Но, за счёт материализации, может и увеличить.

VolCh 21 фев 2017 в 12:40

В мускуле я мог сам пользователей для приложений добавлять через SQL, в постгресе требуется как минимум править hg_hba.conf и перезагружать сам постгрес. Ну и ещё там, типа из коробки только сервер целиком реплицируется, одну базу, не говор яо таблице нельзя

miksoft 21 фев 2017 в 10:11

Без проблем: вывод одним списком трех уровней форума.

Для фиксированного количества уровней можно обойтись JOIN-ами без иерархических запросов.

И, кстати, иерархические запросы в MySQL теоретически возможны с использованием переменных, но сложны для построения и сопровождения и очень медленны. Так что их практическая ценность стремится к нулю.

poxvuibr 21 фев 2017 в 13:25

Тут даже джойны не особо нужны. Если хранить иерархию в виде 1.2.3.45 и уровень вложенности каждого сообщения.

И запрос с

where
     path like '1.%'
     and level < 4

qdreadknight 21 фев 2017 в 06:03

MySQL появился там исторически. Проекту много лет. Зачем мне нужны рекурсивные запросы? Потребностей пока не было.

НЛО прилетело и опубликовало эту надпись здесь

qdreadknight 21 фев 2017 в 06:03

Буду иметь ввиду, спасибо.

Duss 21 фев 2017 в 14:50

Не перечитывал все комменты, может уже писали, но добавлю от себя:
1) 5.5 можно обновить до 5.7 без 5.6 и это может быть даже проще.

2)

Делаем дополнительные индекс…

Существует force index (название индека) позволяющий заставить базу использовать индекс, даже если оптимизатор запросов решил этого не делать. Может помочь в части ситуаций, но с ключевым полем может и не сработать. Но все-таки доп индекс это лишняя нагрузка.

А вообще нужно внимательно смотреть все запросы к базе (не только тяжелые), изучать эксплейн. Смотреть триггеры и индексы.
Триггеры вообще больное место, любая мало мальски не оптимальная директива выльется в большую нагрузку. Иногда очень хорошо помогают составные индексы, зачастую результат запроса можно рассчитать из того же индекса, в котором хранятся условия фильтрации.
Была ли оптимизация конфига базы? Про это правда не мало написано мануалов. И т.д. и т.п. вы описали только вершину айсбегра под названием бесконечная оптимизация.

darkmind 22 фев 2017 в 07:23

Оптимизация конфига MySQL это дать побольше под innodb_buffer_pool_size и включить innodb_numa_interleave.
Все, остальной тюнинг на данном этапе (когда нужно править запросы и индексы и переезжать на InnoDB) ничего не даст.
Нет, можно конечно остаться на MyISAM и тюнить уже его, но это будет время потраченное зря.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий