jobgemws1 мар 2018 в 05:10

Три аспекта оптимизации (БД и ПО)

31 мин

73K

.NET * Microsoft SQL Server * SQL * Базы данных *

Туториал

+22

Комментарии 81

Raimon 1 мар 2018 в 05:41

По первой части сам давно пользуюсь скриптами ola.hallengren.com. Они учитывают особенности разных версий SQL Server умеют создавать job'ы, пишут логи и имеют кучу настроек.

jobgemws 3 мар 2018 в 08:06

Да, хороший инструмент, но по обновлению статистик по большим БД не самое лучшее решение

zodchiy 1 мар 2018 в 11:43

Есть вопрос. Что лучше?
— Фронтэнд делает 500 async запросов выполняющихся на бд 0.5-2с каждый.
— Один запрос с портянкой на 500 параметров, которая будет работать через WHILE (или JOIN) в одой процедуре за 40 секунд?
И да, в любой момент все 100 подключений подключены.

jobgemws 1 мар 2018 в 12:09

Если инфраструктура позволяет (в плане одновременных подключений), то лучше 1-ый вариант, тогда пользователь быстрее получит данные. А если и не позволяет, то организовать очередь на серверной стороне. Но если совсем уж грустно по кол-ву одновременных возможных подключений (напр, не более 10-ти) и еще задачи какие есть в реал тайм, то второй вариант. Но лучше от второго уходить

zodchiy 1 мар 2018 в 12:33

Спасибо за ответ, примерно так и поступаю, где-то все 500 запросов делаю, а где эти же 500 объединяю в один на клиенте и распаралеливаю на бэкенде, а где-то и то в самом скуле. Просто хотелось бы best practies по нагруженным asp.net/mssql решениям.
Почему нельзя растягивать пул?

Старайтесь отправлять запросы к СУБД пачками, а не единичными

А как?

Подписывайте в строке подключения к БД компонент приложения в Application Name:

Чем лучше? Почему?

jobgemws 1 мар 2018 в 13:50

Application Name-просто потом легче анализировать от кого запрос пришел. Пул очень индивидуально-сколько он кэшировать может.
Запросы пачками-имеется в виду, не по одной строчке, а сразу одним запросом.
Например, удаляете 34 строки-удаляйте не тупо в цикле вызовом хранимки по 1 строке, а сразу 34. А еще лучше просто пометить на удаление сразу 34 строки одним запросом. А потом или ночью уже физически удалить

nikolayv81 2 мар 2018 в 16:25

А чем пометить и ночью удалить лучше?
При обновлении (пометить) и построчном хранении насколько пос все старые строчки(условно, там ведь страницы) будут удалены, новые созданы + логи, при последующем удалении "ночью" будет повторное удаление строчек.
Или в mssql что-то сильно по другому?

jobgemws 2 мар 2018 в 16:36

Логическое удаление лучше, т к не фрагментирует индексы и не вызывает удаления в связанных таблицах
Лучше физическое удаление делать в минимальные нагрузочные часы

nikolayv81 2 мар 2018 в 18:09

Так в том то и дело, что физически, при обновлении, старые записи(блоки) будут помечены как удалённые, а обновлённые будут записаны. Т.е. по факту в индексе логический адрес ячейки не сменится а физический будет заменён. Т.е. отложенное удаление в сумме приведёт к большему количеству операций ввода-вывода и потенциально большей фрагментации данных в файлах БД (износу ssd-ников в т.ч.) при этом ещё потребует изменения логики работы приложения (фильтровать придётся ещё и удалённые записи, возможно добавлять индексы в случае наличия большого количества удалений).
Для oltp ещё возникает проблема с unique key т.к. сценарий удалили запись — вставили такую-же удалили ещё раз приводит к нарушению уникальности даже в случае включения в constraint признака удаления.
В общем на мой взгляд выигрыш сомнителен, особенно если БД из Oracle, PG, firebird. Возможно с
MSSQL дела обстоят по другому всёже корни блокировочника могут давать особенности, не знаю.

jobgemws 2 мар 2018 в 18:13

Логическое удаление используется во многих решениях и уже очень давно: CRM, NAV, 1C и т д
Жаль, что своими доводами я вас не убедил

Tantrido 1 мар 2018 в 13:07

Довольно часто пользователи, разработчики, администраторы и т д СУБД MS SQL Server встречаются с проблемами производительности БД или СУБД в целом.

Пусть переходят на PostgreSQL и перестают жаловаться! Я у себя отмечал прирост скорости в 20 и более раз.

zodchiy 1 мар 2018 в 13:18

В каких задачах?

Tantrido 1 мар 2018 в 13:40

jobgemws 1 мар 2018 в 13:47

Выбор СУБД несомненно должен зависеть от инфраструктуры и задачах.
Однако, сама СУБД не решит все проблемы и не является унифицированным средством и подходом для решения всего на свете
То, что какая-то СУБД-это наше все-большое и распространенное заблуждение.
Каждая СУБД имеет и свои плюсы и свои минусы
Также важно еще сопоставлять с бюджетом, поддержкой и т д и т п
Бесплатно, тоже не всегда хорошо, т к порой поддержка будет значительно дороже платного аналога и более дешевой поддержки.
А уж тонкостей по настройке, оптимизации и эксплуатации везде хватает.
Нужно смотреть в комплексе, а не в вакууме

Tantrido 1 мар 2018 в 13:58

Маркетинговый бред. Полно фирм уже по постгресу предоставляющие поддержку. Вот например: postgrespro.ru/services/support — причём здесь поддержку оказывают сами разработчики — выше качества нет. На sql.ru дадут такую поддержку, что ни с каким МС не сравнится. Вот ещё: www.postgresql.org/support и ещё профи: www.postgresql.org/support/professional_support

А вообще попробуй сначала посгрес с его возможностями и функциями, которых на порядки больше, чем в мс, а потом поговорим. Ты и смотри в комплексе.

africaunite 1 мар 2018 в 14:07

Грубо как.

jobgemws 1 мар 2018 в 15:00

Люди не идеальны и все мы разные
Конкретно здесь оскорблений или непристойной информации не было потому и не минусую
Но резковато-это да
Но порой это выручает, а порой и жизнь сама накажет

africaunite 1 мар 2018 в 16:02

И я не минусовал! ;)

OlehR 1 мар 2018 в 14:43

Как мне надоело ето восхваление постгрес. Где би что не обсуждалось по БД там уже расказивают какой постгрес крутой и сколько даст прироста. Да ето очень крутая БД. Точно лутшая с безплатных версионников. :)
А по факту:
1) В класе версионник он отстал от оракла навсегда.
2) Партиции которие дают реальний прирост и маштабируемость появилось буквально в 10 версии и назвать что ето уже продакшин — как-то язик не поварачивается. Про in-memory в посгри я тоже ничего не слишал. (Оракл 12, MSSQL 2014). Пускай реализация местами странная и ограничений вагон и тележка но оно работает и дает реальний прирост.
Если правильно настроить базу и експлуатировать ее как она «любит» то на одном и том же железе разница может бить в процентах а не в разы.

jobgemws 1 мар 2018 в 14:46

И кто после этого маркетингом занимается? Да ещё с таким пристрастием и так грубо
Я тоже читаю про постгрес и как СУБД считаю её не плохой
Но повторюсь-все нужно смотреть в комплексе

omegik 1 мар 2018 в 15:10

Это ж каких там функций больше на порядки, позвольте узнать?

Tantrido 1 мар 2018 в 16:44

Любых: математических, стринговые, время, аггрегатные и т.д. и т.п.: www.postgresql.org/docs/current/static/functions.html

Там где в MS SQL приходилось писать простыни хранимок и писать велосипеды для распарсивания чего-то, или потом пришлось даже на CLR C# хранимки перейти, в PostgeSQL есть всё из коробки в SQL.

omegik 2 мар 2018 в 08:12

Ля-ля-ля, бла-бла-бла — посмотрел — по количеству примерно сопоставимо. Ну хоть-бы примерчик какой-то привели, где там нужно писать простыни и велосипеды.

НЛО прилетело и опубликовало эту надпись здесь

Tantrido 1 мар 2018 в 16:40

Может не смогли настроить MSSQL? 20 выглядит фантастикой, давайте репо.

А может вы PostgreSQL не пользовались?! Настраивать я MS SQL умею, мы базу и запросы ускоряли на порядки.

НЛО прилетело и опубликовало эту надпись здесь

Tantrido 1 мар 2018 в 18:08

Не надо верить словам: просто возьми свою задачу и проверь её работу на постгресе — всё! :)

OlehR 1 мар 2018 в 19:07

Очень спорное утверждение. Если вы правильно используете БД значит вы используете тригера, процедуры, пакеты, функции, особенности БД в запросах и вюхах а ето от несколько десятков тисяч до нескольких сотен тисяч строк.
Разница в запросах + их оптимизация, не говоря уже о разнице pl/sql t-sql и pg/sql настолько огромная что ето фактически наново писать всю логику. То есть ето в принципе невозможно. А переход с версионника на блокировщик или наоборот ето еще то приключение, вплоть то переписивания логики приложения.
А то о чем вы говорите — ето способ писать приложения только используя SQL, а всю логику вне БД. При етом вы используете только незначительную часть возможности БД.
P.S. Была попотка перенести приложение c оракла на IBM DB2 которий декларировал совместимость pl/sql на 99%. Так от все вкусняшки по быстродействию оракла в pl/sql DB2 там не реализованы. Хотя я уверен есть свои. Оценив неоходимое время — мы отказались.

Tantrido 1 мар 2018 в 19:11

Я слил данные и сравнил скорость конечных запросов. Многие переходят с оракла и мс — и здесь было полно обзоров и довольны.

НЛО прилетело и опубликовало эту надпись здесь

Tantrido 1 мар 2018 в 19:52

С ораклом не сравнивал, не знаю. По 3 раза увеличение серверов — первый раз слышу. Люди довольны, даже с ораклом сравнивая шустрее работает. С МС — две огромные разницы.

НЛО прилетело и опубликовало эту надпись здесь

Tantrido 2 мар 2018 в 01:55

МС славится своими костылями, когда приходится писать свои костыли в обход МС-овских. У нас SQL был близок к стандарту более не менее, поэтому на постгрес перевелось без проблем, почти 1 в 1, а там такие костыли, типа таблицы в памяти, не нужны как я уже неоднократно говорил. Это как раз от жуткой тормознутости МС появилось, чтобы хоть как-то быстрее работало. Мы использовали иногда в хранимках. А в постгресе для аналогичных задач есть массивы, например.

Попробуй один проект на постгресе начать — будешь недоумевать как на МС мог работать. Всё грамотно сделано.

jobgemws 2 мар 2018 в 04:14

На любой СУБД нужно проводить регламентные работы и оптимизацию периодически, также нужна оптимизация и в ПО, которое взаимодействует с этим СУБД
В статье дана общая концепция и примеры на скуле и .NET
Перейдя на постгрес все равно придётся делать теже концепции, но другим кодом
И если ПО настроено неправильно или написано мягко сказать вычурно, то СУБД не во всех аспектах спасет

Tantrido 2 мар 2018 в 11:30

согласен.

НЛО прилетело и опубликовало эту надпись здесь

VulvarisMagistralis 2 мар 2018 в 13:46

А ниче, что MS — блокировщик, а Postgres — версионник?
И подходы для них в корне различны.

Лобовое сравнение одинакового кода для них — пригодно только для простейших тестовых ситуаций.

Для сложных — нужно отдельно оптимизировать под конкретный сервер.

НЛО прилетело и опубликовало эту надпись здесь

jobgemws 2 мар 2018 в 14:17

Прошу привести код в обоих СУБД и параметры компьютера, которые использовались в тесте

НЛО прилетело и опубликовало эту надпись здесь

jobgemws 2 мар 2018 в 15:12

Прошу прощения, я не экспетр в постгресе
Код для скуля есть, скинте код для постгреса

НЛО прилетело и опубликовало эту надпись здесь

jobgemws 2 мар 2018 в 18:14

Он здесь отписал, что напишет статью-подождем

Tantrido 2 мар 2018 в 17:33

Повторяю ещё раз: на постгресе такой запрос не нужен.

Это я еще не рассматривают код где MSSQL может распаралелить запрос, а Постгресс нет.

Лишний раз убеждаюсь, что Вы постгреса не знаете от слова совсем. Я работал на обеих базах: 5+ лет на МС и 7+ на постгресе, на двух проектах: BI и ETL — в обоих проектах при переходе на постгрес скорость вырастала на порядок.

Могу допустить, что за последнее время особенно портировав МС на Линукс, могли произойти позитивные изменения — надо смотреть, но не таки кардинальные, как на постгресе.

silvercaptain 2 мар 2018 в 18:10

Лишний раз убеждаюсь, что Вы постгреса не знаете от слова совсем. Я работал на обеих базах: 5+ лет на МС и 7+ на постгресе, на двух проектах: BI и ETL — в обоих проектах при переходе на постгрес скорость вырастала на порядок.

А мужики то оказывается не в курсе…
Позвольте, а где же здесь Постгресс??
www.tpc.org/tpch/results/tpch_advanced_sort.asp?PRINTVER=false&FLTCOL1=ALL&ADDFILTERROW=&filterRowCount=1&SRTCOL1=h_sponsor&SRTDIR1=ASC&ADDSORTROW=&sortRowCount=1&DISPRES=100+PERCENT&include_withdrawn_results=none&include_historic_results=no

Наверное мешки таскать — не языком чесать?

Tantrido 2 мар 2018 в 19:18

Это что за табличка? МС заказала? Учитывая, что на ТОП-500 МС вообще нет, резонно спросить: где здесь МС?!

silvercaptain 2 мар 2018 в 20:14

Делают эти тесты производители железа
А табличка, ну это самый известный в мире database benchmarks. Подробней можно почитать здесь:
www.tpc.org/information/about/abouttpc.asp

И что такое TOP-500?

Tantrido 2 мар 2018 в 21:31

Производители железа, которые давно и прочно, и это не для кого не секрет, завязаны на откаты МС — это не показатель: www.tpc.org/information/about/faq-generic.asp

Any company may join the TPC. A membership costs $15,000 per year.

А постгрес не завязан на конкретную фирму.

TOP-500 — это линуксоиды знают: www.linux.org.ru/news/clusters/13823822

Но это всё таки не так интересно. Интересен свой опыт. А я пробовал на однотипных задачах обе СУБД. Был резкий контраст когда даже на старом железе запросы в постгре летали мсек, а при переходе на МС на порядок мощном железе аналогичный запрос тянул на секунды или даже десятки секунд — это было сильно заметно.

У людей вот тоже в одиночных тестах производительность отличается на порядок: www.enterprisedb.com/blog/postgresql-vs-microsoft-sql — надо всё пробовать самому!

По функциям — вот отличный обзор: www.pg-versus-ms.com

и вот: dba.stackexchange.com/a/77015/15730

НЛО прилетело и опубликовало эту надпись здесь

jobgemws 3 мар 2018 в 04:45

Поправка-по первичным ключам и ограничениям уникальности скуль строит индексы, по FK-нет по умолчанию. Да это и навсегда нужно

НЛО прилетело и опубликовало эту надпись здесь

Tantrido 3 мар 2018 в 13:35

Возможно неправильно обобщать свой опыт на всё — описал только то, с чем столкнулся. Проекта того нет, более подробно описать не смогу на данный момент.

По настройкам: МС был оптимизирован максимально: настройки, версионность, изоляция, индексы, запросы и т.п. Постгрес — дефолтный, данные не кешированные и БЕЗ ИНДЕКСОВ, повторюсь.

При переходе на Линукс из-за гораздо более грамотного проектирования системы, чем у МС, на том же железе всегда отмечал увеличение производительности как минимум в 2р: сети, ФС, IO, скорости скомпилированной программы и т.п. Тоже самое отметил и в случае с БД.

Не исключаю, что в последнее время они могли значительно увеличить производительность SQL Server-а, .Net Core и т.п. Какие-то серьёзные изменения у них вроде были.

Если в будущем будет подобный проект — отпишусь.

jobgemws 3 мар 2018 в 13:38

Вы правы, до 2012 скуля у MS SQL Server были явные проблемы причем не только в производительности. Но с 2012 версии все кардинально изменилось. Особенно в более новых версиях

Tantrido 3 мар 2018 в 13:40

Тогда будет в двойне интереснее сравнить. Хотя вот эти таблицы в памяти как раньше могут определённые сомнения навеять… :-) посмотрим…

jobgemws 3 мар 2018 в 14:17

Берите сразу 2016 для сравнения, если успеете до конца этого года, иначе-тогда уже 2017 версию берите.
Когда планируете опубликовать результаты?

Tantrido 3 мар 2018 в 14:34

Бог планирует! :) Я же сказал, когда будет соответствующий проект.

jobgemws 3 мар 2018 в 14:35

И когда он будет? Без сроков не будет и результата обещанного Вами

Tantrido 3 мар 2018 в 14:43

Уважаемый, я ничего не обещал! :) Я описал свой опыт и сказал, что будет интересно сравнить.

jobgemws 3 мар 2018 в 14:47

«Да, было бы хорошо. Однако сейчас работа другого характера, доступа к тем данным нет. Будет возможность — с удовольствием: стараюсь теперь на хабре писать интересные вещи по ходу работы, чтобы не терялись и могли кому-то пригодиться»
Да, действительно
Но ладно нам-читателям, для своего же интереса или Вы позволите самообман? В итоге конечно решать Вам. Но либо факты с учетом текущих версий, а не 5-10 и более лет назад, или ничего. Предполагать все могут, а уж генераторов всяких идей на каждом шагу. Это малоценная информация (я бы даже сказал бесполезная или устаревшая).

Tantrido 3 мар 2018 в 15:11

Согласен, развиваемся, учимся новому.

jobgemws 1 мар 2018 в 17:02

Почему для BI не рассмотрели вертику? Одно из лучших решений, но дорогих.
Но BI-решения всегда были дорогими
Постгресс одна из самых лучших бесплатных СУБД-в этом нет сомнений, но если позволяет бюджет, то лучше рассмотреть для BI-вертику или скуль, если OLTP-скуль
Видел решение по финансовой бирже-более 100 ТБ БД на постгресе… скажу вам плачевно все-на поддержку тратятся суммы в разы больше, чем если бы купили вертику и 2-х спецов, а не целый штат

silvercaptain 2 мар 2018 в 04:39

Realy?

что бы не быть голословным можешь выкачать этот набор данных:

northcentr.blob.core.windows.net/tpcc/order_line.txt
(8,6GB)
Это CSV с разделителем tab
Загрузить в PostgreSQL
Прооптимизированный, куда же без этого :)

и выполнить запрос:

SELECT  row_number() over (order by ol_number) rnk,
 ol_number
 ,sum(ol_quantity) AS sum_qty
 ,sum(ol_amount) AS sum_amount
 ,avg(ol_quantity) AS avg_qty
 ,avg(ol_amount) AS avg_amount
 ,count(*) AS count_order
FROM order_line
GROUP BY ol_number
ORDER BY ol_number;

Жду время выполнения этого запроса.

Последняя версия, на которой я это тестировал была

PostgreSQL 9.6.0 on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3, 64-bit

И результат был мягко говоря не радостный.

Как по мне — типичная задача BI на не самых больших данных

Tantrido 2 мар 2018 в 11:24

Извини, у меня работа. Как пел Высоцкий: «Я себе уже всё доказал!» У меня на гораздо более сложном многоэтажном запросе с несколькими JOIN и агрегатами и базе в несколько гиг постгрес был в 20 раз быстрее на базе БЕЗ ИНДЕКСОВ, чем МС с индексами, включая кластерный, с индексированный VIEW WITH SCHEMABINDING, который как ты знаешь в МС работает гораздо быстрее обычного JOIN-а таблиц и т.п.

jobgemws 2 мар 2018 в 11:58

Так напишите об этом статью, особенно о сравнении производительности-при каких условиях, что и как тестировали и т д-это будет всем интересно, конструктивно, а не голословно

Tantrido 2 мар 2018 в 12:27

Да, было бы хорошо. Однако сейчас работа другого характера, доступа к тем данным нет. Будет возможность — с удовольствием: стараюсь теперь на хабре писать интересные вещи по ходу работы, чтобы не терялись и могли кому-то пригодиться.

jobgemws 2 мар 2018 в 12:35

Тогда жду вашей статьи

silvercaptain 2 мар 2018 в 13:29

Блажен кто верует…

Но я ожидал такой ответ :)

silvercaptain 2 мар 2018 в 15:05

У меня на гораздо более сложном многоэтажном запросе с несколькими JOIN и агрегатами и базе в несколько гиг постгрес был в 20 раз быстрее на базе БЕЗ ИНДЕКСОВ, чем МС с индексами, включая кластерный, с индексированный VIEW WITH SCHEMABINDING, который как ты знаешь в МС работает гораздо быстрее обычного JOIN-а таблиц и т.п.

К сожалению, с Join'ами на больших таблицах все не так радужно… И мегаспецы с sql.ru так же бессильны. Это лично мой пример, и моя попытка получить помощь
www.sql.ru/forum/1199125/has-join

jobgemws 2 мар 2018 в 15:24

Я вас удивлю, но к сожалению на SQL.RU я вообще не мог получить ответа на все возникающие проблемы, потому только или иностранные ресурсы, или знакомые или эксперименты

jobgemws 2 мар 2018 в 15:31

Но в итоге как решили проблему на постгрессе?
Спасут ли индексы? Если да, то какие подошли оптимальное всего?
Или какое было ещё решение?

silvercaptain 2 мар 2018 в 16:01

Запрос удалось выполнить за «приемлемое» время. Но разница с SQL Server'ом все равно Космос

jobgemws 21 июн 2019 в 07:08

Сравнивали 2016 скуль с постгресо: по тесту Гилева (запускали много раз) как раз получили, что постгре на линуксе с оптимизированными параметрами просела в среднем на 9%, также есть проседания до 9% и по комплексным операциям в 1С.
В итоге после прогонов разных тестов:
в общем получили почти ничью только из-за того, что файловая система лучше на UNIX-системах, чем в Windows, потому постгре и показывает хуже результаты в ОС Windows, чем скуль.
Вообще интересно было бы протестить скуль 2019 (как выйдет) на линуксе и постгре на линуксе, чтобы понять на скоько сильно и как отличаются в производительности две эти СУБД при одинаковой ОС.
Также такие статьи и им подобные не соответствуют действительности по тесту Гилева (возможно были проплачены, либо ради высокого рейтинга для пиара):
infostart.ru/public/962876
Так что не нужно вешать лапшу на уши-скорее всего Вы просто неправильно оптимизировали скуль или использовали старые его версии или редакцию урезанную

Tantrido 21 июн 2019 в 10:21

Postgres был 8.3 где-то, мсскл — 2005-2008, всё под виндой server 2003/2008. Может сейчас ускорили, но я сильно сомневаюсь, что его могли в разы ускорить.

jobgemws 21 июн 2019 в 11:27

постгрес был 10.5, ОС-CentOS 7, скуль 2016 Standard и винда 2012 R2 сервер
постгре дал сначала результат в среднем 8,8 при оптимизации для 1С, после всех оптимизаций (ядро CentOS, файловой системы и т д) в том числе и по следующему калькулятору подгоняли: pgconfigurator.cybertec.at
получили, что макс на постгре тест Гилева показал результат в 9,96, тогда как даже не в оптимизированном скуле (оптимизация была поверхностная-как указано в 1С) показатель был всегда выше 10, а именно 10,4-это среднее значение.
Итог: 3 дня подбирали оптимальные параметры для постгре, оптимизированного под 1С со всеми патчами, а скуль лишь немного настроили как рекомендует 1С. И в итоге-постгрес продул в производительности скулю, несмотря на то, что файловая система в линуксе лучше файловой системы в винде да еще и оптимизирована была. Вывод: СУБД постгре явно проигрывает в производительности СУБД MS SQL Server и только за счет ОС и файловой системы может приближаться к производительности скуля на винде. Но выход скуля 2019, который будет нормально работать в том числе и на линуксе все изменит

Tantrido 21 июн 2019 в 11:29

Ой, что-то верится с трудом, что мс научилась так писать программы и СУБД. Может в 1С запросы кривые неоптимизированные. Мы сами запросы писали и оптимизировали.

jobgemws 21 июн 2019 в 12:00

я привел сравнение только по известному тесту Гилева:
www.gilev.ru
никаких других запросов

speshuric 1 мар 2018 в 21:59

Вот читаю я эту статью и вижу, что написано человеком знающим и опытным — без иронии, действительно знающим и опытным. Но. Но ваши рекомендации опоздали лет на 8-10 — не для какого-то конкретного читателя опоздали, а в принципе опоздали. И по объёмам данных опоздали, и по конкретным приёмам опоздали.
Мне уже надоело переучивать DBA и разработчиков, начитавшихся "советов в энторнетах", подобных данной статье. Проблема не в советах, конечно же а в том, что их применяют не включая мозг. Эти статьи смешиваются, превращаются в опасные мифы и заблуждения.

Вот просто для иллюстрации, совет "сначала выберите удаляемые/изменяемые данные во временную таблицу". Совет для некоторых конкретных случаев весьма дельный. Но на самом деле часто это очень вредный совет:

Не сильно заботясь воткнули stop-and-go.
Потеребили tempdb
Всё сложили в таблицу без индексов (кстати и в вашем примере), а если таких таблиц 10-20, то что потом в соединении?
А если и создали, то воспроизводимость планов с индексами и таблицами в tempdb и их диагностика мягко говоря слабее, чем с продуманными постоянными
И при создании/удалении временных таблиц можно легко нарваться на узкое место в виде перекомпиляции запросов.

Не бывает универсальных (или "вечных") рекомендаций. Рекомендации нужно применять либо как архитектурные принципы ("знаем, что есть исключения, но делаем так пока нет явных причин так не делать"), либо только после диагностики. А вот про диагностику у вас вообще почти ничего нет. Я не про ту диагностику где "индекс давно не используется", а про "что является узким местом данной системы и чем это обусловлено". Ну хоть бы sys.dm_os_wait_stats упомянули. А в идеале, чтобы велосипеды не изобретать, можно и тулзы Брента Озара упомянуть. Кстати, на его основном сайте очень много интересной, полезной и более актуальной информации о производительности MS SQL

speshuric 1 мар 2018 в 22:08

И еще сильно напрягли рекомендации в стиле "делайте всё правильно", например:

"Правильно задавайте уровень изоляции при работе с БД" — ахаха, 80% корпоративных БД на nolock до сих пор сидят, а из разработчиков, хорошо, если 20% могут осмысленно уровни изоляции обсуждать
"используйте разумно хинты к запросам" — тоже прекрасно. Степени разумности, которые я видел — от "нельзя ничего" до "указать индекс для каждой таблицы".

jobgemws 2 мар 2018 в 04:18

Это и понятно, но все расписывать-целую книгу писать, потому в статье затронул 3 аспекта по оптимизации и в каждом не исчерпывающий список проблем

jobgemws 2 мар 2018 в 04:37

Во-первых эти концепции скорее не устареют, а будут дополняться и более детализироваться
А во-вторых, здесь даны примеры. И как и любой пример он имеет свои преимущества и недостатки
И в-третьих, грубо, но для общего понимания вполне сгодится-всегда используется tempdb и если проблема с выделением временной таблицы, то либо вы обрабатываете слишком много данных за раз для вашей системы (тогда делайте порциями обработку), либо проблема не в запросе, а в tempdb-нехватка памяти, медленный ввод-вывод и т д
И итог-напишите свою статью, исходя из того опыта и знаний, что накопил и поделитесь с читателями
Вставка же небольшой порции данных во временную таблицу, позволяет минимизировать блокировки. Для систем, где есть проблема с tempdb разницы не будет, т к либо ожидание будет на блокировку у других запросов в том числе при не использовании временной таблицы, либо задержка будет в вводе-выводе. Но система сама сделает промежуточную таблицу при определённых условиях, а система, где с tempdb все нормально-данный запрос позволит другим не ждать окончания блокировки
И Вы правы-все нужно применять с головой

Зарегистрируйтесь на Хабре, чтобы оставить комментарий