Grigory_Otrepyev Mar 9 2024 at 05:55

Тормозящая виртуализация на x86. Небольшая попытка разобраться. Часть 1: Общий обзор

Hard

10 min

19K

Virtualization *

FAQ

+33

Comments 25

Breathe_the_pressure Mar 9 2024 at 06:17

Григорий, волнуюсь за вас, что-то случилось?

Grigory_Otrepyev Mar 9 2024 at 06:41

Григорий, волнуюсь за вас, что-то случилось?

Пока писал третью часть опуса выше, обнаружил что hyper-v местами - пропаганда разных веществ. Очень расстроился.

Thomas_Hanniball Mar 9 2024 at 19:34

"Не ожидал я, что получу в итоге +230 - 232 в карму, всего 462 голоса. "

Дополню вопрос, а что случилось с вашим аккаунтом? Админы хабра обнулили всю карму и голоса за неё, но оставили все статьи? Сейчас 25 человек голосовало за карму, т.е. куда-то пропали старые 462 голоса.

Если бы старых статей не было, то я бы подумал, что это просто новый аккаунт создан.

Grigory_Otrepyev Mar 10 2024 at 04:23

Дополню вопрос, а что случилось с вашим аккаунтом? Админы хабра обнулили всю карму и голоса за неё, но оставили все статьи? Сейчас 25 человек голосовало за карму, т.е. куда-то пропали старые 462 голоса.

Сбросил карму, интересно же как это работает. Пока +20 - 10, меня кто-то не любит.

Tzimie Mar 9 2024 at 06:43

- Кроме того, оказывается что на Хабре осталось меньше 300-500 живых людей с правом голоса за карму.

Что-то вспомнилось теория мертвого интернета

Tzimie Mar 9 2024 at 06:48

У мне ещё кажется что Hyperthreading зло. Первые 50 процентов по CPU условно честные. А вот дальше... Вторые 50 процентов это максимум 25. Но при приближении к 100 процентам страдает cache hits для L3 cache и cross numa каналы

Кстати, MSSQL с его огромным плоским buffer cache это очень неудобная аппликация как для L3 cache, так и для NUMA - нет привязки тредов к месту памяти, они могут рандомно читать отовсюду.

К сожалению что cache hits L3, что загрузку Numa можно снять только специальным оборудованием, метрик таких нет

LeetC0de_M0nkey Mar 9 2024 at 07:05

У мне ещё кажется что Hyperthreading зло. Первые 50 процентов по CPU условно честные. А вот дальше... Вторые 50 процентов это максимум 25. Но при приближении к 100 процентам страдает cache hits для L3 cache и cross numa каналы

Так и должно быть. HT это не отдельное ядро, а попытка хоть как-то задействовать простаивающие ALU ядра. Если на ядре выполняются два разношёрстных потока, это худо-бедно выигрышно. А если одинаковые, то лучше вовсе запретить шедулить такие потоки на HT "ядро".

Grigory_Otrepyev Mar 9 2024 at 07:15

У мне ещё кажется что Hyperthreading зло. Первые 50 процентов по CPU условно честные. А вот дальше... Вторые 50 процентов это максимум 25. Но при приближении к 100 процентам страдает cache hits для L3 cache и cross numa каналы

10-15% пользы после забивания задачами реальных ядер.

Tzimie Mar 9 2024 at 07:39

Да, но когда обычный человек смотрит на сервер, у которого 50% CPU, он наивно думает - ну, у нас ещё до хрена ресурсов

VladimirFarshatov Mar 9 2024 at 07:52

Не только обычный человек, но даже и средний сисадмин.

vadimr Mar 9 2024 at 09:19

Это вы ещё на архитектуру ARM не перешли. Где зачастую у разных ядер разная производительность, как в Apple Silicon. Как следствие – симметрично мультипроцессорная программа на 4 ядрах работает быстрее, чем на 8.

Tzimie Mar 9 2024 at 09:40

Ну хоть в серверном исполнении это не так? Было бы странно. Я понимаю ноут...

vadimr Mar 9 2024 at 15:34

К примеру, Mac Pro в девятнадцатидюймовом исполнении – вроде бы как сервер по внешним признакам. Имеет 24-core CPU with 16 performance cores and 8 efficiency cores.

Tzimie Mar 9 2024 at 15:50

Ну все таки это не настоящий сервер. Настоящий сервер это несколько вентиляторов, дублирующиеся блоки питания, iDrac/iLo, скорее всего отсутствие диска, ну и 64/192Gb как то смешно для сервера

vadimr Mar 9 2024 at 15:56

Ну так можно и до того договориться, что настоящий сервер занимает несколько шкафов, и опять придём к несимметричной производительности.

А фишка Silicon в том, что оперативная память встроена в процессор для ускорения доступа. Можно считать, что это кеш по интеловским меркам.

slonopotamus Mar 9 2024 at 15:56

И формат у него не стоечный.

vadimr Mar 9 2024 at 18:32

https://www.apple.com/shop/buy-mac/mac-pro/rack#

Grigory_Otrepyev Mar 9 2024 at 19:08

И формат у него не стоечный.

прямо по ссылке - Mac Pro rack enclosure with rack mount rails

Grigory_Otrepyev Mar 9 2024 at 17:50

скорее всего отсутствие диска,

С чего бы? Наоборот, в современной инфраструктуре у сервера будут не только загрузочные м.2 , но и 20-24 SSD и штуки 4 nvme

дублирующиеся блоки питания,

300W auxiliary power available:
Two 6-pin connectors delivering 75W of power each

fedorro Mar 9 2024 at 11:06

Я тоже так думал, что больше ресурсов тратится на переключение контекстов потока, чем выигрыш от использования этих виртуальных потоков. НО, как то раз мне надо было посчитать много хэшей файлов, и производительность упиралась в процессор, не в чтение с диска. Решил попробовать отключить HT из соображений приведенных выше, и получил ещё меньшую скорость расчета, как раз раза в полтора. Так что может оно и с толку сбивает, но скорости явно добавляет.

katamoto Mar 11 2024 at 05:36

Кстати, MSSQL с его огромным плоским buffer cache это очень неудобная аппликация как для L3 cache, так и для NUMA - нет привязки тредов к месту памяти, они могут рандомно читать отовсюду.

Погодите, в документации пишут, что "The buffer manager is non-uniform memory access (NUMA) aware. Buffer cache pages are distributed across hardware NUMA nodes, which allows a thread to access a buffer page that is allocated on the local NUMA node rather than from foreign memory."

Tzimie Mar 11 2024 at 05:43

Писать то они могут что угодно, но как вы себе это представляете? любой тред может прочитать страницу из Кеша. Конечно, может и возможна какие то небольшие оптимизации, но мне кажется это как мёртвому припарки

DarthVictor Mar 9 2024 at 09:59

Нужен ли на Хабре такой плохо написанный текст

Григорий, я на Хабре зарегистрирован 13 лет, и вы первый человек, на которого я подписан (хотя и не из-за этой статьи).

DM_man Mar 11 2024 at 08:01

Замечательный текст, но параллельной темой "проскакивает" - 1С и как жить и что с этим делать при стандартных подходах в некоторых видах систем виртуализаций. Уже не поднимается вопрос - "а фундаментально платформа 1С намерена модернизироваться с учетом использования виртуализации" или " покрутите там у себя в системах и должно стать лучше" ? Существует уже целый пласт тех кто ушел в 20ый век bare-metal для использования 1С и мало того под эти вещи допускают использование высокогерцовых несерверных ЦПУ - "заказчик доволен" подытоживает пласт ушедших, а то что гибкость и надежность страдают , это никого не волнует, до первого хорошего инцидента.

Docrec Mar 12 2024 at 05:48

А я как раз из-за этой статьи сделал рег и подписался. Всё многогранно, неожиданно и предсказуемо.