Comments / Profile of outlingo / Habr

User

ProfileArticles9PostsNewsComments713

Почему линукс использует swap-файл

outlingo Feb 3 2021 at 06:25

Снапшоты qcow2 средствами qemu-kvm и последующее их копирование, что позволяет производить резервное копирование более гранулярно и с меньшими затратами ресурсов

0

Почему линукс использует swap-файл

outlingo Feb 3 2021 at 06:23

Свап позволяет системе эффективней использовать кэш. В условиях отстутсвия memory pressure вы этого можете не заметить. Но когда оно появляется, наличие swap позволяет системе оперировать эффективней. И в статье я объясняю почему это происходит.

+8

Почему линукс использует swap-файл

outlingo Feb 2 2021 at 23:16

Кубик пытается изобразить из себя «распределенную платформу» и сам занимается менеджментом ресурсов, выставляет ограничения и прочими способами обещает поддерживать йоды в неперегруженном состоянии. Ну вот такой у них полиси «вы должны предоставить столько ресурсов чтобы хватило» написанный исходя из политики «проще добавить железа чем оптимизировать»

Свап это для ситуации «работаем на тех ресурсах которые есть».

+7

Эксплуатация Ceph: флаги для управления восстановлением и перемещением данных

outlingo Jan 26 2021 at 11:07

nobackfill и norecover делают одно и то же

Точно-точно? Потому что бакфил это тотальный залив всех объектов PG в новую реплику, а recover — переливка только дегрейднутых объектов, что существенно легче. backfill это «массовый рекавер» но не наоборот.

0

Эксперт обнаружил критическую уязвимость в Windows 10. Однострочная команда повреждает NTFS на диске

outlingo Jan 14 2021 at 15:32

type c:\:$30:$bitmap\nothing.txt?

0

Самый беззащитный — уже не Сапсан. Всё оказалось куда хуже…

outlingo Jan 13 2021 at 18:33

MAIL FROM? Не, не слышал, ага

0

Самый беззащитный — уже не Сапсан. Всё оказалось куда хуже…

outlingo Jan 13 2021 at 09:59

Деквалификация. Тех кто мог сделать код что в любую щель пролезет давно понанимали большие компании, а нынешний молодняк в большинстве своем… Не слишком хорошо знаком с основами, скажем так. 90% даже про syn/ack не слышали, а уж воспользоваться каким-нибудь HTTP CONNECT через прокси для сканирования удаленной сети для них как магия.

+4

Самый беззащитный — уже не Сапсан. Всё оказалось куда хуже…

outlingo Jan 13 2021 at 09:50

Угу. Начальник отдела 300, 4 подчиненых по 50, в среднем 100. Знаем, да

+7

Самый беззащитный — уже не Сапсан. Всё оказалось куда хуже…

outlingo Jan 13 2021 at 09:47

Там все средства распилены и занесены куда надо кому над ов нужных пропорциях, поэтому на выполнение работ денег нет. Поинтересуйтесь сколько там получает какой-нибудь «ведущий специалист» и потом попробуйте представить, пойдет ли на такую оплату спец достаточно высокой квалификации?

+3

Увидеть за 50 секунд смерть Intel и рождение новой галактической империи

outlingo Dec 23 2020 at 11:15

Что как бы закономерно. Трансляция команд x64 -> ARM это конечно замечательно и М1 процессор замечательный — но если софт активно использует векторные инструкции и собран нормальным компилятором, то «внезапно» оказывается, что похороненный интел вылезает из земли и съедает всех танцующих на его могиле, после чего прячется и ждет следующих танцующих.

И поскольку в 2017 году clang и LLVM сливали GCC и ICC по производительности сгенерированного кода почти двукратно, я бы не исключал, что эппл подтянули свой компилятор чтобы он под ARM начал генерировать вменяемый код, и теперь сранивают нормально собраный армовский бинарник со сгенерированным их же компилятором унылым кодом x86.

+2

Ceph. Анатомия катастрофы

outlingo Dec 8 2020 at 17:47

В общем так же не вижу смысла продолжать. Собираете лабу — снимаете цифры со 100% дегрейдом домена под нагрузкой в течение нескольких минут, снимаете цифры, пишете статью, её и обсуждаем.

0

Ceph. Анатомия катастрофы

outlingo Dec 8 2020 at 17:36

Специально для вас повторю — лабораторный сетап с учетом использовавшихся в нем дисков являлся достаточно сбалансированным и не имел откровенных проблем, а соотношение производительности дисков и сети вполне соответствовало рекомендуемой конфигурации.

0

Ceph. Анатомия катастрофы

outlingo Dec 8 2020 at 15:32

И как то непонятно получается то вы говорите «2x10 вполне бы хватило», то говорите «Вот только это не помогает.»

Тривиально. «Вполне бы хватило» для того чтобы полность с гарантией возможности OSD по рекаверу. Не помогает — потом что выигрыш в 15-20% кторый можно получить улучшив сеть не способен закрыть потери от рекавера.

Но почему то вас очень задевает, когда я вам говорю то же самое.

Меня раздражают эльфы-архитекторы предлагающие заливать железом архитектурные проблемы. Зависимость между стоимостью и производительностью логарифмическая.

0

Ceph. Анатомия катастрофы

outlingo Dec 7 2020 at 22:54

это вообще ни какого отношение к обсуждению не имеет

Ну почему же? Если Вы с таким апломбом декларируете о том, что у всех неправильный сетап — то наверняка Вы знаете правильный. Сообщество ждет. Сефовский чат в будет рад услышать предложения эксперта.

вот наконец то вы озвучили это. Агрегация и бондинги появились за долго до 2016-2017 года

Разумеется. Я вам по секрету скажу — в продуктиве мы это использовали. И не только мы — в общем то практически все, у кого сеф в продуткиве, к этим ухищрениям прибегают.
Вот только это не помогает. Не выходит разницу в порядок замаскировать двукратным увеличением полосы. И я вам еще более страшную тайну открою — даже 2x40G вам не поможет. Потому, что Ceph надо вместо записи 4KB прочесть 4MB, записать 4MB, обновить пачку метаданных (причем зачастую еще и в синхронном режиме, то есть в один поток) — и только потом собственно приступать к записи 4KB. И опять же — те, кто использует сеф в продуктиве это тоже знают.
И именно поэтому в майнстриме ведутся работы по оптимизации рекавера, чтобы не реплицировать объект полностью. Потому, что разработчики понимают, что алгоритмическую проблему просто «закидать железом» нельзя.

0

Ceph. Анатомия катастрофы

outlingo Dec 7 2020 at 22:03

Ммм, как интересно.

Насколько я понимаю, у вас есть правильная конфигурация, которая позволит потерять в производительности не более 50% при отказе 30 процентов оборудования? Я думаю, сообществу было бы интересно её увидеть. И её стоимостную оценку, в долларах за гигабайт. Включая сетевое оборудование. В расчете, ну, например, на 300TB полезного пространства. А то знаете ли, с эльфийскими фантазиями о бюджете можно много насочинять, а так чуть ближе к земле будет.

Что же до сетапа стенда — конфигурация стенда вполне себе разумная. OSD обслуживает порядка 45 IOPS в секунду (исходя из service time 22ms, мы же говорим о рекаверных операциях блоком 4MB), сеть десятка, одна нода протянет 400… 450 IOPS по дискам и примерно 300 IOPS по сети. Чуть получше сеть хотелось бы конечно (2x10 вполне бы хватило) — но в целом да, нормальный сетап для компонентов 2016-2017 года.

0

Ceph. Анатомия катастрофы

outlingo Dec 7 2020 at 16:11

будут расти кэши записи и врезультате все это встанет в интересную позицию

Кэш тут ни причем. Проблема деградации производительности происходит только от архитектуры и реализации Ceph, который рекаверит объект полным копированием перед записью с целью обеспечить надежность. К проблеме роста потребления памяти это не имеет никакого отношения, потому что объем данных, размещенных в очереди на запись, на один-три порядка меньше чем объем данных репликации.

В классическом кейсе RBD, когда у вас например 1000 образов (== 1000 клиентов) у каждого из которых очередь в 128 запросов, при записи по 64KB в одну операцию у вас требуемый на «кэши» объем памяти будет порядка 8GB на весь кластер.

Проблема потребления памяти имеет свои корни в большом объеме данных, которые OSD удерживает в памяти во время начального согласования статуса PG (пиринга), в объеме хранимых PG log и в том, как OSD принимает решение о транкейте этих логов. OSD в режиме рекавера выедает память даже в отсутствие нагрузки — еще в процессе пиринга. И это особенно активно проявляется в erasure code большой размерности (например 6+2, 8+3 и т.д.) при большом количестве PG — либо у нас не потранкейчены логи и мы быстро собираем дегрейднутые объекты, либо логи потранкейчены, и тогда нам надо собрать собрать информацию о версиях всех объектов. Либо перезаливать PG полностью.

0

Расшифровка эфира Хабра с ДИТом Москвы

outlingo Jun 3 2020 at 22:53

30 человек на это недоразумение под названием «социальный мониторинг»? Вот реально, любая адекватная команда из 5 человек сделает его за месяц. И качественнее. Причем один человек будет ПМ.

0

О тенденциях развития архитектуры процессоров, или почему я верю в успех Huawei на серверном рынке

outlingo May 8 2020 at 08:37

Потому, что деньги на лицензии уже потрачены — надо отбивать :-)

0

Apple выпустила новый iPhone SE по цене от 40 000 ₽

outlingo Apr 15 2020 at 16:15

Камера такая же как в 8, разве что процессора новее

-1

Tips & tricks в работе с Ceph в нагруженных проектах

outlingo Apr 8 2020 at 23:16

Для сефа бессмысленно иметь четное количество мониторов, скажем так. Единственный смысл этого это очередной Росреестр или клаудмаус когда один монитор умер, два пролюбили — и вот тогда… Но это уж надо очень-очень поврежденную карму иметь.

+1

1 2 ...

34