Comments / Profile of borovinskiy / Habr

Арсен Боровинский @borovinskiy

Предприниматель

Все врут: эпопея с NVMe-серверами и Hi-CPU

borovinskiy Jun 16 2021 at 12:20

blocksandfiles.com/2019/11/25/intel-dynamic-cache-665p-ssd-goes-faster-lasts-longer

1. SLC работает на запись быстрее MLC/TLC/QLC;
2. У SLC меньше износ.

Look

Все врут: эпопея с NVMe-серверами и Hi-CPU

borovinskiy Jun 16 2021 at 11:23

Диск изначально весь SLC. По мере записи SLC меняется на TLC.
Поэтому SLC-кеш изначально объемом в весь диск, по мере записи SLC-кеш уменьшается до некоего уровня.

Поэтому пока первый раз такой диск полностью не запишешь, он будет более высокие скоростные характеристики показывать и выше надёжность.

Look

Все врут: эпопея с NVMe-серверами и Hi-CPU

borovinskiy Jun 16 2021 at 00:36

Раз пошла речь про влияние гипервизора на производительность работы с дисками, вот мой benchmark KVM vs baremetal vs Hyper-V на Sata SSD и синхронной записи.

Примечательно в результатах там то, что при многопоточной записи производительность сильно падает, что видимо объясняется частым переключением контекстов (т.е. большое количество виртуалок на хосте — плохо), а производительность чтения совершенно неадекватна т.к. в реальности чтение происходит из ОЗУ хостовой ОС, а не с дисков.

Ну и да, бенчмаркать дисковую систему очень нетривиально т.к. много что может сильно влиять на производительность и может случиться, что измеряешь не производительность nvme, а производительность своей программно-аппаратной конфигурации, которая в руках другого человека с другой конфигурацией железа, но теми же дисками не воспроизведется.

Look

Все врут: эпопея с NVMe-серверами и Hi-CPU

borovinskiy Jun 16 2021 at 00:23

CrystalDiskMark вроде никогда адекватных результатов для SSD и не показывал, его вообще не надо было использовать. Посмотрите обзоры IXBT и что они используют. Попробуйте IOmeter, там можно детально нагрузкой управлять как по чтению, так и по записи.

RAID сейчас многие собирают софтово. В винде же тоже можно, вот бы и собрали, раз так нужно. С софтовым RAID может быть печально если ОС умрет, но при обновлении ОС все равно все виртуалки смигрируются, так что не так опасно, а вот если аппаратный контроллер помрет, то веселья будет заметно больше. Количество багов к аппаратным контроллерам тоже не внушает уверенности в сохранности данных.

Здесь выше писали, что при записи в одну очередь разницу между nvme/sas/sata увидеть сложно т.к. тормозом является непосредственно запись в SSD, а не интерфейс. Гигабайты в секунду получаются при записи большой очередью т.к. SSD будут писать в разные ячейки одновременно и на этом можно прокачать IOPS и полосу пропускания. При последовательной записи и быстрые и медленные SSD выдадут на блоках по 4K около 50 тыс. IOPS.

При этом многие практически приложения были сильно оптимизированы во времена HDD чтобы писать последовательно в один поток (например СУБД) и у меня сайты на Drupal сохраняют материалы на SSD всего-лишь в два раза быстрее HDD (а никак не в сотни раз быстрее формальной разницы в IOPS). Поэтому синтетика может сильно завышать скорость по сравнению с реальными приложениями. На тех же СУБД, если вся база в ОЗУ влазит, не надо удивляться, что при чтении IOPS к дискам нет и использование nvme не дает прироста производительности.

Латентность на скриншотах в посте в десятки миллисекунд типична для HDD, а не SSD. Латентность SSD обычно в 50 раз меньше латентности HDD. C этим определенно надо разбираться, как и с провалом на 45ГБ.

Не написано, выключался ли WriteCache в хостовой Windows и в SATA RAID. Думаю не надо объяснять как кеш на запись может на результаты повлиять.

Тестирование Ceph можно, например, здесь посмотреть: www.proxmox.com/en/downloads/item/proxmox-ve-ceph-benchmark-2020-09

Look

Все врут: эпопея с NVMe-серверами и Hi-CPU

borovinskiy Jun 15 2021 at 23:39

Сейчас SLC-кеши могут быть динамические. Пока диск первый раз не перезаписан, всё свободное пространство может быть SLC. Затем постепенно SLC может уменьшаться до некоторого порога, который в корпоративных дисках сильно больше домашних.

Если нужно совсем без SLC, то это Intel Optane.

Look

Self-Hosted, или Kubernetes для богатых: почему самостоятельное развертывание кластера — не всегда способ сэкономить

borovinskiy Jun 5 2021 at 20:04

Тестировал давно производительность, получился оверхэд:
SMB (Samba): 5-7%;
NFS: 30%;
GlusterFS: 70%.

Это цифры в каком-то смысле «сферический конь в вакууме», естественно.

Look

Как мы делали планшет

borovinskiy Jun 4 2021 at 06:22

Пользователи планшетов значит мимо пролетают и наличие ПК (win/mac) является обязательным условием обучения?

Look

Как мы делали планшет

borovinskiy Jun 4 2021 at 06:21

Так выдать теорию в цифре, а кто хочет пусть пишет опорный конспект для запоминания.

В реальности же так: «теории в цифре такой как у меня в мозгу нигде нет, свой суперценный контент я вам не выдам чтоб только я владел им <дьявольский смех>, так что сидите и записывайте, на экзамене проверю».

Ну и запомнить — не значит понять теорию. А надо чтобы поняли.

Для понимания надо добавить задачи и тесты прямо в теорию. Только тестировать с мелом на доске как-то сложно, поэтому нужно все сделать в цифре.

Look

Может поменять способ хранения?

borovinskiy May 25 2021 at 15:23

Чтение сериализованного объекта из СУБД скорее всего будет работать быстрее чтения с файловой системы.

Ну и кроме ACID в СУБД есть индексы.

На файлах хранилище тоже раз делал в электронной библиотеке для киосков. Но там задача стояла сделать что-то, что можно поставить в один клик и при этом архитектурно:

1) nodejs при запуске приложения сканирует все файлы и составляет поисковый индекс в памяти процесса (долгий старт даже на 4 тыс. файлах).

2) скрипт поиска не умел в перестроение индекса, поэтому при импорте новых ресурсов надо перезагрузить всю программу (но это баг конкретного поисковика на JS)

3) есть ограничения на длину имени файла на файловой системе

4) столкнулся с проблемой, что некоторые файлы, созданные nodejs, нельзя потом удалить через проводник Windows или через консоль (в чём проблема так и не разобрался)

Ну и бенчмарки показывают, что ОС очень не любят сильноконкурентный случайный доступ к файловой системе — нелинейно падает производительность ввода-вывода. Что в общем и понятно, файл может в файловом кеше ОС находиться, но чтобы прочитать оттуда, надо системный вызов дёрнуть.

В случае использования какого-нибудь stateless языка типа PHP, использование множества файлов в качестве БД совсем плохой идеей кажется: ни поиска ни индексов на файлах как-то не хочется делать, а если для поиска и индекса БД использовать, то и данные логично там же хранить.

Look

«Яндекс» запустил сервис «Документы»

borovinskiy Apr 26 2021 at 18:04

В справке бренд не заменили

Look

Вышел Chrome 90

borovinskiy Apr 15 2021 at 08:19

Есть ПК, у которых хватает ресурсов в реальном времени кодировать видео в AV1 и отсылать по WebRTC?

Хотя да, вот пруф: www.chromestatus.com/feature/6206321818861568

Look

Трагичная история знакомства с poppler

borovinskiy Mar 26 2021 at 22:34

Если документы существуют только на сервере, можно серверный рендеринг использовать как здесь: elibsystem.ru/node/186, но от него текстовые pdf распухают и есть проблема при ресайзе (пользователь решил увеличить).

Если в pdf много изображений, рендеринг может подтормаживать, так что рендерить лениво — правильное решение.

А так если нужно с удобной корпоративной лицензией, то здесь стоит смотреть pdfium или apache pdfbox. Ну или покупать. Купить можно mupdf (или более старый ghostscript), но есть также коммерческие библиотеки на java.

Look

Как и ожидалось, в полночь Adobe Flash превратился в тыкву

borovinskiy Mar 22 2021 at 12:58

SVG в браузере — это DOM со всеми последствиями и программной отрисовкой.

Что бы тягаться с Flash, надо рендерер SVG в Canvas делать. Ну собственно оно и сделано: github.com/canvg/canvg.

Look

Минпросвещения РФ: доступ к «негативной информации» через школьный Wi-Fi будет заблокирован

borovinskiy Mar 16 2021 at 21:53

Погуглите «групповая работа в обучении».

Look

Минпросвещения РФ: доступ к «негативной информации» через школьный Wi-Fi будет заблокирован

borovinskiy Mar 16 2021 at 06:42

Нет не пришли.

Есть групповая работа (2 ученика на одном устройстве задание выполняют). Школа может планшеты выдавать на время занятий (есть станции зарядки и т.п., так что решить можно).

Look

Минпросвещения РФ: доступ к «негативной информации» через школьный Wi-Fi будет заблокирован

borovinskiy Mar 16 2021 at 05:28

У 30% учащихся нет доступа к устройствам и ПК не только в школе, но и дома.

Если же исходить из тезиса, что у учащихся свой тырнет на смартфонах, то вообще никакие блокировки не нужны.

Look

Как и ожидалось, в полночь Adobe Flash превратился в тыкву

borovinskiy Mar 13 2021 at 10:30

Просто HTML5 сделал всё это не нужным.
Ценность Flash в том, что он улучшал веб тогда, когда в этом была острая необходимость. Но развитие веба ценность свело на нет и Adobe приняли вполне разумное решение сосредоточиться на развитие веба в рамках HTML5 и перестроить свои продукты на HTML5, а не продавливать пользователей на Flash, который к тому же не работал без Adobe AIR на смартфонах.

З.Ы. Adobe AIR они продали Samsung-у (Harman точнее), а Flash в Китае, судя по всему, вполне развивается, так что дело не в деньгах, а в выборе стратегического пути: можно развивать прогресс, а можно тормозить. Adobe поступила так, как и должен был поступить один из лидеров в создании ПО.

-1

Look

Как и ожидалось, в полночь Adobe Flash превратился в тыкву

borovinskiy Mar 12 2021 at 10:19

Больше не имело смысла. Flash решал проблемы веба, веб развился и догнал Flash.

Look

Как и ожидалось, в полночь Adobe Flash превратился в тыкву

borovinskiy Mar 12 2021 at 07:14

А она у них и была:
1) Продажи Flash Builder;
2) Продажа систем DRM с шифрованием контента для видео и PDF, работающих во FlashPlayer с оплатой за дешифровку каждого ресурса;
3) Продажа установок антивирусов вместе с Flash;
4) Продажа корпоративных подписок;
5) Продажа некоторых фичей движка разработчикам игр.

Когда весь мир пользуется Adobe Flash — видимо хватало на содержание команды и кэш конторе.

Look

Минпросвещения РФ: доступ к «негативной информации» через школьный Wi-Fi будет заблокирован

borovinskiy Mar 9 2021 at 09:53

Вот я тоже про «родительский контроль» в общественном обсуждении стандарта «цифровой школы» написал.

Но здесь надо понимать «политический момент». Ростелеком в фильтры продвигает Минцифры (хотя слова Ростелеком с стандарте не звучит, но все догадываются кто будет единственным исполнителем подключений школ к интернету). Фильтры — это деньги.

Можно приложение для родительского контроля написать и предложить его взволнованным родителям поставить на смартфоны учащихся, а можно «выделенные защищенные ГОСТовским шифрованием каналы с функцией фильтрации трафика» вписать в многомиллиардную программу подключения школ к интернету.

Не сложно догадаться какой вариант будет выбран.

З.Ы. Ни ответа ни привета на мои предложения от Минпросвета не последовало.

Look

1 2 ...

14 15

17 18 19 20 21