Максим @Maksvelis
Исследователь железа
Information
- Rating
- Does not participate
- Location
- Санкт-Петербург, Санкт-Петербург и область, Россия
- Works in
- Registered
- Activity
Specialization
Software Performance Engineer, Hardware Engineer
Lead
Linux
Python
PostgreSQL
Stress Testing
Testing productivity
Functional testing
Quality control
Design testing
Не расплавится ли PLA от температур платы? она не сильно греется? если больше 70 я бы использовал ABS.
Видимо вы не поняли что CXL может заменить их
Утилизация полезного места в стойке, энергоэффективность, гибкость масштабирования, снижение затрат. Вы мыслите в масштабах одного проекта, а здесь масштаб дата-центров.
Уже довольно много и в промышленных масштабах, если интересно напишите мне в личку поделюсь ссылками
Как раз таки CXL позволит создать эти узлы с минимальными задержками. GPU тоже умеют в CXL
А теперь давайте сравним задержки IB при доступе к памяти? 5–10 мкс против 200-300 нс у CXL в одной стойке. Не во всех сценариях утилизируется вся пропускная способность канала но задержки играют ключевую роль (Высокая задержка увеличивает время итерации сильнее, чем низкая пропускная способность)
Я бы советовал вам углубится в теорию CXL почитать спецификацию на CXL 3.2 могу поделится если требуется а так же изучить подробнее как собираются кластера CXL как писал в статье такие уже есть.
Мне кажется вы не правильно ставите вопрос, вы не должны хотеть присоединиться если у вас такой потребности нет, Тем более если вы считаете что данная технология вам не подходит и вы уверены что к примеру соберете кластер HPC эффективнее то к чему данные вопросы?)
Спасибо за вопрос!
Все верно, вы не много не уловили суть теста, задача была выяснить чем cxl уступает или нет другим протоколам например infiniband или RDMA. Данные экспандеры созданы для отладки технологии и создания MVP. Конечно же целевое использование это HPC, ML, может быть реал тайм базы данных. Все эти чипы cxl уже успешно перезжают на большие платы и работают в составе больших кластеров дезагрегированной памяти. Задача была "прощупать" технологию и понять ее нюансы.
Так mlc и показывает bw, чем измерять? Почему странный? Он специально создан для отладки...
Спасибо, полезный материал, теоретически может ли сам переход по qr коду заразить устройство или требуется скачать что то?
Молодец, продолжай в том же духе, далеко пойдешь.
Согласен, выглядит подозрительно)
Спасибо что заметили, разница только на одном графике у PG16 по SELECT, должно быть 7 948 239 вместо 8 048 239
Какой мне смысл пиарить Enterprise версию? мне за это не платят к сожалению)) Здесь был упор на то что Enterprise версии показывали более лучшие результаты от сюда и тюнили самую свежую версию, мы же видим динамику от версии к версии. Можно было и все версии протестить в таком перфоманс режиме только цель была не такая, цель была показать разницу в дефолтных и тюнингованных настройках на любой из версий.
Да вы правы, теперь процессы пишут в основную шаренную память. И в целом нагрузка на запись на pg_stat_tmp значительно уменьшилась. Но запись то всё равно есть. По поводу этого момента у нас нет чётких тестов, может уже и не стоит это делать. Но критичного в этом ничего нет на результаты тестов это не повлияет. Если у вас есть аргумент что это критически повлияло на тесты или еще на какой-то момент, с удовольствием почитаю.
Про значения с потолка я промолчу, вы явно не понимаете зачем были проведены данные тесты, про автоматизацию вы видимо пропустили или не читали статью, банально "sed" уже упрощает жизнь. Что уж там говорить про парсер данных и полную автоматизацию тестирования за исключением отрисовки графиков их да я делал руками. Расскажете как будете автоматизировать?
в документации обратная информация https://www.postgresql.org/docs/16/storage-file-layout.html
Спасибо, обязательно посмотрю!
Можно было создать часть ram как блочное устройство и смонтировать туда но что бы это изменило? Или что вы имеете ввиду?
Жизненно важный сервис!)
Я не отрицаю что и там и там есть конвейер) я лишь констатирую факт что он (в АРМ) оптимизирован по другому)
Спасибо
256 Гб и больше памяти в системе из за того что это фиксированные конфигурации, а не кастом или какая-то сборка.
"Работа cpu будет заметна в запросах с сортировками, агрегациями, аналитическими функциями." Можете пожалуйста привести примеры для замеров производительности?
В Ubuntu в общем-то нет ни каких преимуществ за исключением того что она работала стабильнее на АРМ платформе.
Критиковать всегда легко, вы можете написать, как надо? без учета других комментариев.