Комментарии / Профиль unreal

Пользователь

ПрофильСтатьиПостыНовостиКомментарии3.1K

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 21 фев 2024 в 07:39

но никто не мешает их убрать

Код редиса не смотрел, возможно там всё просто. Но в общем случае в сложном продукте с миллионами строк кода, который пишет десяток разных команд, гарантировать, что заданный кусок бизнес логики, использующий несколько разных компонент, не выделяет память, практически невозможно даже если по смыслу оно не нужно. Кроме того ещё и код используемых сисколлов надо посмотреть, нет ли аллокаций в коде ядра.

И на самом деле есть аргумент посерьёзнее - OOM killer убивает процесс до того, как malloc возвращает 0, легко проверяется на простом примере. Так что все рассуждения о попытках обработать такую ситуацию - только теория.

Нужны ли людям микросхемы?

@unreal_undead2 21 фев 2024 в 06:59

Во-первых, серверные мощности возможно рационально загрузить и включить в работу 24/7. Персональные же компьютеры включены не более 12-16 часов в сутки, а средняя загрузка их процессора исчисляется единицами процентов.

Пока не вижу проблем, перенос вычислений на сервера эффективнее использует ресурсы.

В результате, если всем пользователям в мире для удовлетворения их потребностей на текущий момент нужно совокупно N флопс и M байт

Нет таких констант, есть куча задач, для которых чем больше флопов, тем лучше - как классических (типа прогноза погоды), так и новых (те же LLM). Так что насытить потребности в принципе не получится )

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 21 фев 2024 в 06:50

Да, и что вы называете кастомной реализацией и некастомной?

Отдельная схема под конкретный функционал или общая схема для интепретации микрокода и код в памяти для разных вещей (legacy инструкции, PMU, управление температурой/частотой и прочих не связанных с основной работой штук, которых в современном процессоре пруд пруди).

Если вы хотите фиксировать событие типа выталкивания строки кэша

Фиксация события, конечно, делается на логике. Вопрос в реакции - особенно если хочется записать в буфер в памяти адрес инструкции, адрес данных, в каком конкретно кеше (а может и в TLB) был промах, latency и т.д. Ну или писать в буфер в память полную историю выполнения, по максимуму минимизируя объём данных (типа Intel PT). Верю, что можно описать на верилоге и реализовать отдельным блоком транзисторов - вопрос, стоит ли?

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 21 фев 2024 в 06:38

Вообще вы пробовали сами реализовать какой-нибудь игрушечный процессор с микрокодом и без него?

Нет - так что честно говоря спорю в основном для получения новых знаний )

кастомную реализацию performance counters для GPU

Там возможность семплинга (и соответственно привязки событий к коду) была? Просто счётчик, инкрементирующийся по какому то условию, которое можно получить логической функцией от имеющихся сигналов, конечно проще захардкодить.

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 21 фев 2024 в 06:34

OOM killer может и до них добраться.

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 21 фев 2024 в 06:32

А во время обработки этого запроса точно никаких аллокаций нет?

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 21 фев 2024 в 06:31

оно может освободить само

Только до этого может захотеть что то ещё аллоцировать.

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 20 фев 2024 в 15:04

тезис про "система команд новой архитектуры включает около 2000 уникальных инструкций" для меня выглядит очень сомнительным

В соответствующем enum'е в llvm примерно столько и есть. И, соответственно, есть работающее семейство компиляторов )

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 20 фев 2024 в 14:58

OOM рулетка какая то )

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 20 фев 2024 в 14:48

просто временно не принимать новые соединения

Надеясь что память вдруг появится?

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 20 фев 2024 в 14:46

Ну да, на мой взгляд либо мы аллоцируем всё сразу и дальше никакой динамической аллокации (скажем, в коде управления станками или автомобилем), или забиваем на обработку и при недостатке памяти тихо умираем. Нормально выйти при недостатке памяти из сложного приложения типа браузера - это надо очень сильно постараться, никто столько ресурсов на написание кода не даст.

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 20 фев 2024 в 14:41

Мы же в C++

Тогда, если мы пользуемся им на полную, new и так исключение кинет. Но coding guidelines могут запрещать использование исключений, по крайней мере про одну компанию, где так принято, все знают ) Ну и даже с исключениями в большом продукте с кучей сторонних библиотек не так всё просто.

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 20 фев 2024 в 13:50

опытный программист просто напишет свою глобальную функцию или макрос для выделения памяти и проверки

И что можно сделать в этой общей функции, если проверка не сработала? Разве что exit(MEMORY_EXHAUSTED_CODE)...

Почему проверять результат вызова malloc c помощью assert плохая идея

@unreal_undead2 20 фев 2024 в 13:16

Ну как бы общее правило - assert'ом проверяются инварианты, зависящие только от логики кода, а не от внешних факторов.

Другое дело, что корректная обработка возврата 0 из malloc (или нехватки памяти в общем случае) - нетривиальная задача. Как минимум надо гарантировать, что ничего не аллоцируется в коде обработки и разобраться, как при этом взаимодействуют потоки (потому как если память кончилась, она кончилась у всех).

Игры нашего детства: 8-битные шедевры

@unreal_undead2 20 фев 2024 в 06:28

приставка Sony PS1 вообще ДЛЯ МЕНЯ непривлекательна. Смотреть не на что.

На днях прошёл PCшный порт второго Дума под PS1 (использует ресурсы с CD для приставки) - пожалуй, действительно поатмосфернее оригинала, хотя уровни и наполнение пришлось таки поурезать, всё таки даже до нормального 386го она не дотягивала.

Игры нашего детства: 8-битные шедевры

@unreal_undead2 20 фев 2024 в 06:24

Мне до мая прошлого года вполне хватало ASUS 1015 PEM на Атоме - если бы не помер, идущих на нём непройденных игр хватало ещё лет на несколько.

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 20 фев 2024 в 06:20

Он что, бесплатный?

Естественно нет, вопрос в общем количестве транзисторов на одну схему интерпретации и память кода под разную функциональность или кастомную реализацию на логике каждой новой фичи мониторинга и т.п. Опять же - я не про базовую функциональность процессора по исполнению инструкций.

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 19 фев 2024 в 14:25

Понятно, что без триггеров и сдвиговых регистров процессор не построишь. Вопрос только, стоит ли тратить кастомную логику и транзисторы на каждую фичу, напрямую не связанную с производительностью (выполнением инструкций, постоянно встречающихся в реальном коде) и не дешевле ли вставить интепретатор микрокода? Ну и возможность что-то пофиксить после выхода железяки тоже полезна.

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 19 фев 2024 в 06:32

А сгенерировать прерывание по переполнению счётчика? В случае SPE - ещё и записать в буфер в памяти кучу данных об инструкции (latency, DLA и т.д.) в специальном формате.

Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные

@unreal_undead2 16 фев 2024 в 06:11

И чем вендор-лок на Китай лучше, чем на США?

Для китайских кастомеров, на которых в основном ориентируется Longsoon, разница принципиальная.

1 2 ...

132 133

134

135 136 ...

156 157