AskePit25 фев в 16:03

C++: экономим на спичках

Средний

17 мин

17K

C++ * C *

Кейс

+82

Комментарии 36

AllFiction 25 фев в 16:22

спасибо большое за ваш труд, прочитал статью с огромным удовольствием)

кстати подобное шаманство работает не только в богоподобном си, но и я в других языках просто нужно знать подробности реализации. В том же Go можно структуру в байты напрямую похожим образом, без лишних телодвижений просто используя сам указатель на структуру и тут то важно правильно расположить что бы работало.

AlexeyMartynov 25 фев в 22:47

Есть тонкий момент: до С++23 аккуратно подложены грабельки:

Member access specifiers may affect class layout: the addresses of non-static data members are only guaranteed to increase in order of declaration for the members not separated by an access specifier(until C++11)with the same access(since C++11).
https://en.cppreference.com/w/cpp/language/access.html

Из этого следует, что гарантия последовательного расположения есть только в рамках одной секции. Стало быть, примеры, начиная с упаковки "bool", следует поправить, увеличив количество геттеров и сеттеров, иначе размер может и не получится.

Впрочем, я не знаю ни одного компилятора, который решился бы на подобные переупорядочения.

AskePit 26 фев в 07:32

Ухх, какой подлый нюанс :) Он мне был не известен. Выходит, чтобы теоретически обезапаситься, есть два пути:

Пойти вашим путем и тотально замести все поля под private
Наоборот занести все под public, посыпать "приватные" поля комментариями "НЕ ТРОГАТЬ", а голову посыпать пеплом

Мне вот интересно, если есть компилятор, который пользуется этой лазейкой, то как мог бы выглядеть порядок полей у класса с public и private секцией? public в памяти четные, private - нечетные? :)

Deosis 26 фев в 10:06

Компилятор вполне мог поменять секции местами, чтобы уменьшить паддинг,
либо наоборот, чтобы выровнять размер структуры с размером кеш линии.

mmMike 26 фев в 03:25

имеет следующее расположение полей в памяти:
..
Итого — структура занимает 40 байт

А вот нифига. В некоторых аппаратных платформах структуры выравниваются ВСЕГДА на 4 байта. Включая bool. Так что попытка записать структуру из C/C++ кода на диск (как область памяти по указателю и sizeof(..)) на одной платформе и прочитать ее в память "как есть" (наивный подход) на другой платформе приведет к проблемам. Плавали... знаем. Ща поменьше стало (sparc RIP), но все равно мир не заканчивается x86.

Так что, упаковка/распаковка данных из локального формата перед запись/чтением куда либо (диск, БД) - это вообще стандарт (должно быть).

Ладно игра... А когда в WAL Postgre все данные выровнены на границу 4-х байт (понятно конечно откуда ноги растут) и даже на первый взгляд можно получить упаковкой экономию размера файлов от 1-15% (зависит от структуры/формата полей таблиц. Меньше прикладные данные - больше экономия на заголовках в процентах)
И все ради "а побыстрее обрабатывать" (наверное)?
Opensource ПО блин. И сейчас на PG огромные системы пытаются переносить. А по факту разработчиков основных PG можно по пальцем рук пересчитать.
И банально некогда им оптимизировать.

unreal_undead2 26 фев в 06:33

Статья всё таки про эффективное использование памяти и кешей, а не про сериализацию. Так то надо помнить, что размер int не фиксирован, big endian никуда не делся и т.д.

mmMike 26 фев в 06:38

да. Скорее всего ОЗУ. Но это явно нигде не сказано и та же проблема касается сохранения на диске.

ZvoogHub 26 фев в 06:42

Doom из прошлого века, который сейчас запускают даже на принтерах, хранит ресурсы в файле wad. Это zip-подобный архив.

Почему в архиве? Потому что в прошлом веке жёсткие диски были очень медленные. Операция

прочитать маленький файл с медленного диска
распаковать его в большой в памяти

была быстрее чем сразу прочитать несжатые ресурсы с диска во время игры.

Возможно и в задаче из статьи использование любого агоритма сжатия будет гораздо эффективней.

LAutour 26 фев в 10:37

Есть еще причина хранить ресурсы из большой кучи файлов в собственном файлом контейнере: из-за того отдельные файлы занимают на диске объем всегда кратный размеру кластера\сектора файловой системы.

alliumnsk 26 фев в 19:00

Вы этот файл в хекс вьюере открывали хоть раз? Он не сжатый. У версии 1.9 около 11 Мб, zip сжимает до 4.5 Мб. Дум запускался довольно долго. Главный эффект был в экономии места на жестком диске из-за того, что не было в дос файловых систем, эффективно работающих с большим числом мелких файлов (текстуры были 64х64 (!))

AskePit 26 фев в 07:56

Я прикрылся параграфом "Дисклеймеры, оговорки" :) Но в целом согласен - зоопарк возможных платформ бесконечен, поэтому ничего точного в абсолюте быть не может. Но это тем не менее не мешает людям рассуждать о порядке полей, padding и пытаться уменьшить свои структуры.

Я даже какое-то время поддерживал пропиетарный компилятор, где char был равен машинному слову, потому что почему бы нет, поэтому не понаслышке знаю, что все действительно возможно.

Ну а читать/писать сырые данные между платформами - это совсем иная история, статья не про это, тут надо писать отдельную. И ее лучше писать вам :) у вас, кажется, обширный опыт в этой теме. Я могу козырнуть лишь #pragma pack, но подозреваю, что это не панацея. Особенно если еще есть разница LE/BE

unreal_undead2 26 фев в 08:50

#pragma pack нужен скорее чтобы иметь стабильное ABI, когда структуры фигурируют в интерфейсе; для записи в файл (особенно переносимый между платформами) всё равно недостаточно.

AskePit 26 фев в 08:58

UPD: я посчитал, что статья была бы неполной, если не привести известные мне способы увидеть глазами memory layout интересующей нас структуры. Заинтересованным читать главу "Appendix I. Узнаем memory layout".

Буду рад, если вы поделитесь своими способами - хорошими, плохими, злыми - любые подойдут.

VBDUnit 26 фев в 09:00

Получил огромное удовольствие, спасибо!

Сам сталкивался с подобной проблемой когда в C# делал универсальную структуру для хранения векторов и скаляров. Структура имела размер 64 байта и должна была хранить длину вектора, тип элементов и сами значения. Проблема возникла с типом decmial, который весит 16 байт и в количестве 4 штуки занимает всё место.

Выкрутился так

Поля с размером и типом впихнул в 1 байт и разместил его там, где у decimal всегда нули. Да, у этого типа реально некоторые биты ВСЕГДА равны нулю. После этого извратил хранение длины и типа так, чтобы при длине 4 и типе decimal этот байт был всегда равен нулям. Профит: при хранении других типов (которые 8 байт и меньше) данные до туда не доходят из‑за ограничений по длине, а при четырёх decimal хранение данных, длины и типа в одном месте не противоречат друг другу.

AskePit 26 фев в 09:12

достойные извороты) прятать информацию в чужих битах - самое приятное

devoln 26 фев в 10:44

Не понял, откуда гарантия, что младшие биты свободны? Указатель же void*, значит не подразумевает никакого выравнивания данных. По указателю может храниться например строка или бинарный массив, не выровненный на 4 байта. А то, что сам указатель в структуре выравнивается, к этому вообще отношения не имеет.

По поводу битовых полей не понимаю, зачем их избегать. Вроде они везде одинаково работают кроме big/little-endian. Я проверял в compiler explorer на распространённых платформах и всех основных компиляторах. Кажется, только были какие-то нюансы между big и little-endian, но лучше их учесть, чем городить портянку с private и геттерами-сеттерами.

А для сериализации можно завести тип с перевёрнутым порядком байт для big-endian архитектур, не переворачивая для little-endian. Назвать типа uint32LE/uint16LE. Тогда можно будет просто писать структуры на диск.

Rio 26 фев в 11:49

>По поводу битовых полей не понимаю, зачем их избегать

Кроме BE/LE там достаточно своих приколов. Приведу пример из жизни.

Оказалось, что один проект несколько лет работал неверно, не сообщал об ошибке, когда надо было. Когда это обнаружили, не сразу поняли, в чём прикол.

#define ERR_CODE_CRITICAL (1 << 3)
...
data.result = ERR_CODE_CRITICAL;

Вот примерно так в поле структуры записывался код результата. Но внезапно оказывалось, что в поле result после этой записи — 0 (код для ERR_CODE_OK) вместо ожидаемого кода ошибки. Почему?

А потому что автор изначального кода отвёл на поле result всего один бит, описав его так:

typedef struct {
    ...
    int32_t result: 1;
} DATA;

Кодов тогда было всего два, ноль и один, оно работало как задумывалось.

А потом в какой-то момент кто-то решил добавить других значений, и всё сломалось.

Компилятор ошибками не ругался (инт в инт пишется же, всё окей), и никто ничего не заметил.

И вот сидишь ты в отладке, смотришь на этот код, наводишь курсор на поле result, тебе IDE услужливо подсказывает: тип int32_t, всё окей! Шаг делаешь, туда восьмёрка пишется, а получается 0. Магия! )

Т.е. чтобы изначально врубиться, что в этой строке может быть косяк, нужно непременно полезть в описание структуры и вручную глазами смотреть, что за поле такое, и как объявлено. Отличная фича для стрельбы себе в ногу, в общем.

Ooaoo 26 фев в 12:07

ну извините, тут явно не проблема в битовых полях) Просто ошибка. А так ничего не мешает вместо 8 булов сделать структуру из 8 1 битовых плей и при необходимости приводить ее к чару или банальный юнион с уинт8 и структурой 1 битовых полей использовать.

Rio 26 фев в 12:30

"Просто ошибка" — это когда можно просто посмотреть на код и увидеть, что там ошибка. А здесь — нельзя просто посмотреть на код и увидеть, что там ошибка. Можно столкнуться случайно, когда уже поздно (что и произошло).

Ooaoo 26 фев в 12:48

Сталкивался я однажды с кодом, где были переменные вида _fpressure, _fPressure,fpressure,fPressure и все 4 они в разные моменты времени могли либо приравниваться между собой либо использованы в промежуточных расчетах. Там так же много лет была ошибка ибо в одном месте стояла не та переменная. Вот вроде можно просто посмотреть и увидеть, а вроде много лет смотрели разные люди этот код и никто не видел, ну плевались что то вроде какой дурак так написал, но никто не переделывал, работает же. Так же и в вашем примере. Один человек выделил 1 бит, другой не посмотрел и вылез за пределы. Но это не означает что битовые поля это неудобно или что они могу работать как то не так. Их можно как то не так использовать, это да.

Rio 26 фев в 13:32

Так никто и не говорит, что битовые поля это неудобно. Удобно. Но там, где нужно максимально надёжный и портабельный код иметь (а проблем с ним — не иметь), лучше их не юзать вовсе. У нас в конторе мы их вообще запретили, из-за специфики. Самолёты прогаем, код должен на куче разных архитектур работать, с разной разрядностью и разным порядком байтов, причём вперемешку (а в протоколах ой как хочется, бывает, битовые поля заюзать). Но многолетнаяя практика показала, что это в итоге выливается в боль. А мы не хотим страдать, хотим новые крутые фичи пилить, а не внезапно всплывающие старые баги отлаживать )

>а вроде много лет смотрели разные люди этот код и никто не видел

Судя по описанию, просто не вчитывались, потому что код страшненький был, это обычное дело. А в приведённом мной случае — код простой и читаемый, от которого не ждёшь подвоха.

AskePit 26 фев в 14:49

Мы так же от них отказались - есть опасения за совместимость с версиями игры под консоли

vanxant 26 фев в 13:13

Поддержу комментатора выше, битовые поля для отдельных битов вполне безопасны. Проблемы начинаются с переносом многобитных полей между BE/LE платформами.

ImagineTables 26 фев в 14:56

inline bool PersonInfo::isMarried() const { return getFlag(IsMarriedMask); }
inline bool PersonInfo::hasDrivingLicense() const { return getFlag(HasDrivingLicenseMask); }
inline bool PersonInfo::isRemoteWorker() const { return getFlag(IsRemoteWorkerMask); }
inline bool PersonInfo::hasChildren() const { return getFlag(HasChildrenMask); }
inline bool PersonInfo::ownsHouse() const { return getFlag(OwnsHouseMask); }
inline bool PersonInfo::isSmoker() const { return getFlag(IsSmokerMask); }
inline bool PersonInfo::isShareholder() const { return getFlag(IsShareholderMask); }
inline bool PersonInfo::isAvailable() const { return getFlag(IsAvailableMask); }
inline void PersonInfo::setIsMarried(bool val) { return setFlag(IsMarriedMask, val); }

inline void PersonInfo::setHasDrivingLicense(bool val) { return setFlag(HasDrivingLicenseMask, val); }
inline void PersonInfo::setIsRemoteWorker(bool val) { return setFlag(IsRemoteWorkerMask, val); }
inline void PersonInfo::setHasChildren(bool val) { return setFlag(HasChildrenMask, val); }
inline void PersonInfo::setOwnsHouse(bool val) { return setFlag(OwnsHouseMask, val); }
inline void PersonInfo::setIsSmoker(bool val) { return setFlag(IsSmokerMask, val); }
inline void PersonInfo::setIsShareholder(bool val) { return setFlag(IsShareholderMask, val); }
inline void PersonInfo::setIsAvailable(bool val) { return setFlag(IsAvailableMask, val); }

А вот как писали на языке Си 30 или даже 40 лет назад (я так долго на нём не программировал, и не могу точно сказать, когда сформировался этот подход):

HPERSON hPerson1 = CreatePerson(30, "Jane", PI_MARRIED | PI_SMOKER | PI_OWNS_HOUSE);
HPERSON hPerson2 = CreatePerson(35, "John", PI_HAS_DRIVING_LICENCE | PI_SHAREHOLDER);

Ну, или более развёрнуто:

DWORD dwPersonInfo1 = PI_MARRIED | PI_SMOKER | PI_OWNS_HOUSE;

struct tagPerson
{
…
    DWORD dwPersonInfo;
}

Я большУю часть жизни посвятил программированию под WinAPI, которая из такого кода состояла чуть менее, чем полностью, и знаете что? НИ РАЗУ не видел бага, связанного с тем, что значения присваивались в обход сеттеров. Обычно, баги возникали, когда с указателями кто-нибудь напорет, но от этого сеттеры не спасают. Только запрет адресной арифметики.

unC0Rr 27 фев в 08:59

НИ РАЗУ не видел бага, связанного с тем, что значения присваивались в обход сеттеров.

В Си обычно возникают баги, когда используют похожий по смыслу флаг из другой предметной области, что компилятор не может отловить, т.к. тип у них у всех одинаковый. Использование сеттеров, включающих в сигнатуру тип структуры, в Си или обёртки над флагами в Си++ решают эту проблему

ImagineTables 1 мар в 13:20

Да, теоретически можно перепутать, но работает-то такой код не так, как ожидается, и это видно сразу. Например, засунули вы WS_EX_TOOLWINDOW в dwStyle, компилятор промолчал, а заголовок остался обычным. С тем же успехом (и даже с гораздо большим) можно перепутать поля при написании этих бойлерплейтных простыней.

(Я взял пример из реальной жизни, потому что писать выборку курящих сотрудников в коде на Си — сомнительная идея. Контрпримеры, т.е. примеры ошибок, которые могут пролезть в кодовую базу незаметными и там поселиться, приветствуются, но только из реальной жизни).

Если уж на то пошло, можно генерировать интерфейс (аксессоры/мутаторы) препроцессором. А ещё лучше использовать простой советский дизъюнктор — это не тот тип багов, ради которого стоит раздувать код во много раз (что, ещё раз, само по себе может служить источником багов).

gxcreator 26 фев в 15:10

Для такого есть очень полезная фича в GDB, включая вложенные структуры:

(gdb) ptype/o struct __locale_data
/* offset    |  size */  type = struct __locale_data {
/*    0      |     8 */    const char *name;
/*    8      |     8 */    const char *filedata;
/*   16      |     8 */    off_t filesize;
/*   24      |     4 */    enum {ld_malloced, ld_mapped, ld_archive} alloc;
/* XXX  4-byte hole  */
/*   32      |    16 */    struct {
/*   32      |     8 */        void (*cleanup)(struct __locale_data *);
/*   40      |     8 */        union {
/*                 8 */            void *data;
/*                 8 */            struct lc_time_data *time;
/*                 8 */            const struct gconv_fcts *ctype;

                                   /* total size (bytes):    8 */
                               };

                               /* total size (bytes):   16 */
                           } private;
/*   48      |     4 */    unsigned int usage_count;
/*   52      |     4 */    int use_translit;
/*   56      |     4 */    unsigned int nstrings;
/* XXX  4-byte hole  */
/*   64      |     0 */    union locale_data_value values[];

                           /* total size (bytes):   64 */
                         }

AskePit 26 фев в 15:17

шикарно, спасибо!

schulzr 27 фев в 01:19

еще есть pahole, особенно полезен для структур с наследованием.
https://pramodkumbhar.com/2023/11/pahole-to-analyz-data-structure-memory-layouts-with-ease/

nomhoi 26 фев в 15:32

12 байт: https://share.google/aimode/A61IM6zHTSexxFArS

AskePit 26 фев в 15:50

Даже не знаю, как реагировать. Давайте смотреть, что предложил этот ИИ:

Если вы хотите оставить массив структур (AoS), можно упаковать возраст, роль и ID в одно целое число.

В итоге в предложенном коде возраст, роль и ID упакованы в одно целое число не были. Уже весело.

Теперь к заявленным 12 байтам:

Вместо 8-байтного указателя на roleData (void* / variant), используйте 4-байтный индекс в отдельном массиве с данными ролей

То есть ИИ унесла часть данных неизвестно куда из структуры и даже не объяснила, куда конкретно, и как это будет работать для каждого сотрудника, и почему суммарная память (вместе с мифическим массивом) будет меньше того, что было

То, что размер структуры можно уменьшить еще больше - это 100%. Но то, что вы кинули называется AI-слопом.

wslc 26 фев в 23:53

Мне кажется, вы зря так отмахиваетесь: тяжело представить, что ролей больше 4 млрд, если ид меньше 65к. И вполне возможно, что их можно разместить в непрерывно или блоками. Как указали выше, вы тоже делаете предположение, про выравнивание объекта по указателю, что совсем необязательно

nomhoi 27 фев в 13:58

Вот вам еще нейрослопов: https://share.google/aimode/6FVm13aMzW4yhPa8V

Tencix 5 мар в 08:38

Так можно было для bool-полей использовать битовые поля? bool b : 1; можно так сделать со всеми флагами и всё, я так написал структуру для хранения изменения текста.

AskePit 6 мар в 09:22

у вас статья не дочитана

Kandimus 10 мар в 15:46

В играх просто используют fixed point числа. Т.е., при передаче, домножают на 100 и отправляют только целую часть, при приёме - получают целую и делят на 100. Если точность не нужна то можно в качестве множителя взять 10. Дальше, сериализуют нужное количество бит полученного числа. Вот и вся магия.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий