dzavalishin Apr 8 2016 at 11:49

Сборка мусора в персистентной модели: от терабайта и дальше

5 min

12K

Compilers*System Programming*

+37

Comments 26

UFO landed and left these words here

Amomum Apr 8 2016 at 13:52

И mutex на каждое считывание поля объекта не поставишь — тогда машина из такого мьютекса вылезать не будет, только и будет что запирать его и отпирать. Даже спинлок приведёт к кратному, в разы замедлению кода.

Почему бы не сделать счетчик атомарным?

ZyXI Apr 8 2016 at 17:57

А смысл? Проблема не в инкременте, проблема в том, что объект будет уничтожен до инкремента, но после возникновения новой ссылки. Атомарность счётчика на такую возможность никак не влияет.

Ruslan_r Apr 8 2016 at 13:59

Мне понравилась идея персистентной ОС, но я очень много не понимаю, а очень хочется. Может вам нужно сделать что-то вроде карты модулей и объектов в виде UML схемы. Это повысит порог вхождения в вашу ОС и привлечение новых людей. Ведь не обязательно понимать полностью как устроена и работает вся ОС, может кого-то заинтересует отдельная подсистема и человек будет работать над ней.

UFO landed and left these words here

dzavalishin Apr 8 2016 at 20:41

Было бы здорово, но сделать это небанально.
Если есть знаток того, как работают mem mapped files при fork, приглашаю в соучастники такой разработки. Это, видимо, единственный путь.

jcmvbkbc Apr 9 2016 at 13:07

как работают mem mapped files при fork

Мэппинг просто шарится между процессами.

uvelichitel Apr 9 2016 at 11:20

Очевидно, что такой среде нужна сборка мусора.

Не всем очевидно. Машина Тьюринга работает на бесконечной ленте и ни мусора ни его уборки не предполагает. Персистентная модель также крайне привлекает возможностью бескрайнего undo во всех его смыслах, что тоже не рифмуется с идеей мусора.

dzavalishin Apr 20 2016 at 14:41

Всё верно.
Дайте мне бесконечный диск и бесконечное адресное пространство. :)

Насчёт undo — сборка мусора не противоречит. Снапшоты можно хранить и откатываться к ним.

WowaBBS Apr 9 2016 at 11:43

object *b_ptr = a[xx];
b_ptr->ref_count++; — В этом случае то что передался указатель на объект, у которого счётчик ссылок уже нул уже является ошибкой.

ZyXI Apr 9 2016 at 14:02

Где вы в статьё нашли «передачу указатель на объект с нулевым счётчиком ссылок»? Там прямо написано: сначала передали нормальный объект, а не мусор с нулевым счётчиком. Потом в другом потоке счётчик был обнулён.

К примеру, у вас есть асинхронный словарь с кэшем. В одном из использующих кэш потоков из словаря уже взяли объект, но ещё не увеличили счётчик. А в другом произошло событие, из‐за которого кэш нужно очистить. Система решила переключится на другой до ref_count++ и выполняла его вплоть до ref_count--. Получился объект, на который ссылаются, но с нулевым счётчиком. При этом, когда его получали, всё было нормально.

0serg Apr 10 2016 at 09:53

У Вас со счетчиком ссылок проблема потому что Вы нарушаете идиому владения. Создавать копии ссылок на объект может только тот кто этим объектом владеет. В многопоточной системе каждый тред должен получать владение независимо, если треду А нужен объект которым владеет тред Б, то его обязательно необходимо запрашивать у треда Б через один из механизмов синхронизации.

Если сам счетчик ссылок на объект по какой-то причине не умирает вместе с объектом а остается нулем, то можно еще атомарный CAS использовать.

UFO landed and left these words here

0serg Apr 11 2016 at 14:23

В варианте когда указатель может протухнуть в любой момент такой код работать не будет. Он базируется на том что объект просто не умирает в течении некоего времени когда с ним возможна работа. Тот кто объект в конце подчищает уже после смерти потоков — тот и «владелец» объекта. Синхронизация обычно в таком коде сводится к тому что этот владелец ждет пока помрут потоки которые могут с объектом работать.

А вообще mutex можно рассматривать как частный вариант идиомы владения. Взятие мьютекса соответствует взятию на себя «владения» ресурсом.

UFO landed and left these words here

sebres Apr 12 2016 at 14:28

Реф-каунтинг вообще штука капризная.
Взять для примера те же цикличные или кольцевые ссылки (буде таковые разрешены) — как только граф где-то замкнулся в кольцо, мы имеем для всех объектов в том кольце (и соответственно других "деток" всех этих объектов рекурсивно) значение ref_count отличное от 0, и что особенно весело — навсегда (если не принимать меры). Самая красота начинается если где-то пересекаются два и более таких графа.
Т.е. иногда просто невозможно установить — это leak как он есть или просто "долгоиграющая" кольцевая последовательность.

Ну и если тупо повыкидывать сами ссылки довольно несложно ("рекурсивно" с защитой от бесконечного цикла или принудительным декрементом после разрыва кольца), то сделать это "правильно" в случае наличия какой-нибудь привязанной логики типа "деструкторов" и т.п. уже совсем не просто — ибо нередко играют роль уже совершенно другие факторы, например последовательность "освобождения" (тот же вызов "деструктора" и т.д.).

И это только один пример, что называется навскидку, а тех граблей в теме реф-каунтинга и без атомарности хоть отбавляй...

UFO landed and left these words here

sebres Apr 12 2016 at 19:14

Вот враз видно человека не совсем в теме:

дано тупо два "объекта": наш A и какой-то B данный нам снаружи, надо добавить B в "дочки" нашему A, соответственно проинкементив его B->ref_count;
как не зная B (или всех "дочерних" связей B) исключить ситуацию (которая якобы "на нашей совести"), что у B уже есть какой-то "дочерний" X, для которого уже существует reference к A?
Т.е. не зная полностью B (что часто именно так) случайно не замкнуть кольцо?

Я уж не говорю про то, что даже полностью зная B со всеми "детками" его, это часто в принципе не реально, ибо:

на этом этапе запрещена "итерация" по B;
на этом этапе запрещена "итерация" по какому-либо "потомку" от B, т.к. может привести к неожиданному результату, находится в состоянии одномоментного изменения (например ротация дерева хэш-таблицы) или находится в состоянии деструкции и т.д. и т.п.;
итерация по детям предполагает смену или блокировку нитей (тупо запирание контекста, т.е. возможен deadlock, нежелательное распараллеливание потоков, и т.п. радости);
сводит на нет всю прелесть реф-каунтинга, ибо такая проверка — тупо очень долгая операция (т.е. по длительности и сложности не сопоставима с предполагаемой "атомарность" реф-каунтинга);

Исключение конечно составляют частные случаи, когда A->ref_count == 0 (т.е. объект A реально нигде еще не референсирован, соответственно кольцо исключено), но такое на практике на самом деле очень и очень редко (т.е. грубо говоря "конструктор" и иже с ним)… Ну или B "примитивен" сам по себе, т.е. в принципе не может "владеть" другими объектами (не имеет "детей"), что хотя и не редкость, но лишь чуть-чуть улучшает ситуацию описанную выше.

Если бы все просто было бы с реф-каунтингом в чистом его виде, люди не напридумывали бы нестрогие или невладеющие (weak) references, умный указатели (типа smart, shared или intrusive pointers), тот же GC и так далее и тому подобное.

UFO landed and left these words here

dzavalishin Apr 20 2016 at 14:44

В принципе, weak пойнтеры и в обычных GC средах бывают нужны.

dzavalishin Apr 20 2016 at 14:43

Поэтому рефкаунт — не единственный механизм, а только быстрый и «грязный».

sebres Apr 20 2016 at 16:25

Ну про "быстрый" я согласен сразу… А вот про "грязный"… Как бы выразиться, каждому дереву — свой садовник (или тут поговорка про фломастеры)… Я к тому, что если оно оправдано, то и хорошо...

dzavalishin Apr 20 2016 at 16:34

Ну, рефкаунт per se никак не умеет собирать циклы, как его ни поливай и не удобряй.
Правда, вроде бы, есть наработки на тему loop break, но это уже не чистый рефкаунт.

sebres Apr 20 2016 at 18:09

В качестве примера приведу рефкаунтинг в тикле (tcl) — он там по случаю самодостаточен (в том смысле, что GC в чистом тикле в его прямом виде нет, от слова вовсе).

Так вот техника проста до безобразия:

если кольцо исключено (у "связуемого" нет родителей или он "простейший", т.е. нет деток, или исключено согласно "бизнес"-логики) — имеем прямой рефкаунтинг.
иначе, либо простейший слабый указатель (если допустимо) ибо тикль имеет собственный mem-manager (не путать с GC).
либо банально вяжем дубликат от "связуемого" (т.к. тогда еще нет родителей, ибо refCount у свежесозданного дубликата соответственно равен 0 и действие однозначно не может замкнуть кольцо), и это часто возможно т.к. почти-что все объекты умеют или разрешают refCount-safe duplicate и опять же тикль имеет свой mem-manager (т.е. "duplicate" действие быстрое).
если все же оба варианта искючены — бросает ошибку ~~can't duplicate, no reference posible~~ "не можу, от слова совсем"

И таких или подобных примеров — валом. Поэтому, имхо, имеет право на жизнь…

Вообще имхо самый идеальный "GC" (в глобальном смысле), это тот который комбинирует все подходы и как можно меньше работает "в чистую" как GC (в прямом его смысле), т.е. как можно меньше объектов доходят до уровня и ложатся в garbage collection (т.е. собственно "отфильтровываются" другими "техниками").

shabanovd Apr 20 2016 at 20:21

А можно ли делать GC во время снапшотах или это так уже и есть?

фактически уничтожать объект только после того, как все нити всех виртуальных машин прошли границу инструкции виртуальной машины. Это гарантирует, что все декременты и инкременты закончились. Механизм для этого есть, он уже используется при снапшотах.

Это позволит очищать память как побочный эффект иного механизма сканирования памяти. Т.е. нужно будет разрулить только циклические ссылки.

dzavalishin Apr 22 2016 at 08:01

В снапшоте нет сканирования памяти. (Все изменения фиксируются подсистемой виртуальной памяти процессора). Но делать уничтожение объектов, у которых refcount == 0 — можно, потому что в снапшоте все виртуальные машины точно на границе инструкции.