degs 22 ноя 2016 в 02:53

Разделяемые указатели и многопоточность. И снова о них, в который раз

9 мин

25K

Программирование*C++*Алгоритмы*

+26

Комментарии 52

НЛО прилетело и опубликовало эту надпись здесь

oYASo 22 ноя 2016 в 03:27

Спорить тут, в общем-то, не получится, потому что так оно и есть. В новом стандарте обещали запилить atomic_shared_ptr.

degs 22 ноя 2016 в 03:40

В новом это в котором? Это не вот это?: /usr/include/c++/5.4.0/bits/shared_ptr_atomic.h
Но он к сожалкнию блокирующий, маленькое лукавство — atomic не обязательно подразумевает non blocking.

Duduka 22 ноя 2016 в 09:28

Это не лукавство, а разумность: с ростом конкуренции блокировки выигрывают у неблокирующих. Если пишешь на non blocking библиотеках, то должен учитывать, что с масштабированием есть небольшие проблемы, нужно оптимизировать приложения, уменьшая вероятность захвата ресурса.

RPG18 22 ноя 2016 в 11:39

Если в системе много ядер, и куча потоков обращаются к атомарной переменной, то происходит блокировка на уровне инструкций процессора. Чуть более подробно в Современная операционная система: что надо знать разработчику

oYASo 23 ноя 2016 в 02:15

Нет, не этот. По ссылке же черновик еще, в текущий компиляторах искать бесполезно. Я даже не уверен, что он появится в С++17, скорее на дальнюю перспективу.

thatsme 22 ноя 2016 в 09:37

>> Ну, это не наш путь, на мьютексах я и сам могу
А в чём проблема с мьютексами? Почему нужно без них? Это требование ТЗ, или желание в многопоточном приложении иметь 100% неблокируемый код? Если второе, то это невозможно при разделяемых объектах, и скорее относится к религиозному чем к рациональному.

degs 22 ноя 2016 в 15:39

Постановку задачи я в самом начале описал, и проблема вполне реальная. Я уже измерял когда-то, каждая блокировка на мьютексе занимает 40 микросекунд. Вот в тех нечастых случаях когда это время критично и требуются неблокирующие алгоритмы.

Antervis 22 ноя 2016 в 10:01

Майерс в «Эффективном и современном с++» упоминал, что операции со счетчиками атомарны.
Вот вы исследовали реализацию gcc, а что по поводу потокобезопасности разделенного указателя говорит стандарт?

iperov 22 ноя 2016 в 11:55

Давно замутил свои умные ссылки, которые легко расширять и имеют кучу преимуществ, а вы дальше обсасывайте версии стандартной библиотеки.

-9

mayorovp 22 ноя 2016 в 12:33

И часто вы их расширяете? :)

semenyakinVS 22 ноя 2016 в 14:06

Я сам когда-то таким занимался — делал свои умные указатели с poly-based дизайном (для настройки всяких вещей вроде политик владения, многопоточности, источников привязываемых объектов, и т.д.). Даже статью на хабру писал по теме… Но понял в какой-то момент, что мои реализации работают намного хуже стандартных. Выбросил свои реализации, превратив уже сделанные классы в template-врапперы над классами из stl. Работа не совсем напрасная — теперь я могу подменять реализации, если случится чудо и кто-то сделает лучше чем stl — но неприятный осадок остался.

Если ваши указатели действительно лучше стандартных указателей — напишите статью, интересно будет почитать. Только не забудьте привести доказательства преимуществ вашего решения по каким-нибудь метрикам (быстродействие, расход памяти, удобство использования, и т.д.).

iperov 22 ноя 2016 в 14:36

это ненужная борьба, все кому не нравится C++ давно сделали свои ЯП

-5

fgengine 22 ноя 2016 в 15:40

А может напишите статью о вашей реализации или поделитесь исходниками?

vidyacat 22 ноя 2016 в 20:49

на словах ты дональд кнут…

hdfan2 23 ноя 2016 в 07:45

… а на деле — простой пряник.

Readme 22 ноя 2016 в 18:14

Тема неблокирующих контейнеров и алгоритмов (абстракций уровня более высокого, чем std::atomic<> и их интерефейса) сложная и интересная, более того, в настоящий момент ведутся активные исследования на эту тему (пишутся диссертации (!), берутся патенты и т.д.). Настоятельно рекомендую автору познакомиться с замечательной книгой C++ Concurrency in Action — Practical Multithreading Э. Уильямса (в русском переводе: Параллельное программирование на С++ в действии. Практика разработки многопоточных программ). Главы 4-7 весьма сложны для понимания, но в них рассматривается модель памяти нового стандарта и некоторые рецепты, как с её помощью и с новыми примитивами можно строить lock-free структуры. Также в книге детально разобрано поэтапное построение lock-free очереди, из которого можно извлечь весьма ценные уроки работы с CAS и вообще atomic'ами (как, например, одновременное измененние структуры наподобие указатель-счётчик (или как без этого можно обойтись), что, уверен, автору будет особенно интересно).

degs 22 ноя 2016 в 18:21

Спасибо за настоятельную рекомендацию, только что вас заставляет думать что я ее не читал?
И, да, мне действительно было интересно и полезно, но уже довольно давно, поскольку книга вышла в 2012

Readme 22 ноя 2016 в 18:53

Меня смутила некоторая категоричность выводов статьи. Действительно, если пользователи каким бы то ни было образом получили доступ к raw-указателю (под капотом ли он shared_ptr или нет) — да, никакая сила не спасёт многопоточную среду от гонки. Но, например, в озвученной книге довольно часто обращалось внимание на тот факт, что для достижения lock-free зачастую приходится чем-то жертвовать, что в реализации выливалось в использование proxy-классов возврата или идиомы «создать-и-обменять» (что близко к понятию транзакций). Если абстрагироваться от святого желания сделать shared_ptr таким же быстрым, как и raw-указатели, думаю, с использованием сложных proxy и, возможно, в будущем transactional memory (если появится и войдёт в стандарт) или её эмуляцией в текущих реалиях стандарта, реализовать lock_free shared_ptr всё-таки возможно.

Readme 22 ноя 2016 в 19:01

… хотя тут надо не запутаться в пресловутом lock-free — что и где мы считаем свободным от блокировок. А то может сложиться впечатление, что простая обёртка в такой atomic_shared_ptr любого контейнера сделает его и весь его интерефейс lock-free.

degs 22 ноя 2016 в 19:06

Ну наверное вы в чем-то правы, но вообще пост не о lock-free — просто попытка разобраться из любопытства что именно мешает std::shared_ptr<> быть thread safe. Тема неблокирующих алгоритмов возникает фактически только потому что атомарные операции там уже присутствуют при работе со счетчиком.

Readme 22 ноя 2016 в 19:20

Да, прошу прощения, унесло немного не туда :)
К вопросу о thread-safe текущей реализации — думаю, в свете упомянутого, цена такого решения в виде громоподобно хрустящих compare_exchange под капотом не совсем соотносится с возможным выигрышем от всей этой кухни, поэтому комитету (и пользователям) было и будет проще пока что довольствоваться блокирующим доступом и специализациями std::atomic_xxx(shared_ptr<...>) или собственноручно добавленным мьютексом/спинлоком, благо в стандарте чётко оговаривается этот момент (мол, «шарьте, но не один указатель»).

degs 22 ноя 2016 в 20:17

compare_swap был и остается единственным условным атомарным оператором, без него вам ни одого нетривиального алгоритма не создать. Да, он сразу же переводит алгоритм в класс waiting, но как правило это не фатально, те же виртуальные функции вовсю используются в реализации.
Вообще, я препочитаю стандарты не обсуждать а понимать. В часности при создании std::shared_ptr был выбран очевидный баланс между тяжеловесностью реализации и универсальностью.

degs 22 ноя 2016 в 18:20

ошибся веткой

tgz 22 ноя 2016 в 22:11

Как хорошо что есть rust…

degs 22 ноя 2016 в 22:41

Я рад что вам хорошо, но радуетесь вы зря. Так или иначе, во всех языках есть подобные конструкции и под капотом они устроены примерно одинаково. Так что если вас полностью устраивает то что вы имеете, вам просто не нужно максимальной эффективности или вы просто не копали глубоко.

tgz 23 ноя 2016 в 08:54

Ну как минимум через пару лет там не появится еще один atomic_uniq_shared_locked_fast_super_auto_ptr.

DarkEld3r 23 ноя 2016 в 12:56

Правильно я понимаю, что проблема только в названии? Какой-нибудь Arc<Mutex<Box<_>>> будет (сильно) лучше?

Если что мне весьма нравится раст, но именно эта претензия не понятна.

tgz 24 ноя 2016 в 11:23

Конечно сильно. Arc, Mutex и Box я могу использовать (или не использовать) в любом порядке с любой вложенностью. Ну и не надо ждать 15 лет выхода очередного стандарта что бы что-то новое появилось в компиляторе.
Ничего не поделать, legacy всегда начинает убивать монстров. И это правильно.

DarkEld3r 24 ноя 2016 в 12:47

Arc, Mutex и Box я могу использовать (или не использовать) в любом порядке с любой вложенностью.

Это удобно, не спорю.

Ну и не надо ждать 15 лет выхода очередного стандарта что бы что-то новое появилось в компиляторе.

У раста, конечно, частые релизы, но это ничего не гарантирует в плане добавления нужной фичи, если о ней не смогли договориться. А библиотеки и для плюсов имеются, так что не вижу никакой разницы.

semenyakinVS 23 ноя 2016 в 14:19

Вот как раз чтобы избежать такого, в плюсах есть традиция использовать policy-based design и typedef для стандартных специализаций подобных шаблонов (ну, и ещё auto для ленивых — хотя я лично отношусь к нему отвращением).

-1

degs 23 ноя 2016 в 15:29

М-да? А если будет придуман новый алгоритм, лучший во всех отношениях, и в расте он не появится? Это хорошо или наоборот плохо?

Antervis 24 ноя 2016 в 05:50

для яп еще никто (и хорошо) не вводит копирайты на алгоритмы. Появится наилучшая реализация из возможных? — она будет использоваться везде

Door 23 ноя 2016 в 00:21

Да, нужно использовать atomic-операции для свапа: C++ 11 std::atomic_...<std::shared_ptr>

mayorovp 23 ноя 2016 в 11:15

Вот так комбинация атомарного инкремента и атомарного декремента приводит к гонке между потоками и std::shared_ptr<> не является потокобезопасным, даже на уровне контрольного блока. Вот теперь действительно точка.

Когда говорят, что shared_ptr потокобезопасен на уровне контрольного блока, имеют в виду другой сценарий — а именно, два неразделяемых указателя, принадлежащие разным потокам, могут безопасно указывать на общий объект

degs 23 ноя 2016 в 15:26

Согласен, я в общем и пытался продемонстрировать что имеется ввиду в этом утверждении.
Но, кстати, ваша формулировка тоже неоднозначна, что значит "могут безопасно указывать"?

mayorovp 23 ноя 2016 в 15:34

Не забудут вызвать деструктор и не вызовут его два раза либо раньше времени.

encyclopedist 24 ноя 2016 в 02:59

возможно тогда "разделяемых"?

mayorovp 24 ноя 2016 в 06:06

Как раз для разделяемых указателей ничего не гарантируется, в посте это хорошо показано.

abby 24 ноя 2016 в 14:35

Как ответили выше, это в общем-то и в документации есть. То, что Вы хотите можно сделать при помощи std::weak_ptr. std::weak_ptr::lock должна быть атомарна.
Псевдо-код:

int main() {
  uint32_t i = 10000;
  while (i-- > 0) {
    auto sp = std::make_shared<int>();
    std::weak_ptr p = sp;
    thread([p]{
      if (auto sp = p.lock()) {
        // pointer is valid, Cool, use sp
      } else {
        // pointer is already expired, ignore
      }
    }).detach();
  }
  return 0;
}

-1

mayorovp 24 ноя 2016 в 15:02

Не вижу у вас обновления разделяемого между потоками указателя.

abby 24 ноя 2016 в 16:40

Исходный sp удаляется сразу после std::thread::detach, потому что «заканчивается scope», при этом в другом потоке мы пытаемся получить к нему доступ через std::weak_ptr.

mayorovp 24 ноя 2016 в 16:47

И что дальше? Какое отношение это имеет к ситуации, разобранной автором поста?

abby 24 ноя 2016 в 17:48

промахнулся, ответ ниже.

abby 24 ноя 2016 в 17:46

Пусть в разделяемой памяти находится некоторая информация упакованная в структуру и доступная через указатель. Есть один или множество независимых потоков, которые должны читать и использовать эти данные без модификации, как правило оказывается что для них критически важна скорость доступа. В то же время, пусть существует один или несколько потоков модифицирующих эти данные с нарушением целостности, на практике обычно оказывается что модификации случаются значительно реже и скорость доступа там не настолько важна.
…
Однако же я, прослышав что std::shared_ptr дает потокобезопасный доступ к контрольному блоку (и не очень понимая что это значит), а так же что операции над ним реализованы lock-free, хочу предложить свое изящное решение:

далее идет пример, того как делать не надо, а, как сказали выше, надо было просто дальше прочитать документацию. Хорошо, но как решить задачу без дополнительных финтов с блокировками?

Заметим, что читающий поток может пропустить часть данных, тогда это можно сделать, используя weak_ptr (считаем, что писатели могут синхронизироваться отдельно, тут задержка не важна). При этом, я считаю, что существует неблокирующий способ передачи этого самого weak_ptr в читающий поток.

Если же смотреть только на код примера, то то можно подумать, что речь идёт о том, что читающий поток живет все время и только и делает, что пытается прочитать данные, которые обновляются, но нечасто, и при этом все равно может пропустить часть данных. На мой взгляд тут проблема поважнее, и она не в деталях чтения памяти, а в подходе в целом. Это либо неэффективно, либо читающий поток захлебнется.

mayorovp 24 ноя 2016 в 18:59

Вы не показали неблокирующего способа передачи изменяемого weak_ptr в поток.

degs 24 ноя 2016 в 19:21

Естественно я рассматривал случай weak_ptr, в пост добавлять не стал чтобы не загромождать ненужными деталями. Валится точно так же, и механизм тот же, даже lock() не требуется. Вообще-то могли бы и проверить перед тем как постить.

void read_data() {
    for(;;)
        std::weak_ptr<int> sp=data;
}

int main()
{
    std::thread(read_data).detach();
    for(;;)
        data=std::make_shared<int>(0);
    return 0;
}

abby 24 ноя 2016 в 21:28

Тут та же самая ошибка, если один из потоков использует неконстантные методы доступа, то будет data race.

All member functions (including copy constructor and copy assignment) can be called by multiple threads on different instances of shared_ptr without additional synchronization even if these instances are copies and share ownership of the same object. If multiple threads of execution access the same shared_ptr without synchronization and any of those accesses uses a non-const member function of shared_ptr then a data race will occur; the shared_ptr overloads of atomic functions can be used to prevent the data race.

http://en.cppreference.com/w/cpp/memory/shared_ptr

Как передать в другой тред? — использовать другие неблокирующие структуры данных, например, попробовать неблокирующие очереди, но это пахнет тем же мьютексом на спин-локах. Хотя производительность надо мерить в конкретном случае.

При любых операциях с собственно указателем, например присвоении, мы должны атомарно проверять счетчик и одновременно изменять указатель на контрольный блок, что невозможно используя существующие атомарные примитивы.

Похоже, что так, если только кто-нибудь не придумает какой-нибудь трюк вроде tagged pointer, еще одного уровня вложенности или еще чего.

На самом деле я был бы рад ошибиться, возможно есть что-то, что я не знаю или понимаю неправильно?

А не посмотрите реализацию std::experimental::atomic_shared_ptr?

degs 24 ноя 2016 в 22:26

А не посмотрите реализацию std::experimental::atomic_shared_ptr?

Ну, если то что я вижу это апдейтнутая версия, то там ничего нового не добавлено, просто враппер вокруг стандартных std::atomic_… свободных функций. Пока больше похоже на заготовку на будущее.

abby 25 ноя 2016 в 01:26

Вот тут, похоже, интересные мысли с использованием Differential Reference Counting.
boostcon/cppnow 2016/implementing_a_lock_free_atomic_shared_ptr.pdf
И там дальше по ссылке литературы www.1024cores.net differential-reference-counting

degs 25 ноя 2016 в 03:43

Ссылки интерсные, спасибо. Отпишусь когда прочитаю.

degs 26 ноя 2016 в 05:37

Да, все верно. Но понимаете, это новые алгоритмы основанные на 128-битных атомиках, которые как бы уже есть но как бы еще не везде, поэтому до вхождения в стандарт им пока далеко. Я этой темы специально не касался, она конечно безумно интересная, но о ней нужно писать отдельно.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Разделяемые указатели и многопоточность. И снова о них, в который раз

Комментарии 52

Публикации

Истории