notorca 4 авг 2014 в 16:56

Решение проблемы с циклическими ссылками в блоках ObjC

12 мин

30K

О блоках в ObjC и правильной работе с ними написано очень много, в том числе и на хабре. Вопрос о том, как правильно работать с self в блоках, чтобы избежать циклических ссылок, регулярно задается на собеседованиях. При использовании таких фреймворков, как ReactiveCocoa количество блоков в коде сильно возрастает, при этом увеличивается шанс допустить ошибку и потерять в памяти объекты. Про попытку окончательно решить эту проблему, метапрограммирование для с99 с экстеншнами и блоками + хипстерсткие макросы с @ под катом.

Рассмотрим проблему и способы ее решения эволюционно.

self.block = ^{ 
    [self f1];
    [self f2]; 
};

Этот код очевидно содержит проблему. Без зануления self.block объект никогда не сможет быть удален, поскольку блок ссылается на self. При включенном LANG_WARN_OBJC_IMPLICIT_RETAIN_SELF компилятор даже выдаст предупреждение.

Улучшение 1:

__weak __typeof(self)weakSelf = self;
self.block = ^{ 
    [weakSelf m1];
    [weakSelf m2]; 
};

Проблема циклической ссылки решена, но возникает другая. На момент вызова блока объект weakSelf либо существует, либо уже нет. Если объект уже не существует, weakSelf == nil, m1 и m2 не вызовутся — казалось бы, все в порядке. Однако, может получиться так, что на момент вызова m1 объект еще существует, а на момент вызова m2 уже нет. При этом m1 вызовется, а m2 нет — такое поведение может быть неожиданным и неправильным. Это может произойти как при race condition в многопоточном приложении, либо если m1 уменьшает количество ссылок на объект (например, удаляет объект из какой-нибудь коллекции). В случае включенных CLANG_WARN_OBJC_REPEATED_USE_OF_WEAK и CLANG_WARN_OBJC_RECEIVER_WEAK компилятор выдает предупреждение для этого случая.

Улучшение 2:

__weak typeof(self)weakSelf = self;
self.block = ^{
    __strong typeof(self)strongSelf = weakSelf;
    [strongSelf m1];
    [strongSelf m2];
};

Проблема с консистентностью вызовов методов внутри блока решена. Но обнаруживается новая:

__weak typeof(self)weakSelf = self;
self.block = ^{
    __strong typeof(self)strongSelf = weakSelf;
    [strongSelf m1];
    [strongSelf m2];
    NSAssert(foo == bar, @"Cool assert!")
};

Макросы, такие как NSAssert и RACObserve, неявно используют self, и проблема с циклической ссылкой возвращается.

Улучшение 3:

__weak typeof(self)weakSelf = self;
self.block = ^{
    __strong typeof(self)self = weakSelf;
    [self m1];
    [self m2];
    NSAssert(foo == bar, @"Cool assert!")
};

Теперь проблема с макросами использующими self решена, но при включенном GCC_WARN_SHADOW компилятор выдает предупрежнение.

Улучшение 4:

В библиотеке libextobjc есть макросы @weakify и @stongify которые убирают предупреждение компилятора и немного упрощают код.

@weakify(self); // self теперь новая локальная переменная с  __weak
self.block = ^{
    @strongify(self); // self теперь новая локальная переменная с __strong
    [self m1];
    [self m2];
    NSAssert(foo == bar, @"Cool assert!")
};

Это почти оптимальное решение, но оно все еще не лишено нескольких недостатков: нужно не забыть поставить в нужные места @weakify и @strongify; использование self после @weakify безопасно, но компилятор может выдавать предупрежнение.
При этом все еще остается вероятность случайно захватить в блоке self по сильной ссылке:

@weakify(self); // self теперь новая локальная переменная с  __weak
self.block = ^{
    @strongify(self); // self теперь новая локальная переменная с __strong
    [self m];
    NSLog(@"Ivar value form object: %@", _ivar); // Сильная ссылка на self сохраняется неявно для доступа к  _ivar
    NSAssert(foo == bar, @"Cool assert!")
};

Для того, что бы этого избежать нужно либо использовать только доступ через property (self.ivar), либо явно использовать переопределенный self:

@weakify(self); // self теперь новая локальная переменная с  __weak
self.block = ^{
    @strongify(self); // self теперь новая локальная переменная с __strong
    [self m];
    NSLog(@"Ivar value form object: %@", self->_ivar); // Явно используем свой переопределенный self для доступа к _ivar
    NSAssert(foo == bar, @"Cool assert!")
};

При этом нужно помнить, что self может быть nil, и явное разыменование self->_ivar вызовет креш.

С учетом всех этих проблем возникла идея написать макрос, который будет модифицировать не self, а сам блок таким образом, что:

self вне scope блока изменяться не должен, как в случае @weakify
внутри блока self должен называться self, чтобы избежать неожиданностей с NSAssert и другими макросами
до момента вызова блока объект, на который указывает self, хранится по слабой ссылке, а во время вызова блока — по сильной
по возможности макрос должен помогать находить блоки, которые неявно захватили self через _ivar
все проверки типов должны работать так же, как и без макроса
минимизировать изменения в коде при использовании этого макроса
overhead в runtime должен быть минимальный

Макрос должен работать примерно как функция-декоратор в Python, принимать на вход блок и заворачивать его в новый блок-обертку совместимый по параметрам и возвращаемому значению. Для примера рассмотрим блок:

self.block = ^(NSObject *obj) {
    NSLog(@"%@ %@", [self description], obj);
    return 0;
};

Начнем модифицировать блок таким образом, чтобы self захватывался как слабая ссылка, по аналогии с кодом из «Улучшение 1». Для этого нам нужен новый scope в котором эта локальная ссылка будет объявлена. В качестве такого scope подойдет анонимный блок, который вызывается сразу после создания:

self.block = ^{
    __weak typeof(self) weakSelf = self;
    return ^(NSObject *obj) {
        NSLog(@"%@ %@", [weakSelf description], obj);
        return 0;
    };
}();

Компилятор автоматически выведет тип возвращаемого значения для внешнего безымянного блока, все остается типобезопасным.

Теперь нужно каким-то образом сделать так, что бы в момент вызова внутри тела внутреннего блока self становился сильной ссылкой. Для этого придется разделить блок на 2 части: декларацию типа ^(NSObject *obj) и, собственно, само тело в {… }. Превратим тело нашего блока в блок без параметров и поместим его вызов в еще один блок, созданный с использованием декларации типа, который превратит self в сильную ссылку:

self.block = ^{
    __weak typeof(self) weakSelf = self;
    return ^(NSObject *obj) {
        __strong typeof(self)self = weakSelf;
        return ^ (void) {
            NSLog(@"%@, %@", [self description], obj);
            return 0;
        }();
    };
}();

Основной трюк — это замена исходного блока, эквивалентным ему, но который неявно захватывает weakSelf вместо self, а в момент вызова превращает его в strongSelf.

return ^(NSObject *obj) {
    __weak typeof(self)self = weakSelf;
    return ^ (void) {
        NSLog(@"%@, %@", [self description], obj);
        return 0;
    }();
};

по сути то же самое, что и

^(NSObject *obj) {
    NSLog(@"%@ %@", [self description], obj);
    return 0;
};

Итого вместо одного блока создается три. Поскольку самый внешний блок вызывается сразу после создания, от него можно избавиться воспользовавшись code block evaluation aka statement expressions extension:

self.block = ({
    __weak typeof(self) weakSelf = self;
    ^(NSObject *obj) {
        __strong typeof(self)self = weakSelf;
        return ^ (void) {
            NSLog(@"%@, %@", [self description], obj);
            return 0;
        }();
    };
});

Осталось завернуть весь boilerplate в макрос, чтобы этим трюком было удобно пользоваться. Если оставить только общий код, то получится:

 ({
    __weak typeof(self) weakSelf = self;
    /* ТИП БЛОКА */ {
        __strong typeof(self)self = weakSelf;
        return ^ (void) {
        /* ТЕЛО БЛОКА */ 
        } ();
    };
})

Первой идеей было сделать макрос с двумя параметрами, для типа и тела, который бы вызывался так:

self.block = weakself(^(NSObject *obj), {
    NSLog(@"%@ %@", [self description], obj);
    return 0;
});

но, к сожалению, при препроцессинге макросы разворачиваются в одну строку, и, как следствие, нельзя поставить breakpoint на произвольную строчку в теле блока. Поэтому пришлось делать так:

self.block = weakself(^(NSObject *obj)) {
    NSLog(@"%@ %@", [self description], obj);
    return 0;
} weakselfend ;

такой вариант эквивалентен @weakify/ @strongify из «Улучшение 4». Код макроса:

#define weakself(ARGS) \
({  __weak typeof(self) _private_weakSelf = self; \
    ARGS { \
        __strong typeof(_private_weakSelf) self __attribute__((unused)) = _private_weakSelf; \
        return ^ (void) {

#define weakselfend } (); }; })

Одной из целей при создании макроса было обезопасить себя от неявного захвата self при доступе к ivar. К сожалению, как сделать это в compile time я так и не придумал. Единственный вариант — это assert/log для дебаг версии при создании блока (достаточно просто создать блок чтобы проверка сработала, не обязательно его вызывать). Тут стоит немного напомнить о том, как работает memory management для блоков и объектов, которые они захватывают. Существуют 3 типа блоков:

NSGlobalBlock — блоки, созданные на верхнем уровне файла с исходным кодом, по сути аналогичны функциям с точки зрения memory management, переменные в scope не захватывают по этому интереса для нас не представляют.
NSStackBlock — начальный тип для всех остальных созданных блоков, создаются на стеке, не увеличивают счетчики ссылок у объектов, которые захватывают, поскольку время жизни такого блока меньше либо равно времени жизни переменных из его лексического scope.
NSMallocBlock — это NSStackBlock который был перенесен в heap явным вызовом copy/Block_copy или неявно компилятором. Один из случаев когда компилятор неявно вставляет Block_copy — это возврат блока как результат из функции/блока. В момент превращения NSStackBlock в NSMallocBlock и происходит увеличения счетчиков ссылок объектам, которые блок захватил в свой scope.

Таким образом, для того, что бы проверить, захватывает ли блок сильную ссылку на self нужно сравнить счетчик ссылок на self, до того как блок был перенесен в heap, и после. Если счетчик увеличился, значит блок захватил self по сильной ссылке. Эта проверка не может быть надежной в 100% случаев, поскольку счетчик ссылок на self может изменяться из других потоков во время переноса блока в heap, однако в нормальной программе эта ситуация маловероятна, и для Debug-сборки вполне подходит.

Для получения счетчика ссылок у объекта раньше можно было использовать метод retainCount, однако с ARC он больше не доступен, но CFGetRetainCount по-прежнему работает через toll-free bridging. Осталось только вставить вызовы этой функции с параметром self в нужные места и сравнить результаты.

self.block = {(
    __weak typeof(self) weakSelf = self;
    // Первый раз счетчик ссылок для self нужно получить здесь
    ^(NSObject *obj) {
        __strong typeof(self)self = weakSelf;
        return ^ (void) {
            NSLog(@"%@, %@", [self description], obj);
            return 0;
        }();
    };
})  // второй раз здесь и сравнить. Но у нас нет доступа к переменным из statement expression

Проблема в том, что результат statement expressions — это последняя строчка в нем. Поведение аналогично анонимному блоку, который вызывается сразу после объявления. Поскольку последняя строчка statement expression это декларация блока, то для того, чтобы этот блок оставался валидным, компилятор перенесет его в heap. Получается, мы можем сохранить вызов CFGetRetainCount для self в локальную переменную внутри statement expression, а второй вызов CFGetRetainCount нам нужно делать после последней строчки statement expression. Если бы речь шла про C++, мы бы могли создать объект на стеке, а в деструкторе объекта сделать все, что нам нужно, поскольку деструтор бы вызвался после выполнения последней строчки statement expression. К счастью, clang поддерживает gcc-extension который позволяет выставить cleanup-функцию (аналог деструктора) для любой переменной на стеке, которая будет вызвана в тот момент, когда переменая уйдет из области видимости. Через этот extension работает макрос @onExit из libextobjc.

Для реализации проверки счетчика ссылок понадобится дополнительная структура:

struct RefCountCheckerData {
    CFTypeRef weakSelf;
    NSUInteger refCountBefore;
};

И функция, которая будет выставлена как cleanup.

static inline void vbr_CheckRefCountForWeakSelf(struct RefCountCheckerData *data) {
    const NSInteger refCountAfter = CFGetRetainCount(data->weakSelf);
    const NSInteger countOfSelfRefInBlock = refCountAfter - data->refCountBefore;
    if (countOfSelfRefInBlock > 0) {
        raise(SIGPIPE);
    }
}

Создаем структуру на стеке, выставляем cleanup функцию и инициализируем указатель на weakSelf и число ссылок на него. Cleanup функция вызовется когда переменная _private_refCountCheckerData уйдет из области видимости, а в этот момент наш блок уже в heap.

self.block = {(
    __weak typeof(self) weakSelf = self;
    __attribute__((cleanup(vbr_CheckRefCountForWeakSelf), unused))
        struct RefCountCheckerData _private_refCountCheckerData = {
            .weakSelf = (__bridge CFTypeRef)self,
            .refCountBefore = CFGetRetainCount((__bridge CFTypeRef)self),
        };
    ^(NSObject *obj) {
        __strong typeof(self)self = weakSelf;
        return ^ (void) {
            NSLog(@"%@, %@", [self description], obj);
            return 0;
        }();
    };
});

С такой версией макроса сработает breakpoint в отладчике при попытке получить доступ к ivar не через self, например таком self.block = ^{ NSLog(@"%d", _ivarInteger); };

Перед тем как, представить финальный вариант макроса, нужно привести его в современный хипстерский вид. Для ObjC модно делать макросы начинающиеся, как и ключевые слова языка, с @, например: @strongify, @onExit. Но препроцессор не разрешает использовать @ как часть имени макроса. В extobjc для этого используют вставку в начало макроса autoreleasepool {} либо try {} catch (...) {}, символ @ таким образом приклеивается либо к try либо к autoreleasepool. После разворачивания макроса в коде появляется ненужный пустой autoreleasepool либо try catch, но это никого сильно не волнует. Однако такой подход не работает для макроса weakself, потому что результат weakself это выражение, а выражение не может содержать @autoreleasepool try {} catch (...) {} в начале.

self.block = @weakself(^(NSObject *obj)) {
    NSLog(@"%@ %@", [self description], obj);
    return 0;
} @weakselfend ;

Когда речь идет о сложных выражениях в С на ум первым делом приходит тернарный оператор. Осталось понять, как его применить. Первым в голову пришло записать как-то так: self.block = @1? /* здесь код блоков */: nil;

Для этого нужно всего лишь добавить 1? в начало weakself и :nil; в конец weakselfend. Но self.block = 1? /* здесь код блоков */: nil; вполне корректное выражение, поэтому @weakself и weakself будут работать.

Вариант self.block = @[]? /* здесь код блоков */: nil; не дает использовать @weakself без @, однако после проверки дизассемблера выяснилось, что оптимизатор не выбрасывает создание пустого массива, а это лишний overhead в runtime.

Наконец в голову пришла идея использовать особенности String Literal Concatenation в ObjC.

const char *s0 = "ABC" "DEF"; // это валидная C-строка "ABCDEF"
NSString *s1 = @"ABC" @"DEF"; // это валидная ObjC-строка @"ABCDEF"
NSString *s2 = @"ABC" "DEF"; // это тоже валидная ObjC-строка @"ABCDEF"
NSString *s3 = "ABC" @"DEF"; // а это ошибка компиляции

Итак, финальный вариант макроса:

#define weakself(ARGS) \
"weakself should be called as @weakself" @"" ? \
({  __weak typeof(self) _private_weakSelf = self; \
    ARGS { \
        __strong typeof(_private_weakSelf) self __attribute__((unused)) = _private_weakSelf; \
        return ^ (void) {

#define weakselfnotnil(ARGS) \
"weakself should be called as @weakself" @"" ? \
({  __weak typeof(self) _private_weakSelf = self; \
    ARGS { \
        __strong typeof(_private_weakSelf) self __attribute__((unused)) = _private_weakSelf; \
        return ^ (void) { if (self)

#define weakselfend \
    try {} @finally {} } (); }; \
}) : nil

@weakselfnotnil отличается тем, что если к моменту вызова блока self уже удален, то блок не вызовется. Подходит только для случаев, когда блок не имеет возвращаемого значения, иначе не понятно, что возвращать в случае если self уже удален. Сделан в основном для безопасного использования ivar через явное разыменованиее self:

self.block = @weakselfnotnil(^) {
    NSLog(@"%d", self->_ivar);
} @weakselfend;

Производительность

Сильно беспокоиться из-за производительности тут, пожалуй, не стоит, накладных расходов должно быть не много. Трюк для добавления @ в начало макроса полностью выбрасывается оптимизатором. С накладными расходами на вызов дополнительного блока дела обстоят интереснее. Для проверки как обстоят дела с накладными расходами рассмотрим 2 случая, с использованием макросов из libextobjc и нашего weakself:

- (void)m1 {
    @weakify(self);
    self.block = ^(NSObject * obj) {
        @strongify(self);
        NSLog(@"%@", [self description]);
        return 0;
    };
}

- (void)m2 {
    self.block = @weakself(^(NSObject * obj)) {
        NSLog(@"%@", [self description]);
        return 0;
    } @weakselfend;
}

Собираем с -O3, открываем в Hooper и смотрим псевдокод для обоих случаев

function -[ViewController m1] {
    asm{ vst1.64    {d8, d9, d10, d11}, [r4:128]! };
    asm{ vst1.64    {d12, d13, d14, d15}, [r4:128] };
    r1 = *_NSConcreteStackBlock;
    *((sp - 0x40 & !0xf) - 0x50) = r1;
    var_4 = 0xc2000000;
    var_24 = ((sp - 0x40 & !0xf) - 0x50) + 0x14;
    asm{ stm.w      r5, {r1, r2, r3} };
    r5 = [r0 retain];
    objc_initWeak(var_24, r5);
    [r5 release];
    r0 = *__objc_personality_v0;
    r1 = *0xac24;
    var_52 = r0;
    var_56 = GCC_except_table0;
    var_60 = &var_12;
    var_68 = (sp - 0x40 & !0xf) - 0x50;
    var_64 = (r1 | 0x1) + 0xabc4;
    var_32 = 0x1;
    [r5 setBlock1:(sp - 0x40 & !0xf) - 0x50];
    objc_destroyWeak(var_24);
    r0 = _Unwind_SjLj_Unregister(&var_28);
    asm{ vld1.64    {d8, d9, d10, d11}, [r4:128]! };
    asm{ vld1.64    {d12, d13, d14, d15}, [r4:128] };
    Pop();
    Pop();
    Pop();
    return r0;
}

function ___20-[ViewController m1]_block_invoke {
    r4 = objc_loadWeakRetained(r0 + 0x14);
    r0 = [r4 description];
    r5 = [r0 retain];
    NSLog(@"%@", r5);
    [r5 release];
    [r4 release];
    return 0x0;
}

function -[ViewController m2] {
    r4 = r0;
    r0 = *_NSConcreteStackBlock;
    *(sp - 0x18) = r0;
    var_4 = 0xc2000000;
    asm{ stm.w      r3, {r0, r1, r2} };
    objc_initWeak((sp - 0x18) + 0x14, r4);
    r5 = objc_retainBlock(sp - 0x18);
    objc_destroyWeak((sp - 0x18) + 0x14);
    [r4 setBlock1:r5];
    r0 = [r5 release];
    return r0;
}

function ___20-[ViewController m2]_block_invoke {
    r4 = objc_loadWeakRetained(r0 + 0x14);
    r0 = [r4 description];
    r5 = [r0 retain];
    NSLog(@"%@", r5);
    [r5 release];
    [r4 release];
    return 0x0;
}

Получается, что weakself эффективнее чем @weakify/strongify, внутренний дополнительный блок полностью заинлайнился и _block_invoke в обоих случаях выглядит одинаково. Но способ которым в extobjc «съедают» @ в начале макроса добавляет бесполезный код по обработке исключений в рантайме, что видно по _Unwind_SjLj_Unregister.

В случае компиляции с -Os все не так хорошо, блок не инлайнится и вместо одного _block_invoke генерируется два

function ___20-[ViewController m2]_block_invoke {
    r0 = objc_loadWeakRetained(r0 + 0x14);
    r1 = *_NSConcreteStackBlock;
    *(sp - 0x18) = r1;
    var_4 = 0xc2000000;
    asm{ stm.w      r4, {r1, r2, r3} };
    var_20 = r0;
    r4 = [r0 retain];
    r5 = ___20-[ViewController m2]_block_invoke_2(sp - 0x18);
    [var_20 release];
    [r4 release];
    r0 = r5;
    return r0;
}

function ___20-[ViewController m2]_block_invoke_2 {
    r0 = *(r0 + 0x14);
    r0 = [r0 description];
    r4 = [r0 retain];
    NSLog(@"%@", r4);
    [r4 release];
    return 0x0;
}

К сожалению, clang пока не позволяет добавить атрибут always_inline к блоку.
Полный исходный код и autocomplete для Xcode тут.

Хабы: