Dispose pattern

    “Не стоит следовать некоторой идиоме только потому, что так делают все или так где-то написано”

    Мысли автора статьи во время чтения и рефакторинга чужого кода

    Ни для кого не будет секретом, что платформа .NET поддерживает автоматическое управление памятью. Это значит, что если вы создадите объект с помощью ключевого слова new, то вам не нужно будет самостоятельно заботиться о его освобождении. Сборщик мусора определит «достижимость» объекта, и если на объект не осталось корневых ссылок, то он будет освобожден. Однако, как только речь заходит о ресурсах, таких как сокет, буфер неуправляемой памяти, дескриптор операционной системы и т.д., то сборщик мусора, по большому счету, умывает руки и весь головняк по работе с такими ресурсами ложится на плечи разработчика.

    А как же финализаторы? – спросите вы. Ну, да, есть такое дело, финализаторы действительно предназначены для освобождения ресурсов, но проблема в том, что время их вызова не детерминировано, а это значит, что никто не знает, когда они будут вызваны и будут ли вызваны вообще. Да и порядок вызова финализаторов не определен, поэтому при вызове финализатора некоторые «части» вашего объекта уже могут быть «разрушены», поскольку их финализаторы уже были вызваны. В общем, финализаторы – они-то есть, но это скорее «страховочный трос», а не нормальное средство управления ресурсами.


    Идиома RAII



    В языке С++, в котором нет никаких встроенных средств для автоматического управления памятью помимо умных указателей, уже давно активно применяется паттерн (или идиома) для своевременного освобождения ресурсов (*). Эта идиома носит название «Захват ресурса есть инициализация» (RAII — Resource Acquisition Is Initialization) и заключается в следующем. Ресурс захватывается в конструкторе и освобождается в деструкторе, а поскольку деструкторы вызываются автоматически, то и дополнительных усилий по управлению ресурсами больше не требуется.

    Не удивительно, что эта же идея детерминированного управления ресурсами перекачивала и в другие более «умные» и «управляемые» среды, такие как .NET или Java (**) в виде интерфейса IDisposable (в языке C#) и метода dispose (в Java). Но, поскольку эти среды более умные, по сравнению со старичком С++, и основные проблемы, связанные с управлением памятью, в них решены, то переехала эта идиома не слишком хорошо. Нет, поймите меня правильно, переехала она вполне успешно, но для этого вам нужно использовать блок using (для языка C#) или try-with-resourcesstatement (в Java 7), если же вы «забудете» ими воспользоваться, то от вашего детерминированного освобождения ресурсов не останется и следа.

    // Открываем файл внутри блока using
    using (FileStream file = File.OpenRead("foo.txt"))
    {
      // Выходим из функции при выполнении некоторого условия
      if (someCondition) return;
      // Файл будет закрыт автоматически при выходе из блока using
    }
    // А что, если кто-то откроет файла вне блока using?
    FileStream file2 = File.OpenRead("foo.txt");

    * This source code was highlighted with Source Code Highlighter.


    Однако это не единственная сложность, которая возникает при работе с ресурсами в .NET. Как мы вскоре увидим, использование обычного метода для освобождения ресурсов обладает и некоторыми другими проблемами. Поскольку метод Dispose освобождает ресурсы, то вызов финализатора уже не нужен и его нужно отменить, кроме того, метод Dispose разрушает инвариант класса, что дает пользователю возможность получить разрушенный или частично разрушенный объект. А это требует дополнительных проверок как в методе Dispose, так и во всех публичных методах класса.

    Все это привело к тому, что относительно простая идиома RAII вылилась на платформе .NET в паттерн, который так и называется “Dispose паттерн”. Однако прежде чем переходить к его рассмотрению, давайте рассмотрим два типа ресурсов, существующие на платформе .NET: управляемые и неуправляемые ресурсы.

    Управляемые и неуправляемые ресурсы



    В .NET существует два типа ресурсов: управляемые и неуправляемые. Причем отличить их довольно просто: к неуправляемым ресурсам относятся только «сырые» ресурсы, типа IntPtr, сырые дескрипторы сокетов или что-то в этом духе; если же с помощью идиомы RAII этот ресурс упаковали в объект, захватывающий его в конструкторе и освобождающий в методе Dispose, то такой ресурс уже является управляемым. По сути, управляемые ресурсы – это «умные оболочки» для неуправляемых ресурсов, для освобождения которых не нужно вызывать какие-то хитроумные функции, а достаточно вызвать метод Dispose интерфейса IDisposable.

    class NativeResourceWrapper : IDisposable
    {
      // IntPtr – описатель неуправляемого ресурса
      private IntPtr nativeResourceHandle;
      public NativeResourceWrapper()
      {
        // «Захватываем» неуправляемый ресурс путем вызова специальной функции
        nativeResourceHandle = AcquireNativeResource();
      }
      public void Dispose()
      {
        // Освобождаем захваченный ресурс, опять же, путем вызова какой-то
        // специальной функции
        ReleaseNativeResource(nativeResourceHandle);
      }
      // Есть еще и финализатор, но его роль будет раскрыта позднее
      ~NativeResourceWrapper() {...}
    }

    * This source code was highlighted with Source Code Highlighter.


    Таким образом, любой объект может владеть ресурсами двух типов: он может непосредственно содержать неуправляемый ресурс (например, IntPtr) или же он может содержать ссылку на управляемый ресурс (например, NativeResourceWrapper), при этом в обоих случаях объект, содержащий один из этих ресурсов, сам становится управляемым ресурсом. Это может показаться не слишком принципиальным, но понимать разницу между двумя типами ресурсов очень важно, поскольку работать с ними приходится по-разному.

    Dispose pattern



    Итак, мы знаем, что объект может владеть двумя типами ресурсов: управляемыми и неуправляемыми; а также то, что у нас есть два способа освобождения ресурсов: детерминированный, с помощью метода Dispose и недетерминированный, с помощью финализатора (***). А теперь давайте посмотрим, как со всем этим добром жить и, главное, как это добро освобождать.

    Идея Dispose паттерна состоит в следующем: давайте мы всю логику освобождения ресурсов поместим в отдельный метод, и будем вызывать его и из метода Dispose, и из финализатора, при этом, давайте добавим флажок, который бы говорил нам о том, кто вызвал этот метод. Поскольку эта простая идея содержит довольно большое количество подробностей, то давайте изложим Dispose паттерн по пунктам.

    1. Класс, содержащий управляемые или неуправляемые ресурсы реализует интерфейс IDisposable

    class Boo : IDisposable { ... }

    * This source code was highlighted with Source Code Highlighter.


    2. Класс содержит метод Dispose(booldisposing), который и делает всю работу по освобождению ресурсов; параметр disposing говорит о том, вызывается ли этот метод из метода Dispose или из финализатора. Этот метод должен быть protectedvirtual для не-sealed классов и private для sealed классов

    // Для не-sealed классов
    protected virtual void Dispose(bool disposing) {}

    // Для sealed классов
    private void Dispose(bool disposing) {}

    * This source code was highlighted with Source Code Highlighter.


    3. Метод Dispose всегда реализуется следующим образом: вначале вызывается метод Dispose(true), а затем может следовать вызов метода GC.SuppressFinalize(), который предотвращает вызов финализатора.

    public void Dispose()
    {
      Dispose(true /*called by user directly*/);
      GC.SuppressFinalize(this);
    }

    * This source code was highlighted with Source Code Highlighter.


    Метод GC.SuppressFinalize(), во-первых, должен вызываться после вызова Dispose(true), а не перед ним, поскольку если метод Dispose(true) «упадет» с исключением, то выполнение финализатора не отменится. Во-вторых, GC.SuppressFinalize() должен вызываться даже для классов, не содержащих финализаторы, поскольку финализатор может появиться у его наследника (т.е. мы должны вызывать метод GC.SuppressFinalize() во всех не-sealed классах).

    4. Метод Dispose(booldisposing) содержит две части: (1) если этот метод вызван из метода Dispose (т.е. параметр disposing равен true), то мы освобождаем управляемые и неуправляемые ресурсы и (2) если метод вызван из финализатора во время сборки мусора (параметр disposing равен false), то мы освобождаем только неуправляемые ресурсы.

    void Dispose(bool disposing)
    {
      if (disposing)
      {
        // Освобождаем только управляемые ресурсы
      }
      
      // Освобождаем неуправляемые ресурсы
    }

    * This source code was highlighted with Source Code Highlighter.


    5. (ОПЦИОНАЛЬНО) Класс может содержать финализатор и вызывать из него Dispose(booldisposing) передавая false в качестве параметра.

    ~Boo()
    {
      Dispose(false /*not called by user directly*/);
    }

    * This source code was highlighted with Source Code Highlighter.


    Не забывайте, что финализатор может быть вызван даже для частично сконструированных объектов, если конструктор этого класса сгенерирует исключение. Так что код очистки неуправляемых ресурсов должен учитывать то, что ресурсы еще не захвачены (****).

    6. (ОПЦИОНАЛЬНО) Класс может содержать поле bool _disposed, которое говорит о том, что ресурсы объекта уже освобождены. Disposable-классы должны спокойно позволять повторный вызов метода Dispose, а также генерировать исключение при доступе к любым другим публичным методам или свойствам (поскольку инвариант объекта уже разрушен).

    void Dispose(bool disposing)
    {
      if (disposed)
        return; // Ресурсы уже освобождены
      // Освобождаем ресурсы
      disposed = true;
    }

    public void SomeMethod()
    {
      if (disposed)
        throw new ObjectDisposedException();
    }

    * This source code was highlighted with Source Code Highlighter.


    7. (ОПЦИОНАЛЬНО) Класс может наследовать от CriticalFinalizerObject, если предыдущих шести пунктов мало и вы хотите большей экзотики. Наследование от этого класса дает вам дополнительные гарантии:

    1. Финализатор таких классов компилируется JIT-компилятором сразу при конструировании экземпляра, а не отложено по мере необходимости. Это дает возможность успешно выполниться финализатору даже в случае острой нехватки памяти.
    2. Как мы уже говорили, CLR не гарантирует порядок вызова финализаторов, что делает невозможным обращение внутри финализатора к другим объектам, содержащим неуправляемые ресурсы. Однако CLR гарантирует что финализаторы «простых смертных» объектов будут вызваны до наследников CriticalFinalizerObject. Это дает возможность, в частности, из финализаторов ваших классов (если они не наследуют от CriticalFinalizerObject) обращаться к полю SafeHandle, которое точно будет освобождено позднее.
    3. Финализаторы таких классов будут вызваны даже в случае экстренной выгрузки домена приложения.


    // А вы уверены, что оно вам нужно?
    class Foo : CriticalFinalizerObject {}

    * This source code was highlighted with Source Code Highlighter.


    Прагматичный взгляд на Dispose паттерн



    Если вам показалось, что работа с ресурсами в .NET неоправдано сложна, то у меня по этому поводу есть две новости: одна хорошая, а другая – не очень. Новость «не очень» заключается в том, что работа с ресурсами даже сложнее, чем здесь описано (*****), хорошая же заключается в том, что в большинстве случаев вся эта сложность нас с вами касаться практически не будет.

    Вся сложности реализации Dispose паттерна связаны с предположением о том, что один и тот же класс (или иерархия классов) может одновременно содержать как управляемые, так и неуправляемые ресурсы. Но давайте подумаем, а зачем вообще нам может понадобиться хранить неуправляемые ресурсы напрямую в классах бизнес-логики? А как же пресловутые Принципы Единой Ответственности (SRP – Single Responsibility Principle) и Здравого Смысла? Идиома RAII, описанная ранее, успешно используется десятки лет и предназначена как раз для таких случаев: если у вас есть неуправляемый ресурс, то вместо того, чтобы работать с ним напрямую, оберните его в управляемую оболочку и работайте уже с нею.

    Если посмотреть на .NET Framework, то можно заметить, что там используется именно такой подход: для всех ресурсов создается оболочка, которая прячет внутри всю сложность по работе с ресурсами, предоставляя пользователю лишь вызвать метод Dispose для явной очистки ресурсов (ну, и финализатор, на всякий случай). Кроме того, для большей части неуправляемых ресурсов операционной системы такие оболочки уже сделаны, и изобретать велосипед не нужно.

    Все это я веду к тому, что не нужно смешивать в вашем коде бизнес-логику и логику по работе с неуправляемыми ресурсами. И то, и другое достаточно сложно само по себе и заслуживает отдельного класса. Вот и получается, что данный паттерн «оптимизирован» на очень редкий случай (что класс может содержать и управляемые и неуправляемые ресурсы), при этом делая наиболее распространенный случай, когда класс содержит только управляемые ресурсы, очень неудобной в реализации и сопровождении.

    Упрощенная версия Dispose паттерна



    Если мы с вами знаем, что ни один человек не собирается смешивать управляемые и неуправляемые ресурсы в одном месте, так почему бы не реализовать это в коде явным образом? Мы можем оставить метод Dispose и вместо дополнительного метода Dispose с совсем невнятным булевым параметром, добавить виртуальный метод DisposeManagedResources, имя которого будет четко говорить о том, что мы должны освободить именно управляемые ресурсы. Модификатор доступа этого метода должен быть аналогичным нашему методу Dispose(bool), т.е. protected virtual для не-sealed классов или private для sealed классов.

    class SomethingWithManagedResources : IDisposable
    {
      public void Dispose()
      {
        // Никаких Dispose(true) и никаких вызовов GC.SuppressFinalize()
        DisposeManagedResources();
      }
      
      // Никаких параметров, этот метод должен освобождать только неуправляемые ресурсы
      protected virtual void DisposeManagedResources() {}
    }

    * This source code was highlighted with Source Code Highlighter.


    С первого взгляда такой подход может показаться слишком уж прагматичным, однако посудите сами: в книге Framework Design Guidelines описанию Dispose паттерна посвящено два десятка страниц, при этом ее авторы рекомендуют добавлять финализаторы только в случае острой необходимости. При этом все мы знаем, что смешивать два типа ресурсов в одном классе плохо, но все же следуем паттерну, который это поощряет, а не запрещает.

    Заключение



    При разработке библиотечных классов или бизнес-классов, которые будут использоваться в десятке других проектов, то следовать всем описанным выше принципам вполне разумно. К повторно используемому коду предъявляются другие требования и при их проектировании нужно следовать другим принципам: простота в использовании и расширяемость таких классов значительно важнее стоимости сопровождения.

    Если же вы проектируете классы бизнес-логики или простые библиотеки с ограниченным кругом пользователей, то можно не морочить себе голову с «канонами», а использовать упрощенную версию этого паттерна, которая работает только с управляемыми ресурсами.

    ------------------------------

    (*) В С++, в отличие от C#, память тоже является ресурсом. Поэтому идиома RAII в языке С++ применяется как для освобождения динамически выделенной памяти, так и для освобождения любых других ресурсов, типа дескрипторов ОС или сокетов.

    (**) В Java 7 наконец-то появилась конструкция, аналогичная конструкции using языка C#: try-with-resource statement

    (***) К сожалению в языке C# для финализаторов выбран тот же самый синтаксис (тильда, за которой идет имя класса), который используется для деструкторов в языке С++. Но семантика деструктора и финализатора очень разная, поскольку деструктор подразумевает детерминированное освобождение ресурсов, а финализатор – нет.

    (***) Да, это еще одно отличие в поведении .NET и языка С++. В последнем, деструктор вызывается только для полностью сконструированного объекта, при этом вызываются деструкторы для всех полностью сконструированных его полей.

    (****) Здесь я, например, не говорил о том, как можно получить «утечку ресурсов» при появлении исключений или о проблемах с изменяемыми значимыми типами, реализующими интерфейс IDisposable. Об этом я уже писал ранее в заметках «Гарантии безопасности исключений» и «О вреде изменяемых значимых типов» соответственно.
    Share post

    Similar posts

    Comments 28

      –2
      если поискать по тэгу IDisposable на хабре, то можно найти это.
        –2
        А если поискать в интернете, то можно найти это: www.rsdn.ru/article/dotnet/GCnet.xml.
          +9
          В целом, управление ресурсами в .net-е — это конкретный баян, о котором знает практически каждый .net девелопер. Но вот, если спросить, что такое Dispose паттерн, то многие почему-то тупо копи-пастят этот паттерн из их любимой книги, нисколько не думая, что этот паттерн должен решать и почему они добавили пустой финализатор и для чего вообще нужен второй метод Dispose.

          Здесь же я не столько показываю сам паттерн (без этого никак), сколько акцентирую внимание на его излишнюю тяжеловесность, которая в 99.999% просто не нужна.

          З.Ы. Это ответ на оба предыдущих коммента. Ссылка на кывт — вообще не в тему, там про GC и совсем мало про IDisposable, а в ссылке на хабре нет того, ради чего эта статья писалась: критического взгляда на Dispose паттерн.
            +1
            Совершенно согласен, сколько раз натыкался в коде приложения на реализацию полновесного Disposable в классах где нет и не будет никогда неуправляемых ресурсов. На вопрос «а почему нельзя было реализовать один метод Dispose?» разработчик обычно начинает бубнить, что мол шаблон ведь такой.
            0
            Хорошая статья (на английском) про проблемы со стандартной реализацией паттерна и про альтернативу: www.codeproject.com/KB/dotnet/idisposable.aspx?fid=1526839
              +4
              В жирном тесте пропали пробелы.

              В процитированном коде что-то не так :-)
              // Никаких параметров, этот метод должен освобождать только неуправляемые ресурсы
              protected virtual void DisposeManagedResources() {}

              Касательно (***). Так не просто такой же синтаксис, они и называются деструкторами, хотя делают не тоже самое.

              В примечении (****) нет ссылки на материал о CER.
                0
                Отличная статья, спасибо.
                  –2
                  Спасибо за статью.

                  Скажите, а я получается, дурак, если пишу вот так:

                  f = File.Open("filename.dat", File.Open, FileAccess.Read, FileShare.Read);
                  ...
                  f.Close();
                  


                  вместо using?
                  Я что-то не освобождаю?
                    +2
                    Просто, если в "..." вы получите исключение (либо явно в вашем коде, либо в функции, которую вы там вызываете), то файл закрыт не будет.

                    Поэтому, да, вы «можете» что-то не освободить.
                    Корректный код без using такой:

                    File f;
                    try
                    {
                    f = FIle.Open("filename.dat", File.Open, FileAccess.Read, FileShare.Read);
                    ...
                    }
                    finally
                    {
                    f.Close();
                    }
                      0
                      А, ну это понятно. Я обычно что-то вроде этого и пишу. Чем-то мне using не нравится. Сам не знаю, чем :D
                        +1
                        А если исключение вылетит в методе File.Open? Надо делать проверку на null.
                          0
                          Да, конечно.
                          Именно поэтому лучше использовать using, вместо рукопашного использования try/finally.

                          Кроме того, при использовании using будет сложнее использовать переменную после вызова Dispose/Close:
                          FileStream fs = null;
                          try
                          {
                          fs = File.OpenRead("");
                          }
                          finally
                          {
                          // Да, не забываем о проверке на null
                          if (fs != null)
                          fs.Close();
                          }

                          // переменная fs доступна после закрытия файла!
                          var b = fs.ReadByte();

                          using (var fs2 = File.OpenRead(""))
                          {

                          }
                          // переменная fs2 недоступна вне блока using
                            0
                            С другой стороны это плюс, т.к. переменная теперь «не мешает», да и толку от нее, если был вызван Dispose. Кстати говоря, как я помню, такое должно сработать:
                            var a = File.Open("a");
                            using (a)
                            {
                            
                            }
                            a.ToString(); // Должно быть в области видимости


                            Хотя зачем я это все рассказываю, вы наверное лучше меня знаете :)
                              0
                              Да, конечно. Просто в этом случае нужно сделать дополнительные усилия, чтобы отпилить себе ногу, а с try/finally это можно сделать по-умолчанию.
                                0
                                А в этом случае будет автоматически вызван метод a.Dispose() по выходу из using?
                                А вызов a.ToString(); приведёт к исключению?
                                0
                                Никто не вызывает File.Open без catch. Тогда какой смысл в using?
                                  +1
                                  Разница в том, что на том уровне, на котором файл открывают, обычно не просто его открывают в блоке try/catch, его открывают в try/finally, чтобы закрыть его успешно в случае успешной и неуспешной работы.

                                  При этом кэтчить исключение на том уровне, где происходит работа с файлом обычно не имеет смысла, поскольку восстановиться от этой проблемы все равно на этом уровне нельзя.
                                0
                                Кстати, поэтому получение ресурса нужно делать до try. Если исключение произойдёт в этот момент, то управление не попадёт в блок try. А если попали — значит, ресурс получен.
                            0
                            По моему все это уже было хорошо разжеванно в книге Джефри Рихтера «Программирование на платформе .NET Framework».
                              0
                              Я не читал этой книги, а статья была очень интересной.
                                0
                                У Рихтера правда этот паттерн описан отлично, но у него есть одна проблема: Джеффри достаточно категоричен в описании паттерна и очень авторитетен, и именно из-за него многие начали использовать паттерн там, где нужно и там, где нет.
                                0
                                2. Класс содержит метод Dispose(bool disposing), который и делает всю работу по освобождению ресурсов; параметр disposing говорит о том, вызывается ли этот метод из метода Dispose или из финализатора.


                                3. Метод Dispose всегда реализуется следующим образом: вначале вызывается метод Dispose(true), а затем может следовать вызов метода GC.SuppressFinalize(), который предотвращает вызов финализатора.

                                Один я вижу здесь противоречие? Зачем, запрещая вызов финализатора, писать логику по определению, откуда вызван метод Dispose?
                                  0
                                  И соответственно, основываясь на моем предыдущем вопросе, в чем профит от этого:
                                  4. Метод Dispose(booldisposing) содержит две части: (1) если этот метод вызван из метода Dispose (т.е. параметр disposing равен true), то мы освобождаем управляемые и неуправляемые ресурсы и (2) если метод вызван из финализатора во время сборки мусора (параметр disposing равен false), то мы освобождаем только неуправляемые ресурсы.

                                  ?

                                  зы. Мне правда интересно :)
                                  0
                                  «Новость «не очень» заключается в том, что работа с ресурсами даже сложнее, чем здесь описано (*****)»

                                  А куда ведет эта сноска?
                                    0
                                    В подвал статьи:
                                    (****) Здесь я, например, не говорил о том, как можно получить «утечку ресурсов» при появлении исключений или о проблемах с изменяемыми значимыми типами, реализующими интерфейс IDisposable. Об этом я уже писал ранее в заметках «Гарантии безопасности исключений» и «О вреде изменяемых значимых типов» соответственно.
                                      0
                                      У автора съехал сквозной счётчик звёздочек — у него 2 раза по 3 звезды.
                                    0
                                    Правильно ли я понимаю, что если внутри класса используется SafeHandle, то закрывать его можно даже если Dispose вызван из деструктора?

                                    p.s.
                                    Можно или даже нужно?

                                    p.p.s
                                    Приведите пример неуправляемого ресурса (непосредственное владение неуправляемым ресурсом в классе), пожалуйста.
                                      +1
                                      Вижу что поздно, но вдруг получится обсуждение.

                                      Правильно ли я понимаю, что если внутри класса используется SafeHandle, то закрывать его можно даже если Dispose вызван из деструктора?

                                      Да, но если только этот класс не наследуется от CriticalFinalizerObject. Иначе порядок вызовов снова становится неочевиден.

                                      p.s.
                                      Можно или даже нужно?

                                      Бывает что можно, но уж точно не нужно. Финализатор уже есть у SafeHandle. А сам SafeHandle является управляемым ресурсом и как гласит паттерн, освобождать его нужно только при прямом вызове. А на самом деле лучше воспользовать посленим советом статьи и не мешать ресурсы. Тогда финализатор не нужен в-принципе.

                                      p.p.s
                                      Приведите пример неуправляемого ресурса (непосредственное владение неуправляемым ресурсом в классе), пожалуйста.

                                      Да чуть ли не любой кусок кода, где рядом IntPtr, т.е. там, где работа с ресурсом напрямую. Насколько помню Pdfium.NET SDK работает с pdfium.dll именно так.

                                    Only users with full accounts can post comments. Log in, please.