Многопоточность — одна из самых сложных тем в программировании, с ней постоянно возникает масса проблем. Без четкого понимания внутренних механизмов будет очень трудно предсказать результат работы приложения, использующего несколько потоков. Мы не будем здесь дублировать массу теоретической информации, которой очень много в сети и умных книгах. Вместо этого сконцентрируемся на конкретных и наиболее важных проблемах, на которые нужно обращать особое внимание и обязательно помнить о них в процессе разработки.
Потоки
Как все наверняка знают, поток в .NET Framework представлен в виде класса Thread. Разработчики могут создавать новые потоки, давать им осмысленные имена, изменять приоритет, запускать, ожидать завершения работы или останавливать.
Потоки делятся на background (фоновый) и foreground (основной, тот, что на переднем плане). Основное отличие между ними в том, что foreground-потоки препятствуют завершению программы. Как только все foreground-потоки остановлены, система автоматически остановит все background и завершит выполнение приложения. Чтобы определить, является поток фоновым или нет, необходимо вызвать следующее свойство текущего потока:
Thread.CurrentThread.IsBackground
По умолчанию, при создании потока при помощи класса Thread мы получим foreground-поток. Для того, чтобы его поменять на фоновый, мы можем воспользоваться свойством thread.IsBackground.
В приложениях, которые имеют пользовательский интерфейс (UI), всегда есть как минимум один главный (GUI) поток, который отвечает за состояние компонентов интерфейса. Важно знать, что возможность изменять состояние представления есть только у этого, так называемого «UI-потока», который создается для приложения обычно в единственном экземпляре (хотя и не всегда).
Стоит также упомянуть про исключительные ситуации, которые могут возникать в дочерних потоках. В такой ситуации приложение будет экстренно завершено, и мы получим Unhandled Exception, даже если обернем код запуска потока в блок try/catch. В таком случае, обработку ошибок необходимо вынести в код дочернего потока, в котором уже можно будет отреагировать на конкретную исключительную ситуацию.
Применяя глобальную обработку исключений (Application_Error в ASP.NET, Application.DispatcherUnhandledException в WPF, Application.ThreadException в WinForms и т.д.) важно помнить, что при таком подходе мы сможем «ловить» исключительные ситуации, которые произошли ТОЛЬКО в UI потоке, то есть мы не «поймаем» исключения из дополнительных фоновых потоков. Также мы можем воспользоваться AppDomain.CurrentDomain.UnhandledException и вклиниться в процесс обработки всех необработанных исключительных ситуаций в рамках домена приложения, но мы никак не сможем воспрепятствовать процессу завершения приложения.
Потоки — это дорогостоящие объекты, которые занимают память, могут использовать различные ресурсы системы и находиться в разных состояниях. Для их создания требуется время. В сравнении с процессами они менее ресурсоемки, но все же требуют довольно больших затрат на создание и уничтожение. Более того, за освобождение занимаемых конкретным потоком ресурсов отвечает разработчик. Например, для выполнения массы небольших задач неэффективно запускать множество потоков, так как издержки на их запуск могут превысить выгоду от использования. Для того, чтобы иметь возможность повторно использовать уже запущенные потоки и избавиться от издержек на создание, был введен так называемый пул-потоков (ThreadPool).
ThreadPool
В рамках каждого процесса CLR создает одну дополнительную абстракцию, которая называется пул потоков. Он представляет собой набор потоков, которые находятся в режиме ожидания и готовы выполнять любую полезную работу. При запуске приложения пул-потоков запускает минимальное количество потоков, которые находятся в состоянии ожидания новых задач. Если активных потоков недостаточно для эффективного выполнения задач в пуле, он запускает новые и использует их по тому же принципу повторного использования. Пул довольно умный и умеет определять необходимое эффективное количество потоков, а также останавливать лишние или запускать дополнительные. Можно задавать максимальное и минимальное количества потоков, но на практике это делают редко.
Потоки внутри пула разделяются на две группы: worker и I/O-потоки. Рабочие потоки фокусируются на работе, связанной с загрузкой CPU (CPU based), в то время как I/O-потоки — на работе с устройствами ввода/вывода: файловая система, сетевая карта и другие. Если пытаться выполнять I/O-операцию на рабочем потоке (CPU based), то это будет напрасная трата ресурсов, так как поток будет находиться в состоянии ожидания завершения I/O-операции. Для подобных задач предназначены отдельные I/O-потоки. При использовании пула потоков это скрыто в явном виде от разработчиков. Получить количество разных потоков в пуле можно при помощи кода:
ThreadPool.GetAvailableThreads(out workerThreads, out competitionPortThreads);
Для того, чтобы определить, является текущий поток взятым из пула или созданным вручную, необходимо воспользоваться конструкцией:
Thread.CurrentThread.IsThreadPoolThread
Запустить задачу на выполнение при помощи потока, взятого в пуле, можно с помощью:
- класса ThreadPool: ThreadPool.QueueUserWorkItem
- асинхронных делегатов (пара методов делегата: BeginInvoke() и EndInvoke())
- класса BackgroundWorker
- TPL (Task Parallel Library, о которой мы еще поговорим ниже)
Следующие конструкции также используют пул потоков, но делают это неявно, о чем важно знать и помнить:
- WCF, Remoting, ASP.NET, ASMX Web Services
- System.Timers.Timer и System.Threading.Timer
- EAP (the event-based asynchronous pattern, о нем поговорим дальше)
- PLINQ
Полезно держать в голове следующие моменты:
- Потокам из пула невозможно назначить имя
- Потоки из пула всегда фоновые (background)
- Блокировка потоков из пула может привести к запуску дополнительных потоков и падению производительности
- Вы можете поменять приоритет потоку из пула, но он вернется в дефолтное значение (normal) после возвращения в пул
Синхронизация
При построении многопоточного приложения необходимо гарантировать, что любая часть разделяемых данных защищена от возможности изменения их значений множеством потоков. Учитывая, что управляемая куча является одним из разделяемых потоками ресурсов, а все потоки в AppDomain имеют параллельный доступ к разделяемым данным приложения, очевидно, что доступ к таким общим данным необходимо синхронизировать. Это гарантирует, что в один момент времени доступ к определенному блоку кода получит лишь один поток (или указанное количество, в случае использования Семафора). Таким образом, мы можем гарантировать целостность данных, а также их актуальность в любой момент времени. Давайте рассмотрим возможные варианты синхронизации и частые проблемы. Говоря о синхронизации, обычно выделяют 4 вида:
- Блокировка вызывающего кода
- Конструкции, ограничивающие доступ к кускам кода
- Сигнализирующие конструкции
- Неблокирующая блокировка
Blocking
Под блокировкой понимается ожидание одним потоком завершения другого или нахождение в режиме ожидания в течение некоего времени. Обычно реализуется при помощи методов класса Thread: Sleep() и Join(), метода EndInvoke() асинхронных делегатов или при помощи тасков (Task) и их механизмов ожидания. Следующие конструкции являются примерами плохого подхода к реализации ожидания:
while (!proceed);
while (DateTime.Now < nextStartTime);
Подобные конструкции требуют много ресурсов процессора, хотя не выполняют никакой полезной работы. В то же время ОС и CLR думают, что наш поток занят выполнением важных расчетов и выделяют для него необходимые ресурсы. Данного подхода следует всегда избегать.
Похожим примером может быть следующая конструкция:
while (!proceed) Thread.Sleep(10);
Здесь вызывающий поток периодически засыпает на короткое время, но его достаточно для того, чтобы система могла переключить контексты и выполнять параллельно другие задачи. Данный подход гораздо лучше предыдущего, но все же не идеален. Основная проблема возникает в тот момент, когда необходимо изменять флаг proceed из разных потоков. Подобная конструкция будет эффективным решением в том случае, когда мы ожидаем, что условие в цикле будет удовлетворено через очень короткое время и повлечет за собой небольшое количество итераций. Если итераций много, то системе потребуется постоянно переключать контекст данного потока и тратить на это дополнительные ресурсы.
Locking
Эксклюзивная блокировка применяется для того, чтобы удостовериться, что только один поток будет выполнять конкретный участок кода. Это необходимо для гарантирования актуальности данных в каждый момент времени. В .NET Framework существует довольно много механизмов, которые позволяют реализовать блокировку доступа к участкам кода, но мы рассмотрим только самые популярные. А заодно разберем наиболее частые ошибки, связанные с применением подобных конструкций.
В таблице представлены самые популярные механизмы для организации блокировок. При помощи Мютексов можно реализовать межпроцессорную блокировку (а не только для нескольких потоков одного процесса). Семафор отличается от Мютекса тем, что позволяет указать количество потоков или процессов, которые могут получить одновременный доступ к конкретному участку кода. Конструкция lock, которая является вызовом пары методов: Monitor.Enter() и Monitor.Exit(), применяется очень часто, поэтому рассмотрим возможные проблемы и рекомендации по её использованию.
Статические члены классов, которыми часто оперируют разработчики, всегда потоконебезопасны, и доступ к таким данным нужно обязательно синхронизировать. Отличием может быть только статический конструктор, так как CLR блокирует все обращения из сторонних потоков к статическим членам класса до тех пор, пока не завершит свою работу статический конструктор.
При использовании блокирования при помощи ключевого слова lock следует помнить о следующих правилах:
- необходимо избегать блокирования типов:
lock(typeof(object)) {…}
<Дело в том, что каждый тип хранится в единственном экземпляре в рамках одного домена и подобный подход может привести к взаимоблокировкам. Поэтому стоит избегать подобных конструкций. - необходимо избегать блокирования объекта this:
lock(this) {…}
Данный подход также может привести к взаимоблокировке. - как объект синхронизации можно использовать дополнительное поле в конкретном классе:
lock(this.lockObject) {…}
- нужно применять конструкцию Monitor.TryEnter(this.lockObject, 3000) когда вы сомневаетесь, и поток может быть заблокирован. Подобная конструкция позволит выйти из блокировки по истечении указанного интервала времени.
- необходимо использовать класс Interlocked для атомарных операций вместо подобных конструкций:
lock (this.lockObject) { this.counter++; }
Signaling
Данный механизм позволяет потоку остановиться и ожидать до тех пор, пока он не получит извещение из другого потока о возможности продолжить работу.
В таблице приведены наиболее распространенные конструкции, которые используются при «сигналинге». Использование данного подхода зачастую будет более эффективным, чем предыдущие.
Nonblocking synchronization
Кроме перечисленных выше механизмов, .NET Framework предоставляет конструкции, которые могут выполнять простые операции без блокировки, остановки или ожидания других потоков. За счет отсутствия блокировок и переключения контекстов код будет работать быстрее, но при этом очень легко допустить ошибку, которая чревата труднонаходимыми проблемами. В конечном счете ваш код может стать даже медленнее, чем если бы вы применили распространенный подход с использованием lock. Одним из вариантов подобной синхронизации является применение так называемых барьеров памяти (Thread.MemoryBarrier()), которые препятствуют оптимизациям, кешированию регистров CPU и перестановкам программных инструкций.
Другим подходом является использование ключевого слова volatile, которым помечаются необходимые поля класса. Оно заставляет компилятор генерировать барьеры памяти при каждом чтении и записи в переменную, помеченной volatile. Данный подход хорош в том случае, когда у вас один поток, или одни потоки только читают, а другие только записывают. Если же вам необходимо читать и изменять в одном потоке, то стоит воспользоваться оператором lock.
Обе перечисленные выше возможности довольно сложны для понимания, требуют четких знаний в области моделей памяти и оптимизаций на разных уровнях, поэтому используются довольно редко. Да и применять их нужно очень аккуратно и только тогда, когда вы понимаете, что делаете и зачем.
Самый простой и рекомендуемый подход для атомарных операций — применение класса Interlocked, о котором упоминалось выше. За кулисами также генерируются барьеры памяти, и нам не нужно заботиться о дополнительных блокировках. Данный класс имеет довольно много методов для атомарных операций, таких как увеличение, уменьшение, изменение, изменение со сравнением и т.д.
Collections
Полезно знать, что в пространстве имен System.Collections.Concurrent определено довольно много потокобезопасных коллекций для разных задач. Самые распространенные:
BlockingCollection
ConcurrentBag
ConcurrentDictionary<TKey, TValue>
ConcurrentQueue
ConcurrentStack
В большинстве случаев нет смысла в реализации собственной подобной коллекции — намного проще и разумней использовать готовые протестированные классы.
Асинхронность
Отдельно хотелось бы выделить так называемую асинхронность, которая, с одной стороны, всегда непосредственно связана с запуском дополнительных потоков, а с другой — с дополнительными вопросами и теорией, на которых тоже стоит остановиться.
Покажем на наглядном примере разницу между синхронным и асинхронным подходами.
Предположим, вы хотите пообедать пиццей в офисе и у вас есть два варианта:
1-й, синхронный вариант: прогуляться пешком в пиццерию, выбрать интересующую вас пиццу, сделать заказ, дождаться, пока его принесут, добраться с пиццей в офис или пообедать непосредственно в пиццерии, после чего вы вернетесь и продолжите работать. В процессе прогулки и ожидания заказа вы будете находиться в режиме ожидания и не сможете заниматься другой полезной работой (для простоты, здесь понимается именно работа в офисе, которая приносит деньги и которую вы не можете выполнять вне рабочего места).
2-й, асинхронный вариант: заказать пиццу по телефону. После заказа вы не заблокированы, можете выполнять полезную работу на рабочем месте, пока ваш заказ обрабатывается и доставляется в офис.
Эволюция
По мере развития .NET Framework было много нововведений и подходов для запуска асинхронных операций. Первым решением для асинхронных задач стал подход под названием APM (Asynchronous Programming Model). Он основан на асинхронных делегатах, которые используют пару методов с именами BeginOperationName и EndOperationName, которые соответственно начинают и завершают асинхронную операцию OperationName. После вызова метода BeginOperationName приложение может продолжить выполнение инструкций в вызывающем потоке, пока асинхронная операция выполняется в другом. Для каждого вызова метода BeginOperationName в приложении также должен присутствовать вызов метода EndOperationName, чтобы получить результаты операции.
Данный подход можно встретить во множестве технологий и классов, но он чреват усложнением и избыточностью кода.
В версии 2.0 была введена новая модель под названием EAP (Event-based Asynchronous Pattern). Класс, поддерживающий асинхронную модель, основанную на событиях, будет содержать один или несколько методов MethodNameAsync. Он может отражать синхронные версии, которые выполняют то же действие с текущим потоком. Также в этом классе может содержаться событие MethodNameCompleted и метод MethodNameAsyncCancel (или просто CancelAsync) для отмены операции. Данный подход распространен при работе с сервисами. В Silverlight применяется для обращения к серверной части, а Ajax по сути представляет из себя реализацию данного подхода. Стоит опасаться длинных цепочек связанных вызовов событий, когда по завершении одной долгосрочной операции в событии ее завершения вызывается следующая, потом еще следующая и так далее. Это чревато дэдлоками и непредвиденными результатами. Обработка исключений и результаты асинхронной операции доступны только в обработчике события посредством соответствующих свойств параметра: Error и Result.
В .NET Framework 4.0 была введена усовершенствованная модель под названием TAP (Task-based Asynchronous Model), которая основана на задачах. На них также построены TPL и PLINQ, но о них поговорим подробно в следующий раз. Данная реализация асинхронной модели базируется на типах Task и
Task<ТResult>System.Threading.Tasks
, которые используются для предоставления произвольных асинхронных операций. TAP — это рекомендуемый асинхронный шаблон для разработки новых компонентов. Очень важно понимать разницу между потоком (Thread) и задачей (Task), которые сильно отличаются. Thread (поток) представляет собой инкапсуляцию потока выполнения, в то время как Task является работой (или просто асинхронной операцией), которая может быть выполнена параллельно. Для выполнения задачи используется свободный поток из пула потоков. По завершении работы поток будет возвращен обратно в пул, а пользователь класса получит результат задачи. Если вам нужно запустить длительную операцию и вы не хотите надолго блокировать один из потоков пула, то можете это сделать при помощи параметра TaskCreationOptions.LongRunning. Создавать и запускать задачи можно разными способами, и часто непонятно, какой из них выбрать. Разница, в основном, лишь в удобстве использования и количестве параметров с настройками, которые доступны в том или ином способе. В последних версиях фреймворка появились новые возможности на основе все тех же задач, которые упрощают написание асинхронного кода и делают его более читабельным и понятным. Для этого введены новые ключевые слова async и await, которыми помечаются асинхронные методы и их вызовы. Асинхронный код становится очень похожим на синхронный: мы просто вызываем нужную операцию и весь код, который следует за ее вызовом, автоматически будет завернут в некий «колбек», который вызовется после завершения асинхронной операции. Также данный подход позволяет обрабатывать исключения в синхронной манере; явно дожидаться завершения операции; определять действия, которые должны быть выполнены, и соответствующие условия. Например, мы можем добавить код, который будет выполнен только в том случае, если в асинхронной операции было сгенерировано исключение. Но не все так просто, даже несмотря на массу информации на эту тему.
async\await
Рассмотрим основные рекомендации по использованию этих ключевых слов, а также некоторые интересные примеры. Чаще всего рекомендуется использовать асинхронности «от начала до конца». Это подразумевает использование только одного подхода в конкретном вызове или функциональном блоке, не смешивайте синхронные вызовы с асинхронными. Классический пример данной проблемы:
public static class DeadlockDemo
{
private static async Task DelayAsync()
{
await Task.Delay(1000);
}
public static void Test()
{
var delayTask = DelayAsync();
delayTask.Wait();
}
}
Данный код отлично работает в консольном приложении, но при вызове метода DeadlockDemo.Test() из GUI потока возникнет взаимоблокировка. Это связано с тем, как await обрабатывает контексты. По умолчанию, когда ожидается незавершенный Task, текущий контекст захватывается и используется для возобновления метода по окончании выполнения задачи. Контекстом является текущий SynchronizationContext, если только он не равен null, как в случае с консольными приложениями. Там это текущий TaskScheduler (контекст пула потоков). GUI- и ASP.NET-приложения имеют SynchronizationContext, который разрешает единовременно выполнять только одну порцию кода. Когда выражение await завершает выполнение, оно пытается выполнить остальную часть async-метода в рамках захваченного контекста. Но он уже имеет поток, который (синхронно) ожидает завершения async-метода. Получается, что каждый из них ждет друг друга, вызывая взаимоблокировку.
Также рекомендуется избегать конструкций вида async void (асинхронный метод, который ничего не возвращает). Async-методы могут возвращать значения Task,
Task<ТResult>
и void. Последний вариант был оставлен для поддержки обратной совместимости и позволяет добавлять асинхронные обработчики событий. Но стоит помнить про некоторые специфичные отличия подобных методов, а именно:- Исключения нельзя перехватить стандартными средствами
- Поскольку подобные методы не возвращают задачу, то мы ограничены в работе с такими конструкциями. К примеру, мы не сможем ожидать завершения подобных задач стандартными средствами или создать цепочку выполнения, как в случае с объектами Task.
- Подобные методы сложно тестировать, так как они имеют различия в обработке ошибок и композиции.
Всегда старайтесь конфигурировать контекст, когда это возможно. Как уже говорилось, код внутри асинхронного метода после вызова await будет требовать контекст синхронизации, в котором он был вызван. Это очень полезная возможность, особенно в GUI приложениях, но иногда это не обязательно. Например, когда коду не нужно обращаться к элементам пользовательского интерфейса. Предыдущий пример с дэдлоком можно легко исправить, изменив всего лишь одну строку:
await Task.Delay(1000).ConfigureAwait(false);
Данная рекомендация очень актуальна при разработке каких-либо библиотек, которые ничего не знают про GUI.
Рассмотрим еще несколько примеров применения новых ключевых слов, а также некоторые особенности их использования:
1)
private static async Task Test()
{
Thread.Sleep(1000);
Console.Write("work");
await Task.Delay(1000);
}
private static void Demo()
{
var child = Test();
Console.Write("started");
child.Wait();
Console.Write("finished");
}
На экране сначала появится «work», затем «started», и только потом «finished». На первый взгляд кажется, что первым должно быть выведено слово «started». Не забывайте, что в данном коде присутствует проблема с дэдлоком, которую мы рассмотрели. Это связано с тем, что метод, помеченный ключевым словом async, не запускает дополнительных потоков и обрабатывается синхронно до тех пор, пока не встретит внутри ключевое слово await. Только после этого будет создан новый объект типа Task и запущена отложенная задача. Чтобы исправить данное поведение в приведенном примере, достаточно заменить строку с Thread.Sleep(…) на await Task.Delay(…).
2)
async Task Demo()
{
Console.WriteLine("Before");
Task.Delay(1000);
Console.WriteLine("After");
}
Можно предположить, что мы будем ожидать 1 секунду перед вторым выводом на экран, но это не так — оба сообщения будут выведены без задержек. Это связано с тем, что метод Task.Delay(), как и многие другие асинхронные методы, возвращает объект типа Task, но мы проигнорировали эту задачу. Мы не ожидаем ее завершения ни одним из возможных способов, что влечет за собой немедленное выведение на экран обоих сообщений.
3)
Console.WriteLine("Before");
await Task.Factory.StartNew(async () => { await Task.Delay(1000); });
Console.WriteLine("After");
Как и в прошлом примере, вывод на экран не будет приостановлен на одну секунду. Это связано с тем, что метод StartNew() принимает делегат и возвращает
Task<Т>
, где T — это тип, возвращаемый делегатом. В примере наш делегат возвращает Task. В итоге мы получаем результат в виде Task<Тask>
. Использование слова await «ожидает» только завершения внешней задачи, которая сразу же возвращает внутренний Task, созданный в делегате, который далее игнорируется. Исправить данную проблему можно, переписав код следующим образом:await Task.Run(async () => { await Task.Delay(1000); });
4)
async Task TestAsync()
{
await Task.Delay(1000);
}
void Handler()
{
TestAsync().Wait();
}
Несмотря на использование ключевых слов, данный код не является асинхронным и выполняется синхронно, потому что мы создаем задачу и явно ожидаем ее выполнения. В данном случае вызывающий поток заблокирован и ожидает завершения запущенной задачи.
Заключение
Как видите, у разработчиков имеется довольно много возможностей для работы с многопоточными приложениями. Важно не только знать теорию, но и уметь применять эффективные подходы для решения конкретных задач. Например, использование класса Thread почти однозначно говорит о том, что у вас устаревший код в проекте, хотя вероятность возникновения необходимости его использования весьма мала. В обычных ситуациях использование пула всегда оправданно, по понятным причинам.
Использование многопоточности в приложениях с GUI обычно влечет за собой дополнительные ограничения, не забывайте о них!
Также стоит помнить и про другие готовые реализации, такие как потокобезопасные коллекции. Это избавляет от написания дополнительного кода и предотвращает возможные ошибки реализации. Ну и не забывайте про особенности новых ключевых слов.