Параллельное программирование *

Распараллеливаем вычисления

@xorbot 8 мая 2014 в 09:50

Асинхронные задачи в С++11

5 мин

35K

Параллельное программирование * C++ * Программирование *

Доброго времени суток, хотел бы поделиться с сообществом своей небольшой библиотектой.
Я программирую на С/C++, и, к сожалению, в рабочих проектах не могу использовать стандарт C++11. Но вот пришли майские праздники, появилось свободное время и я решил поэкспериментировать и по-изучать этот запретный плод. Самое лучшее для изучения чего либо — это практика. Чтение статей о языке программирования научит максимум лучше читать, поэтому я решил написать маленькую библиотеку для асинхронного выполнения функций.
Сразу оговорюсь, что я знаю, что существует std::future, std::async и тп. Мне было интересно реализовать самому нечто подобное и окунуться в мир лямбда-функций, потоков и мьютексов с головой. Праздники — отличное время для велопрогулок.

Читать дальше →

+31

@JIghtuse 4 мая 2014 в 22:00

Транзакционная память: история и развитие

14 мин

49K

Высоконагруженные системы * C++ * Параллельное программирование *

Определение

Параллельное программирование сложно. При использовании систем с общей памятью не обойтись без синхронизации доступа параллельных процессов/потоков к общему ресурсу (памяти). Для этого используются:

блокировки (mutex);
алгоритмы без блокировки (lockless, lock-free);
транзакционная память.

Транзакционная память — технология синхронизации конкурентных потоков. Она упрощает параллельное программирование, выделяя группы инструкций в атомарные транзакции. Конкурентные потоки работают параллельно¹, пока не начинают модифицировать один и тот же участок памяти. К примеру, операции добавления узлов в красно-чёрное дерево (анимация в заголовке) способны работать параллельно в нескольких потоках.

Скрытый текст

/* Move item from one list to another */
int move(list *from, list *to) {
    __transaction_atomic {
        node *n = pop(from);
        push(to, n);
    }
}

Читать дальше →

+76

@alexmayorov 25 апр 2014 в 19:31

Проба пера на суперкомпьютере Ломоносов

2 мин

42K

C * Математика * Параллельное программирование *

Из песочницы

В этом посте я хочу рассказать о своём опыте расчётов на суперкомпьютере Ломоносов. Я расскажу о решении задачи, честно говоря, для которой не нужно использовать СК, но академический интерес превыше всего. Подробную информацию о

Читать дальше →

+42

@Atakua 25 апр 2014 в 04:50

Потоки — это Goto параллельного программирования

6 мин

39K

Блог компании IntelПрограммирование * Параллельное программирование *

Сразу раскрою мысль, вынесенную в заголовок. Использование потоков (также именуемых нити, треды, англ. threads) и средств прямой манипуляции ими (создание, уничтожение, синхронизация) для написания параллельных приложений оказывает столь же пагубное влияние на сложность алгоритмов, качество кода и скорость его отладки, какое вносило использование оператора Goto в последовательных программах.
Как когда-то программисты отказались от неструктурированных переходов, нам необходимо отказаться от прямого использования потоков сейчас и в будущем. И так же, как каждый из нас использует структурные блоки вместо Goto, вместо потоков должны использоваться структуры, построенные поверх них. Благо, все инструменты для этого появились во вполне традиционных языках.

^{Автор фото: Rainer Zenz}

Читать дальше →

+49

@PsyHaSTe 17 апр 2014 в 19:17

Доступен новый JIT: теперь с поддержкой SIMD

10 мин

15K

.NET * C# * Параллельное программирование *

Перевод

От переводчика

Лично я просто невероятно обрадовался новой возможности. Как раз не так давно одолел Pro .Net Perfomance, в которой одна из глав была посвящена параллельности, и векторизации в частности. Вывод, сделанный авторами: «К сожалению, использование векторизации возможно исключительно на С++, выполнение кода на видеокарте — возможно и средствами .Net, однако C++ AMP оставляет любые управляемые библиотеки GPGPU далеко позади, поэтому, к сожалению, в данных задачах рекомендуем использовать подключаемые C++ сборки.» Поэтому рад сообщить, что по крайней мере одна проблема решена. Что ж, приступим!

Читать дальше →

+32

@A_Kochurov 16 апр 2014 в 08:00

Утечка памяти с ThreadLocal

3 мин

20K

Блог компании «Maxifier Development»Java * Параллельное программирование *

Дамы и господа, хочу поделиться с вами знатным способом выстрелить себе в ногу, которым я снес себе одну конечность по колено, хоть и мнил себя экспертом в области concurrency-библиотеки. Но подвела меня такая простая штука, как ThreadLocal, нежданно-негаданно бесследно поглотив пару лишних гигабайт памяти сервера.

Безусловно, памяти ваших серверов можно найти лучшее применение, чем хранение мусора. Поэтому не повторяйте мою ошибку. А именно: не стоит пытаться хранить в ThreadLocal ссылки на этот самый ThreadLocal, или на какой-то граф объектов, в конечном итоге ссылающийся на этот самый ThreadLocal.

Как же так?!

+30

@YouraEnt 23 янв 2014 в 21:35

Будущее программирования аппаратных ускорителей

10 мин

20K

Высоконагруженные системы * GPGPU * Параллельное программирование *

Из песочницы

Многие из новейших суперкомпьютеров основаны на аппаратных ускорителях вычислений (accelerator). включая две самые быстрые системы согласно TOP500 от 11/2013. Ускорители распространяются так же и на обычных PC и даже появляются в портативных устройствах, что ещё больше способствовует росту интереса к программированию ускорителей.

Такое широкое применение ускорителей является результатом их высокой производительности, энергоэффективности и низкой стоимости. Например, если сравнить Xeon E5-2687W и GTX 680, выпущенные в марте 2012, мы увидим, что GTX 680 в четыре раза дешевле, имеет в 8 раз большую производительность операций одинарной точности и в 4 раза большую пропускную способность памяти, а так же обеспечивает более 30 раз большую производительность в пересчёте на доллар и в 6 раз большую производительность на ватт. Исходя из таких сравнительных результатов, ускорители должны бы использоваться везде и всегда. Почему же этого не происходит?

Читать дальше →

+32

@alizar 10 янв 2014 в 11:56

Вышел Rust 0.9

2 мин

19K

Программирование * Параллельное программирование * Rust *

Mozilla выпустила новую версию компилятора Rust 0.9 и соответствующих инструментов.

Rust — это компилируемый и мультипарадигмальный язык для системного программирования, который позиционируется как альтернатива С/С++. Визуально он похож на C, но отличается в деталях синтаксиса и семантики. Идеально подходит для параллельных вычислений.

Разработчики говорят о существенном улучшении рантайма и подсистемы ввода-вывода. Так, в компиляторе появились статические ссылки и поддерживается оптимизация во время линковки (link-time). В языке уменьшено количество разных видов замыканий, чтобы упростить и сделать более логичным синтаксис.

Читать дальше →

+36

@ivorobts 18 дек 2013 в 09:23

«Задачка-то сошлась с ответом!»

4 мин

34K

Блог компании IntelПрограммирование * Параллельное программирование *

Я очень часто по работе слышу вопрос, задаваемый из, большей частью, академической среды, ввиду огромного количества выполняемых вычислений именно там: «Почему наши результаты разные от запуска к запуску одного и того же приложения? Мы же ничего не меняем в нем». Стоит отметить, разговор про это уже был, но лишь частично отвечающий на вопрос. Попробую рассказать про эту проблему ещё чуть-чуть.

Читать дальше →

+47

@etyumentcev 17 дек 2013 в 01:04

Модели акторов 40 лет

9 мин

23K

Блог компании LLC Tik-Tok CoachПараллельное программирование * Программирование *

Высоконагруженные системы, построенные по модели акторов – это тренд сегодняшнего времени. Вот далеко неполный перечень статей на хабре, в которых, в той или иной степени, упоминается данная модель или одна из ее реализаций, например,1, 2, 3, 3, 4, 5, 6, 7. Есть хорошая статья в википедии, рассказывающая про акторы. К сожалению, после ее прочтения, у меня осталось много вопросов, ответы на которые я смог найти только в первоисточниках. Результаты этого обзора я и хочу представить Вашему вниманию.

Читать дальше →

+29

@atomlib 5 дек 2013 в 15:30

Мультипроцессовый Firefox

3 мин

44K

FirefoxПараллельное программирование *

C января этого года Билл Макклоски вместе с Дэвидом Андерсоном работали над тем, чтобы сделать «Файерфокс» мультипроцессовым, в этом им помогали Том Шустер (evilpie), Фелипе Гомез и Марк Хаммонд. И теперь настал момент, когда они хотели бы узнать мнение сообщества о проделанной работе.

В «Файерфоксе» всегда использовалась однопроцессовая модель построения. Интерес к изменениям в области распараллеливания подстегнул выход браузера «Хром», в нём использовались один процесс для интерфейса и отдельные процессы для работы с контентом веб-страниц. (Тем не менее за шесть месяцев до «Хрома» несколько процессов начал использовать «Интернет эксплорер 8».) Вскоре, примеру «Хрома» последовали и некоторые другие браузеры, «Мозилла» начала проект Electrolysis для адаптации движка «Гекко» к использованию нескольких процессов.

Что вынуждает «Мозиллу» переключаться на подобную модель построения своего браузера? В первую очередь это производительность и отзывчивость. Основной целью является уменьшение подвисания (jank), проявляющегося при стандартных операциях — загрузке особенно крупной страницы, наборе текста в веб-форме или прокрутке перегруженной элементами страницы.

Читать дальше →

+59

@ivorobts 4 дек 2013 в 08:22

Ждали, ждали и дождались! OpenMP 4.0

5 мин

23K

Блог компании IntelКомпиляторы * Параллельное программирование *

Каждая новая спецификация OpenMP вводит очень полезные и необходимые дополнения к уже существующему функционалу. Например, в версии 3.0 были добавлены так ожидаемые задачи (tasks), позволившие решать ещё больший спектр задач по распараллеливанию приложений. В 3.1 целый ряд улучшений по работе с задачами и редукциями.

Но по сравнению с тем, что нам теперь даёт стандарт 4.0, предыдущие нововведения кажутся какими-то мелкими. Последняя версия расширила типы поддерживаемого параллелизма, чего раньше никогда не замечалось.

Поясню, что я хочу сказать.

+30

@krogozh 2 дек 2013 в 05:24

Профилировка производительности OpenMP приложений

7 мин

7.2K

Блог компании IntelВысоконагруженные системы * Параллельное программирование *

OpenMP – пожалуй, самая распространённая модель параллельного программирования на потоках, на системах с общей памятью. Ценят её за высокоуровневые параллельные конструкции (в сравнении с программированием системных потоков) и поддержку разными производителями компиляторов. Но этот пост не про сам стандарт OpenMP, про него есть много материалов в сети.

Распараллеливают вычисления на OpenMP ради производительности, о чём, собственно, и статья. Точнее, об измерении производительности с помощью Intel VTune Amplifier XE. А именно, как получить информацию о:

Получении профиля всего OpenMP приложения
Профиле отдельных параллельных регионов OpenMP (время CPU, горячие функции и т.д.)
Балансе работы внутри отдельного параллельного региона OpenMP
Балансе параллельного/последовательного кода
Уровне гранулярности параллельных задач
Объектах синхронизации, времени ожидания и передачах управления между потоками

Узнать больше о профилировке OpenMP

+25

@tangro 27 ноя 2013 в 09:51

Resumable функции

11 мин

26K

Блог компании Инфопульс УкраинаПараллельное программирование * C++ *

Туториал

Перевод

На прошлой неделе в мире С++ произошло интересное событие. Компания Microsoft объявила о выходе обновления к компилятору С++ в Visual Studio 2013. Само по себе обновление компилятора отдельно от Visual Studio или её сервис-пака — уже нетривиальное для Microsoft событие. Но ещё интереснее то, что вошло в это обновление. Полный список можно почитать по ссылке выше, а я остановлюсь только на одном моменте — resumable функции. Для полного понимания ситуации: Microsoft изрядно протроллила и комитет по стандартизации С++ и разработчиков gcc\clang, выпустив (тут надо внимательно) реализацию экспериментальной и не утверждённой ещё возможности будущего стандарта C++17, основанной на экспериментальных и не утверждённых ещё возможностях будущего стандарта C++14, которые в свою очередь являются исправлениями не сильно ещё вошедших в повседневное программирование возможностей С++11.

Достаточно гиковский ход, не находите?

А ниже будет перевод статьи с meetingcpp.com, рассказывающей о том, что это за фича и как её использовать.

Читать дальше →

+53

@vovochkin 2 окт 2013 в 12:14

Эдвард руки — С++

10 мин

55K

C++ * Системное программирование * Параллельное программирование *

Перевод

Я искал, с чем бы сравнить программирование на С++ и я вспомнил фильм 1990 года режиссера Тима Бертона — «Эдвард руки-ножницы»

+84

217

@exeditor 29 сен 2013 в 14:00

Нагружаем Node под завязку (2-я из 12 статей о Node.js от команды Mozilla Identity)

7 мин

19K

Блог компании НордавиндNode.JS * Параллельное программирование *

Туториал

Перевод

От переводчика: Это вторая статья из цикла о Node.js от команды Mozilla Identity, которая занимается проектом Persona. Эта статья написана по мотивам выступления Ллойда Хилайеля на конференции Node Philly 2012 в Филадельфии.

Все статьи цикла:

"Охотимся за утечками памяти в Node.js"

"Нагружаем Node под завязку"

"Храним сессии на клиенте, чтобы упростить масштабирование приложения"

"Производительность фронтэнда. Часть 1 — конкатенация, компрессия, кэширование"

"Пишем сервер, который не падает под нагрузкой"

"Производительность фронтэнда. Часть 2 — кешируем динамический контент с помощью etagify"

"Приручаем конфигурации веб-приложений с помощью node-convict"

"Производительность фронтенда. Часть 3 — оптимизация шрифтов"

"Локализация приложений Node.js. Часть 1"

"Локализация приложений Node.js. Часть 2: инструментарий и процесс"

"Локализация приложений Node.js. Часть 3: локализация в действии"

"Awsbox — PaaS-инфраструктура для развёртывания приложений Node.js в облаке Amazon"

Процесс Node.js выполняется на единственном ядре процессора, так что построение масштабируемого сервера на Node требует особой заботы. Благодаря возможности писать нативные расширения и продуманному набору API для управления процессами, есть несколько разных способов заставить Node выполнять код параллельно. Мы рассмотрим их в этой статье.

Кроме того, мы представим модуль compute-cluster — маленькую библиотеку, которая облегчает управление коллекцией процессов для выполнения распределённых вычислений.

Постановка задачи

Для Persona нам было необходимо создать сервер, который справился бы с обработкой множества запросов со смешанными характеристиками. Мы выбрали для этой цели Node.js. Нам надо было обрабатывать два основных типа запросов: «интерактивные», которые не требовали сложных вычислений и должны были выполняться быстро, чтобы интерфейс приложения был отзывчивым, и «пакетные», которые отнимали примерно пол-секунды процессорного времени и могли быть ненадолго отложены без ущерба для удобства пользователя.

В поисках наилучшей архитектуры приложения мы долго и тщательно обдумывали способы обработки этих типов запросов с учётом юзабилити и стоимости масштабирования и в конце концов сформулировали четыре основных требования:

Насыщение. Наше решение должно было использовать все доступные ядра процессора.
Отзывчивость. Пользовательский интерфейс должен оставаться отзывчивым. Всегда.
Отказоустойчивость. Когда нагрузка зашкаливает, мы должны нормально обслужить столько клиентов, сколько сможем, а остальным показать сообщение об ошибке.
Простота. Решение должно легко и постепенно интегрироваться в уже работающий сервер.

Вооружившись этими требованиями, мы можем осмысленно сравнивать разные подходы.

Читать дальше →

+36

@kaapython 30 авг 2013 в 07:13

Ключевые возможности Rust

18 мин

32K

Программирование * Параллельное программирование * Rust *

Recovery Mode

Rust — новый язык программирования, разрабатываемый корпорацией Mozilla. Главная цель разработчиков — создание безопасного практичного языка для параллельных вычислений. Первая версия языка была написана Грэйдоном Хором в 2006 году, а в 2009 году к разработке подключилась Mozilla. С тех пор изменения претерпел и сам компилятор, изначально написанный на OCaml: он был успешно переписан на Rust с использованием LLVM в качестве back-end.

Основным продуктом, разрабатываемым на Rust, является новый веб-движок Servo, разработка которого также ведется Mozilla. В 2013 году к разработке Rust и Servo присоединилась корпорация Samsung Electronics, при активном участии которой код движка Servo был портирован на ARM архитектуру. Поддержка языка столь серьезными игроками IT индустрии не может не радовать и дает надежду на его дальнейшее активное развитие и совершенствование.

Язык Rust просто не может не понравится системным и сетевым разработчикам, тем, кому по работе приходится писать много кода, производительность которого критична, на C и C++, потому что:

Rust ориентирован на разработку безопасных приложений. Сюда входит безопасная работа с памятью: отсутствие null-указателей, контроль за использованием не инициализированных и деинициализированных переменных; невозможность совместного использования разделяемых состояний несколькими задачами; статический анализ времени жизни указателей.
Rust ориентирован на разработку параллельных приложений. В нем реализована поддержка легких (зеленых) потоков, асинхронного обмена сообщениями без копирования пересылаемых данных, возможность выбора размещения объектов на стеке, в локальной куче задачи или куче, разделяемой между задачами.
Rust ориентирован на разработку эффективных по скорости и памяти приложений. Использование LLVM в качестве back-end позволяет производить компиляцию приложения в нативный код, а простой интерфейс взаимодействия с C кодом – легко использовать уже имеющиеся высокопроизводительные библиотеки.
Rust ориентирован на разработку кросс-платформенных приложений. Компилятор официально поддерживается на платформах Windows, Linux и Mac OS X, при этом существуют порты на другие *NIX платформы, такие как FreeBSD. Также поддерживается и несколько архитектур процессоров: i386, x64 и ARM.
Rust позволяет писать в разных стилях: объектно-ориентированном, функциональном, actor-based, императивном.
Rust поддерживает уже существующие отладочные инструменты: GDB, Valgrind, Instruments.

Читать дальше →

+54

@RainM 30 авг 2013 в 04:11

OpenMP теперь доступен в Clang!

2 мин

7.1K

Блог компании IntelКомпиляторы * Параллельное программирование *

Скоро первое сентября. Кто-то собирается в школу, кто-то — в институт. А мы предлагаем начать новые проекты с компилятором clang, который теперь поддерживает OpenMP!

Проект доступен здесь. Сейчас в его основе лежит clang 3.3. Небыстрый процесс ревью уже идет, и скоро код будет залит в транк clang'а, а значит войдет в его новые релизы.

Реализована полная поддержка стандарта OpenMP версии 3.1. Успешно проходятся следующие тесты: набор для валидации OpenMP от OpenUH Research Compiler, SPEC OMP2012 и внутренние тесты Intel. Исполняемый код c OpenMP, собранный clang'ом, демонстрирует производительность, сравнимую с другими компиляторами, поддерживающими OpenMP.
В качестве библиотеки времени выполнения использована библиотека Intel OpenMP Runtime Library, также доступная под свободной лицензией.

Читать дальше →

+27

@awolf 19 авг 2013 в 08:25

Как работает GIL в Ruby. Часть 1

6 мин

25K

Ruby * Программирование * Параллельное программирование *

Перевод

Пять из четырех разработчиков признают, что многопоточное программирование понять непросто.

Большую часть времени, что я провел в Ruby-сообществе, печально известная GIL оставалась для меня темной лошадкой. В этой статье я расскажу о том, как наконец познакомился с GIL поближе.

Первое, что я услышал о GIL, никак не было связано с тем, как она работает или для чего нужна. Все, что я услышал — что GIL — это плохо, поскольку ограничивает параллелизм, или то, что это хорошо, потому что делает код потокобезопасным. Пришло время, я приноровился к многопоточному программированию и понял, что на самом деле все сложнее.

Я хотел знать, как работает GIL с технической точки зрения. На GIL нет ни спецификации, ни документации. По сути, это особенность MRI (Matz's Ruby Implementation). Команда разработчиков MRI ничего не говорит по поводу того, как GIL работает и что гарантирует.

Впрочем, я забегаю вперед.

Читать дальше →

+40

@tangro 13 авг 2013 в 08:22

Шпаргалка по параллелизму в С++

1 мин

26K

Блог компании Инфопульс УкраинаC++ * Параллельное программирование *

Туториал

Перевод

Оригинальный pdf (на английском)
Переведённый pdf (на русском)

+71

1 2 ...

6 7

Параллельное программирование *

Асинхронные задачи в С++11

Транзакционная память: история и развитие

Определение

Проба пера на суперкомпьютере Ломоносов

Потоки — это Goto параллельного программирования

Доступен новый JIT: теперь с поддержкой SIMD

От переводчика

Утечка памяти с ThreadLocal

Будущее программирования аппаратных ускорителей

Вышел Rust 0.9

«Задачка-то сошлась с ответом!»

Модели акторов 40 лет

Мультипроцессовый Firefox

Ждали, ждали и дождались! OpenMP 4.0

Профилировка производительности OpenMP приложений

Ближайшие события

Resumable функции

Эдвард руки — С++

Нагружаем Node под завязку (2-я из 12 статей о Node.js от команды Mozilla Identity)

Постановка задачи

Ключевые возможности Rust

OpenMP теперь доступен в Clang!

Как работает GIL в Ruby. Часть 1

Шпаргалка по параллелизму в С++

Вклад авторов