Параллельное программирование *

Распараллеливаем вычисления

Статьи Посты Новости Авторы Компании

HellBrick 20 окт 2014 в 10:04

AsyncCollections: история одного велосипеда

15 мин

17K

.NET*C#*Параллельное программирование*

Из песочницы

С давних времён я был большим поклонником System.Collections.Concurrent и BlockingCollection в особенности. Сколько раз это чудо инженерной мысли выручало в самых разнообразнейших ситуациях — не счесть.

С чуть менее давних времён в обиход прочно вошли async/await. Казалось бы, жизнь прекрасна, но есть одно «но»: асинхронный код миксовать с блокирующим кодом как-то не очень-то хочется. А BlockingCollection, как несложно догадаться (хотя бы из названия), в ряде случаев поток блокирует.

Что же делать?

+25

sidristij 2 окт 2014 в 12:12

Ручное клонирование потока. Когда Assembler + C# = Love

3 мин

20K

Блог компании Семинары Станислава СидристогоНенормальное программирование*Параллельное программирование*

Перейду сразу к делу. Задача: в любой точке кода путем вызова спец. метода создать второй поток, который начнет выполнение с точки вызова этого метода в родительском потоке, сохранив возможность отладки и значения всех локальных переменных на всех уровнях вызовов методов.

Реализация не зависит от конечной платформы (.Net/Java), т.к. написана на C++/Asm, однако пользовательский код сделан на C#, т.к. на нем пишу я.

Теперь, когда я наконец стабилизировал пример для 32-разрядных систем, набравшись храбрости, готов показать его общественности как полностью готовый. И, да, повторюсь: при адаптации будет работать на любой платформе

Для начала, полный список выложенных на Хабре статей данного цикла

Делаем отгружаемые сборки: взаимодействуем между доменами без маршаллинга

Получение указателя на объект .Net

Ручное клонирование потока. Когда Assembler + C# или Java = Love

Изменение кода системных сборок или «утечка» .Net Framework 5.0

Как работает декомпиляция в .Net или Java на примере .Net

Продолжаем кромсать CLR: пул объектов .Net вне куч SOH/LOH

Снимаем дамп объектов с памяти .Net приложения

Читать дальше →

+29

alec_kalinin 30 сен 2014 в 17:21

И еще раз о GIL в Python

9 мин

37K

Python*Параллельное программирование*

Из песочницы

Предисловие

Область, в которой мне повезло работать, называется вычислительная электрофизиология сердца. Физиология сердечной деятельности определяется электрическими процессами, происходящими на уровне отдельных клеток миокарда. Эти электрические процессы создают электрическое поле, которое достаточно легко измерить. Более того оно очень неплохо описывается в рамках математических моделей электростатики. Тут и возникает уникальная возможность строго математически описать работу сердца, а значит — и усовершенствовать методы лечения многих сердечных заболеваний.

За время работы в этой области у меня накопился некоторый опыт использования различных вычислительных технологий. На некоторые вопросы, которые могут быть интересны не только мне, я постараюсь отвечать в рамках этой публикации.

Читать дальше →

+71

seweb 12 авг 2014 в 02:36

Rust на примерах. Часть 1

7 мин

49K

Программирование*Параллельное программирование*Rust*

Туториал

Перевод

Этот цикл статей является вольным переводом книги «Rust by Example», которую пишет Хорхе Апарисио на Github.

На момент написания этого топика автор книги создал 49 глав, в первой части будет перевод первых пяти. Убедитесь, что Rust установлен и под рукой имеется документация.

Давайте начинать!

Читать дальше →

+39

0x0FFF 15 мая 2014 в 00:29

Консенсус в распределенных системах. Paxos

7 мин

40K

Анализ и проектирование систем*Алгоритмы*Параллельное программирование*Распределённые системы*

В последнее время в научных публикациях всё чаще упоминается алгоритм достижения консенсуса в распределенных системах под названием Paxos. Среди таких публикаций ряд работ сотрудников Google (Chubby, Megastore, Spanner) ранее уже частично освещенных на хабре, архитектуры систем WANdisco, Ceph и пр. В то же время, сам алгоритм Paxos считается сложным для понимания, хоть и основывается он на элементарных принципах.

В этой статье я постараюсь исправить эту ситуацию и рассказать об этом алгоритме понятным языком, как когда-то это попытался сделать автор алгоритма Лесли Лэмпорт.

+27

xorbot 8 мая 2014 в 13:50

Асинхронные задачи в С++11

5 мин

34K

Программирование*C++*Параллельное программирование*

Доброго времени суток, хотел бы поделиться с сообществом своей небольшой библиотектой.
Я программирую на С/C++, и, к сожалению, в рабочих проектах не могу использовать стандарт C++11. Но вот пришли майские праздники, появилось свободное время и я решил поэкспериментировать и по-изучать этот запретный плод. Самое лучшее для изучения чего либо — это практика. Чтение статей о языке программирования научит максимум лучше читать, поэтому я решил написать маленькую библиотеку для асинхронного выполнения функций.
Сразу оговорюсь, что я знаю, что существует std::future, std::async и тп. Мне было интересно реализовать самому нечто подобное и окунуться в мир лямбда-функций, потоков и мьютексов с головой. Праздники — отличное время для велопрогулок.

Читать дальше →

+32

JIghtuse 5 мая 2014 в 02:00

Транзакционная память: история и развитие

14 мин

47K

Высокая производительность*C++*Параллельное программирование*

Определение

Параллельное программирование сложно. При использовании систем с общей памятью не обойтись без синхронизации доступа параллельных процессов/потоков к общему ресурсу (памяти). Для этого используются:

блокировки (mutex);
алгоритмы без блокировки (lockless, lock-free);
транзакционная память.

Транзакционная память — технология синхронизации конкурентных потоков. Она упрощает параллельное программирование, выделяя группы инструкций в атомарные транзакции. Конкурентные потоки работают параллельно¹, пока не начинают модифицировать один и тот же участок памяти. К примеру, операции добавления узлов в красно-чёрное дерево (анимация в заголовке) способны работать параллельно в нескольких потоках.

Скрытый текст

/* Move item from one list to another */
int move(list *from, list *to) {
    __transaction_atomic {
        node *n = pop(from);
        push(to, n);
    }
}

Читать дальше →

+77

alexmayorov 25 апр 2014 в 23:31

Проба пера на суперкомпьютере Ломоносов

2 мин

41K

C*Математика*Параллельное программирование*

Из песочницы

В этом посте я хочу рассказать о своём опыте расчётов на суперкомпьютере Ломоносов. Я расскажу о решении задачи, честно говоря, для которой не нужно использовать СК, но академический интерес превыше всего. Подробную информацию о

Читать дальше →

+43

Atakua 25 апр 2014 в 08:50

Потоки — это Goto параллельного программирования

6 мин

39K

Блог компании IntelПрограммирование*Параллельное программирование*

Сразу раскрою мысль, вынесенную в заголовок. Использование потоков (также именуемых нити, треды, англ. threads) и средств прямой манипуляции ими (создание, уничтожение, синхронизация) для написания параллельных приложений оказывает столь же пагубное влияние на сложность алгоритмов, качество кода и скорость его отладки, какое вносило использование оператора Goto в последовательных программах.
Как когда-то программисты отказались от неструктурированных переходов, нам необходимо отказаться от прямого использования потоков сейчас и в будущем. И так же, как каждый из нас использует структурные блоки вместо Goto, вместо потоков должны использоваться структуры, построенные поверх них. Благо, все инструменты для этого появились во вполне традиционных языках.

^{Автор фото: Rainer Zenz}

Читать дальше →

+50

PsyHaSTe 17 апр 2014 в 23:17

Доступен новый JIT: теперь с поддержкой SIMD

10 мин

15K

.NET*C#*Параллельное программирование*

Перевод

От переводчика

Лично я просто невероятно обрадовался новой возможности. Как раз не так давно одолел Pro .Net Perfomance, в которой одна из глав была посвящена параллельности, и векторизации в частности. Вывод, сделанный авторами: «К сожалению, использование векторизации возможно исключительно на С++, выполнение кода на видеокарте — возможно и средствами .Net, однако C++ AMP оставляет любые управляемые библиотеки GPGPU далеко позади, поэтому, к сожалению, в данных задачах рекомендуем использовать подключаемые C++ сборки.» Поэтому рад сообщить, что по крайней мере одна проблема решена. Что ж, приступим!

Читать дальше →

+33

A_Kochurov 16 апр 2014 в 12:00

Утечка памяти с ThreadLocal

3 мин

19K

Блог компании «Maxifier Development»Java*Параллельное программирование*

Дамы и господа, хочу поделиться с вами знатным способом выстрелить себе в ногу, которым я снес себе одну конечность по колено, хоть и мнил себя экспертом в области concurrency-библиотеки. Но подвела меня такая простая штука, как ThreadLocal, нежданно-негаданно бесследно поглотив пару лишних гигабайт памяти сервера.

Безусловно, памяти ваших серверов можно найти лучшее применение, чем хранение мусора. Поэтому не повторяйте мою ошибку. А именно: не стоит пытаться хранить в ThreadLocal ссылки на этот самый ThreadLocal, или на какой-то граф объектов, в конечном итоге ссылающийся на этот самый ThreadLocal.

Как же так?!

+31

YouraEnt 24 янв 2014 в 01:35

Будущее программирования аппаратных ускорителей

10 мин

20K

Высокая производительность*GPGPU*Параллельное программирование*

Из песочницы

Многие из новейших суперкомпьютеров основаны на аппаратных ускорителях вычислений (accelerator). включая две самые быстрые системы согласно TOP500 от 11/2013. Ускорители распространяются так же и на обычных PC и даже появляются в портативных устройствах, что ещё больше способствовует росту интереса к программированию ускорителей.

Такое широкое применение ускорителей является результатом их высокой производительности, энергоэффективности и низкой стоимости. Например, если сравнить Xeon E5-2687W и GTX 680, выпущенные в марте 2012, мы увидим, что GTX 680 в четыре раза дешевле, имеет в 8 раз большую производительность операций одинарной точности и в 4 раза большую пропускную способность памяти, а так же обеспечивает более 30 раз большую производительность в пересчёте на доллар и в 6 раз большую производительность на ватт. Исходя из таких сравнительных результатов, ускорители должны бы использоваться везде и всегда. Почему же этого не происходит?

Читать дальше →

+34

alizar 10 янв 2014 в 15:56

Вышел Rust 0.9

2 мин

18K

Программирование*Параллельное программирование*Rust*

Mozilla выпустила новую версию компилятора Rust 0.9 и соответствующих инструментов.

Rust — это компилируемый и мультипарадигмальный язык для системного программирования, который позиционируется как альтернатива С/С++. Визуально он похож на C, но отличается в деталях синтаксиса и семантики. Идеально подходит для параллельных вычислений.

Разработчики говорят о существенном улучшении рантайма и подсистемы ввода-вывода. Так, в компиляторе появились статические ссылки и поддерживается оптимизация во время линковки (link-time). В языке уменьшено количество разных видов замыканий, чтобы упростить и сделать более логичным синтаксис.

Читать дальше →

+37

kxx 21 дек 2013 в 23:30

Введение в параллельные вычисления в R

5 мин

17K

Data Mining*Алгоритмы*Параллельное программирование*R*

Из песочницы

Эта статья посвящена языку R. Он не так широко распространен на территории ex-USSR, как Matlab и тем более Python, но, безусловно, заслуживает внимания. Нельзя не отметить, что R — фактически стандарт для Data Science (хотя тут хорошо написано, что не R единым живут data scientists). Богатый синтаксис, совместимость с legacy кодом (что весьма важно в научных приложениях), удобная среда разработки RStudio и наличие огромного числа библиотек в CRAN делают R таковым.

Читать дальше →

+25

ivorobts 18 дек 2013 в 13:23

«Задачка-то сошлась с ответом!»

4 мин

34K

Блог компании IntelПрограммирование*Параллельное программирование*

Я очень часто по работе слышу вопрос, задаваемый из, большей частью, академической среды, ввиду огромного количества выполняемых вычислений именно там: «Почему наши результаты разные от запуска к запуску одного и того же приложения? Мы же ничего не меняем в нем». Стоит отметить, разговор про это уже был, но лишь частично отвечающий на вопрос. Попробую рассказать про эту проблему ещё чуть-чуть.

Читать дальше →

+48

etyumentcev 17 дек 2013 в 05:04

Модели акторов 40 лет

9 мин

21K

Блог компании LLC Tik-Tok CoachПрограммирование*Параллельное программирование*

Высоконагруженные системы, построенные по модели акторов – это тренд сегодняшнего времени. Вот далеко неполный перечень статей на хабре, в которых, в той или иной степени, упоминается данная модель или одна из ее реализаций, например,1, 2, 3, 3, 4, 5, 6, 7. Есть хорошая статья в википедии, рассказывающая про акторы. К сожалению, после ее прочтения, у меня осталось много вопросов, ответы на которые я смог найти только в первоисточниках. Результаты этого обзора я и хочу представить Вашему вниманию.

Читать дальше →

+30

atomlib 5 дек 2013 в 19:30

Мультипроцессовый Firefox

3 мин

44K

FirefoxПараллельное программирование*

C января этого года Билл Макклоски вместе с Дэвидом Андерсоном работали над тем, чтобы сделать «Файерфокс» мультипроцессовым, в этом им помогали Том Шустер (evilpie), Фелипе Гомез и Марк Хаммонд. И теперь настал момент, когда они хотели бы узнать мнение сообщества о проделанной работе.

В «Файерфоксе» всегда использовалась однопроцессовая модель построения. Интерес к изменениям в области распараллеливания подстегнул выход браузера «Хром», в нём использовались один процесс для интерфейса и отдельные процессы для работы с контентом веб-страниц. (Тем не менее за шесть месяцев до «Хрома» несколько процессов начал использовать «Интернет эксплорер 8».) Вскоре, примеру «Хрома» последовали и некоторые другие браузеры, «Мозилла» начала проект Electrolysis для адаптации движка «Гекко» к использованию нескольких процессов.

Что вынуждает «Мозиллу» переключаться на подобную модель построения своего браузера? В первую очередь это производительность и отзывчивость. Основной целью является уменьшение подвисания (jank), проявляющегося при стандартных операциях — загрузке особенно крупной страницы, наборе текста в веб-форме или прокрутке перегруженной элементами страницы.

Читать дальше →

+59

ivorobts 4 дек 2013 в 12:22

Ждали, ждали и дождались! OpenMP 4.0

5 мин

22K

Блог компании IntelКомпиляторы*Параллельное программирование*

Каждая новая спецификация OpenMP вводит очень полезные и необходимые дополнения к уже существующему функционалу. Например, в версии 3.0 были добавлены так ожидаемые задачи (tasks), позволившие решать ещё больший спектр задач по распараллеливанию приложений. В 3.1 целый ряд улучшений по работе с задачами и редукциями.

Но по сравнению с тем, что нам теперь даёт стандарт 4.0, предыдущие нововведения кажутся какими-то мелкими. Последняя версия расширила типы поддерживаемого параллелизма, чего раньше никогда не замечалось.

Поясню, что я хочу сказать.

+31

krogozh 2 дек 2013 в 09:24

Профилировка производительности OpenMP приложений

7 мин

6.8K

Блог компании IntelВысокая производительность*Параллельное программирование*

OpenMP – пожалуй, самая распространённая модель параллельного программирования на потоках, на системах с общей памятью. Ценят её за высокоуровневые параллельные конструкции (в сравнении с программированием системных потоков) и поддержку разными производителями компиляторов. Но этот пост не про сам стандарт OpenMP, про него есть много материалов в сети.

Распараллеливают вычисления на OpenMP ради производительности, о чём, собственно, и статья. Точнее, об измерении производительности с помощью Intel VTune Amplifier XE. А именно, как получить информацию о:

Получении профиля всего OpenMP приложения
Профиле отдельных параллельных регионов OpenMP (время CPU, горячие функции и т.д.)
Балансе работы внутри отдельного параллельного региона OpenMP
Балансе параллельного/последовательного кода
Уровне гранулярности параллельных задач
Объектах синхронизации, времени ожидания и передачах управления между потоками

Узнать больше о профилировке OpenMP

+26

tangro 27 ноя 2013 в 13:51

Resumable функции

11 мин

26K

Блог компании Инфопульс УкраинаC++*Параллельное программирование*

Туториал

Перевод

На прошлой неделе в мире С++ произошло интересное событие. Компания Microsoft объявила о выходе обновления к компилятору С++ в Visual Studio 2013. Само по себе обновление компилятора отдельно от Visual Studio или её сервис-пака — уже нетривиальное для Microsoft событие. Но ещё интереснее то, что вошло в это обновление. Полный список можно почитать по ссылке выше, а я остановлюсь только на одном моменте — resumable функции. Для полного понимания ситуации: Microsoft изрядно протроллила и комитет по стандартизации С++ и разработчиков gcc\clang, выпустив (тут надо внимательно) реализацию экспериментальной и не утверждённой ещё возможности будущего стандарта C++17, основанной на экспериментальных и не утверждённых ещё возможностях будущего стандарта C++14, которые в свою очередь являются исправлениями не сильно ещё вошедших в повседневное программирование возможностей С++11.

Достаточно гиковский ход, не находите?

А ниже будет перевод статьи с meetingcpp.com, рассказывающей о том, что это за фича и как её использовать.

Читать дальше →

+54

1 2 ...

6 7

9 10

Параллельное программирование *

AsyncCollections: история одного велосипеда

Ручное клонирование потока. Когда Assembler + C# = Love

И еще раз о GIL в Python

Предисловие

Rust на примерах. Часть 1

Истории

Консенсус в распределенных системах. Paxos

Асинхронные задачи в С++11

Транзакционная память: история и развитие

Определение

Проба пера на суперкомпьютере Ломоносов

Потоки — это Goto параллельного программирования

Доступен новый JIT: теперь с поддержкой SIMD

От переводчика

Утечка памяти с ThreadLocal

Будущее программирования аппаратных ускорителей

Вышел Rust 0.9

Ближайшие события

Введение в параллельные вычисления в R

«Задачка-то сошлась с ответом!»

Модели акторов 40 лет

Мультипроцессовый Firefox

Ждали, ждали и дождались! OpenMP 4.0

Профилировка производительности OpenMP приложений

Resumable функции

Вклад авторов