Параллельное программирование *

Распараллеливаем вычисления

СтатьиПостыНовостиАвторыКомпании

snovvcrash 14 янв 2018 в 19:57

Сказ о тотальном переборе, или Томительное ожидание декрипта

13 мин

14K

C++ * Информационная безопасность * Криптография * Параллельное программирование *

Приветствую жителей Хабра!

Итак, новые «криптографические игрища» пришли по мою душу. Поэтому сегодня поговорим о занудном упражнении, ориентированном на полный перебор паролей, реализации тривиального многопоточного брутера силами C++ и OpenMP, а также кратко об использовании криптобиблиотеки CryptoPP и стороннего модуля fastpbkdf2 (для Си и Плюсов) в своих проектах.

Го под кат, печеньки out there!

Читать дальше →

+33

Magistr 10 янв 2018 в 23:46

Что ещё необходимо узнать про OpenCL C перед тем, как на нём писать

13 мин

17K

GPGPU * Высоконагруженные системы * Параллельное программирование *

Как было написано	`float4 val = (0, 0, 0, 0);`
Что хотел написать автор	`float4 val = (float4)(0, 0, 0, 0);`
Как нужно было написать	`float4 val = 0;`

Если Вы сталкивались с OpenCL или планируете столкнуться и не видите разницы между первым и вторым вариантом, а третий вызывает у Вас сомнения — «А скомпилируется ли вообще?» — добро пожаловать под кат, там много нюансов языка и совсем ничего про API и оптимизацию производительности.

Читать дальше →

+40

ThisIsZolden 8 янв 2018 в 18:26

Физическое моделирование на GPU с использованием compute shader в среде Unity3D

17 мин

40K

Программирование * Параллельное программирование * Unity * GPGPU * C# *

Туториал

В этом руководстве я расскажу, как использовать compute shader для реализации вычислений на видеокарте — на примере модели волос:

+48

ThisIsZolden 8 янв 2018 в 16:45

Вычисления на видеокарте, руководство, лёгкий уровень

3 мин

36K

C# * GPGPU * Unity * Параллельное программирование * Программирование *

Туториал

Это руководство поясняет работу простейшей программы, производящей вычисления на GPU. Вот ссылка на проект Юнити этой программы:

ссылка на файл проекта .unitypackage

Она рисует фрактал Мандельброта.

Я не буду пояснять каждую строчку кода, укажу только необходимые действия для реализации вычислений на GPU. Поэтому, лучше всего открыть код программы в Юнити и там смотреть, как используются поясняемые мной строчки кода.

Шейдер, который рисует фрактал, написан на языке HLSL. Ниже приведён его текст. Я кратко прокомментировал значимые строки, а развёрнутые объяснения будут ниже.

Читать дальше →

+27

fronda 26 дек 2017 в 15:33

Достижение максимальной производительности Быстрого Преобразования Фурье на основе управления данными

1 мин

19K

Прототипирование * Параллельное программирование * Высоконагруженные системы * C++ * C *

Из песочницы

Recovery Mode

Статья поддерживается здесь:
[3] Caterpillar Implementation Based on Generated Code

// не вижу смысла писать на ресурсе а) с цензурой тэгов б) где каждый проходящий бот, набравший рейтинг галиматьей, сносит твой рейтинг и объяснение причины с него не требуется

+18

YuriPanchul 22 дек 2017 в 05:57

Суровая сибирская и казахстанская микроэлектроника 2017 года: Verilog, ASIC и FPGA в Томске, Новосибирске и Астане

11 мин

15K

FPGA * Анализ и проектирование систем * Высоконагруженные системы * Ненормальное программирование * Параллельное программирование *

Год 2017 стал годом больших изменений в зарождающейся экосистеме российской микроэлектроники. Эти изменения заметило даже ранее безразличное к российскому железу общество. Российский чип ELISE для умных камер от ЭЛВИС-НеоТек вышел на удобной плате для разработчиков. Эту плату показали по Первому каналу российского телевидения. C российским процессором Байкалом-Т теперь может поработать любой программист через доступ к серверам удаленной лаборатории, которую байкаловцы создали вместе с МГУ. Российские процессоры от НИИСИ стали использовать для телекоммуникационного оборудования.

Для перехода от единичных успехов к развитой экосистеме необходимо подкрутить образование. В сентябре в Томске прошло совещание, на котором преподаватели и инженеры из Москвы, Сибири, Поволжья, Калифорнии и других мест обменялись опытом в преподавании микроэлектроники. Одновременно там же прошел учебный семинар по SystemVerilog, VHDL, FPGA, CPU IP, на который пришли не только россияне, но и студенты из Китая и Вьетнама, среди которых быстро распостранилась информация, что рядом учат чему-то полезному для их карьеры. Под катом — отчет об этом и сопутствующих событиях. Действующие лица: томские и новосибирские университеты, московские МГУ, МФТИ и МИЭТ, новосибирские лицеи, российская компания МЦСТ, американские MIPS, AMD и National Instruments, британская Imagination и казахский Назарбаевский Университет.

+28

ThisIsZolden 19 дек 2017 в 16:10

Доделал игру, работающую на видеокарте

3 мин

88K

GPGPU * Unity * Дизайн игр * Параллельное программирование * Разработка игр *

Наконец-то я доделал игру, которая работает на видеокарте. Она несколько месяцев повисела в раннем доступе на стиме, и теперь я её окончательно выпустил. Основная фишка игры в том, что она представляет собой физическую симуляцию, которая выполняется на графическом процессоре. Основной код игры — это огромный compute shader, 6 тысяч строк на HLSL. Десятки тысяч взаимодействующих частиц обрабатываются параллельно, и выходит довольно быстро. Всё в игре сделано из этих частиц. Вот несколько гифок о том, как это работает:

Читать дальше →

+262

187

ALEX_k_s 11 дек 2017 в 09:19

Самая быстрая и энергоэффективная реализация алгоритма BFS на различных параллельных архитектурах

20 мин

12K

Параллельное программирование * Высоконагруженные системы * Алгоритмы * GPGPU * C++ *

Оффтоп

В названии статьи не поместилось — данные результаты считаются таковыми по версии рейтинга Graph500. Также хотелось бы выразить благодарность компаниям IBM и RSC за предоставленные ресурсы для проведения экспериментальных запусков во время исследования.

Введение

Поиск в ширину (BFS) является одним из основных алгоритмов обхода графа и базовым для многих алгоритмов анализа графов более высокого уровня. Поиск в ширину на графах является задачей с нерегулярным доступом к памяти и с нерегулярной зависимостью по данным, что сильно усложняет его распараллеливание на все существующие архитектуры. В статье будет рассмотрена реализация алгоритма поиска в ширину (основного теста рейтинга Graph500) для обработки больших графов на различных архитектурах: Intel х86, IBM Power8+, Intel KNL и NVidia GPU. Будут описаны особенности реализации алгоритма на общей памяти, а также преобразования графа, которые позволяют достичь рекордных показателей производительности и энергоэффективности на данном алгоритме среди всех одноузловых систем рейтинга Graph500 и GreenGraph500.

Нажми и прочитай про самый быстрый BFS в мире!

+10

AloneCoder 24 ноя 2017 в 10:11

Развитие стратегий устойчивости

12 мин

8.7K

Блог компании VKPython * Занимательные задачкиМашинное обучение * Параллельное программирование *

Перевод

В предыдущей статье я описал несколько алгоритмов эволюционных стратегий (evolution strategies, ES), помогающих оптимизировать параметры функции без необходимости явно вычислять градиенты. При решении задач обучения с подкреплением (reinforcement learning, RL) эти алгоритмы можно применять для поиска подходящих наборов параметров модели для агента нейросети (neural network agent). В этой статье я расскажу об использовании ES в некоторых RL-задачах, а также опишу методы поиска более стабильных и устойчивых политик.

+24

ARG89 1 ноя 2017 в 07:26

Бесплатная YouTube-трансляция Joker 2017: Java 9, Concurrency, GC, Spring и, конечно, паззлеры

7 мин

22K

Блог компании JUG Ru GroupJava * Высоконагруженные системы * Параллельное программирование *

Круг замкнулся. Ровно год назад мы провели открытую трансляцию Joker 2016 для всех тех, у кого не было возможности зарегистрироваться. С тех пор мы провели более десятка трансляций с конференций по .NET, JavaScript, DevOps, мобильным технологиям, тестированию и Java, само собой.

Что стало лучше за год? Мы отработали технологию, пофиксили пару уязвимостей, начали транслировать через YouTube (а не через кастомный интерфейс), научились задавать вопросы от участников трансляции, забанили добрую сотню троллей, научились проводить интервью в перерывах без задержек и проволочек, начали делать трансляцию в 1440р… наверное, есть что-то еще.

Собственно, уже совсем скоро вы сможете увидеть, что у нас получилось — 3 ноября в 9:30 утра мы начнем двухдневную бесплатную трансляцию главного трека Joker 2017. Трансляция будет идти с одним перерывом «на сон». А еще она будет в разрешении 1440р, так что в кои-то веки вам понадобятся ваши крутые мониторы.

В программу вошли доклады Cay Horstmann, Алексея Шипилёва, Баруха jbaruch Садогурского, Тагира lany Валеева, Николая xpinjection Алименкова, Евгения EvgenyBorisov Борисова, Сергея Milfgard Абдульманова и еще кое-кого.

Интересно? Давайте под кат.

+39

ogurtsov 30 окт 2017 в 16:28

Глубокое обучение с R и Keras на примере Carvana Image Masking Challenge

18 мин

14K

Блог компании Open Data ScienceR * Машинное обучение * Обработка изображений * Параллельное программирование *

Привет, Хабр!

Пользователи R долгое время были лишены возможности приобщиться к deep learning-у, оставаясь в рамках одного языка программирования. С выходом MXNet ситуация стала меняться, но своеобразная документация и частые изменения, ломающие обратную совместимость, все еще ограничивают популярность данной библиотеки.

Гораздо привлекательнее выглядит использование R-интерфейсов к TensorFlow и Keras с бекендами на выбор (TensorFlow, Theano, CNTK), подробной документацией и множеством примеров. В этом сообщении будет разобрано решение задачи сегментации изображений на примере соревнования Carvana Image Masking Challenge (победители), в котором требуется научиться отделять автомобили, сфотографированные с 16 разных ракурсов, от фона. "Нейросетевая" часть полностью реализована на Keras, за обработку изображений отвечает magick (интерфейс к ImageMagick), параллельная обработка обеспечивается parallel+doParallel+foreach (Windows) или parallel+doMC+foreach (Linux).

Читать дальше →

+53

olegchir 27 окт 2017 в 07:08

На дворе почти 2018, а мы любим колбэки

9 мин

25K

Блог компании JUG Ru GroupПараллельное программирование * Node.JS * JavaScript *

Если в первый момент идея не кажется абсурдной, она безнадёжна.
— Альберт Эйнштейн

Мы собрали для вас самые популярные темы из обсуждений Node.js на Хабре, и попросили рассказать о них признанных экспертов: некоммерческого Node-хакера Матиаса Мэдсена и автора множества книг и курсов по Node, Азата Мардана.

Вот точный список тем:

Потоки в Node.js и способы распараллеливания вычислений;
Асинхронность в Node.js;
Отладка и логирование в Node.js;
Проблемы мониторинга производительности на продакшене;
Инструменты для мониторинга нод.

Азат Мардан (Azat Mardan) — Tech Fellow, менеджер в компании Capital One, и эксперт по JavaScript/Node.js с несколькими онлайн-курсами на Udemy и в Node University, а также автор 14 книг по той же тематике, включая «React Quickly» (Manning, 2017), «Full Stack JavaScript» (Apress, 2015), «Practical Node.js» (Apress, 2014) и «Pro Express.js» (Apress, 2014).

Читать дальше →

+24

gridem 23 окт 2017 в 07:15

Асинхронность 3: Субъекторная модель

30 мин

19K

C++ * Высоконагруженные системы * Параллельное программирование * Программирование *

Предисловие

Эта статья является продолжением цикла статей про асинхронность:

Спустя 3 года я решил расширить и обобщить имеющийся спектр асинхронного взаимодействия с использованием сопрограмм. Помимо этих статей также рекомендуется ознакомиться с универсальным адаптером:

Универсальный адаптер

Введение

Рассмотрим электрон. Что он из себя представляет? Отрицательно заряженная элементарная частица, лептон, обладающий некоторой массой. Это означает, что он может участвовать по меньшей мере в электромагнитных и гравитационных взаимодействиях.

Читать дальше →

+39

stealapanda 17 окт 2017 в 12:07

Behind the scene of TOP-1 supercomputer

5 мин

12K

C * Fortran * Параллельное программирование *

Из песочницы

Это история о том, как мы c mildly_parallel ~~замедляли~~ ускоряли расчеты на самом мощном суперкомпьютере в мире.

Читать дальше →

+44

saul 9 окт 2017 в 07:36

Оптимизация TensorFlow на современных архитектурах Intel

8 мин

7.4K

Блог компании IntelПараллельное программирование * Машинное обучение * Высоконагруженные системы * TensorFlow *

Перевод

TensorFlow — современная платформа глубокого обучения и машинного обучения, дающая возможность извлекать максимальную производительность из оборудования Intel. Эта статья познакомит сообщество разработчиков искусственного интеллекта (ИИ) с методиками оптимизации TensorFlow для платформ на базе процессоров Intel Xeon и Intel Xeon Phi. Эти методики были созданы в результате тесного сотрудничества между специалистами корпораций Intel и Google. Представители обеих корпораций объявили об этом сотрудничестве на первой конференции Intel AI Day в прошлом году.

Читать дальше →

+10

dsmv2014 13 сен 2017 в 23:57

SDAccel — проверяем передачу данных

9 мин

5.1K

FPGA * GPGPU * Высоконагруженные системы * Параллельное программирование *

В предыдущей статье «SDAccel – первое знакомство» я попытался описать основы применения OpenCL на ПЛИС Xilinx. Теперь настало время поделиться результатами экспериментов по передаче данных на модуле ADM-PCIe-KU3. Проверяется передача данных в обоих направлениях. Исходный код программ размещён на GitHub: https://github.com/dsmv/sdaccel

Читать дальше →

+12

SharplEr 5 сен 2017 в 20:01

Concurrency паттерны в Rust из Java

11 мин

13K

Java * Rust * Параллельное программирование *

Под катом находятся заметки, в которых расписано, как реализовать в Rust хитрые concurrency паттерны, которые я с легкостью пишу в Java, и в чем различие в подходах к concurrency у этих языков. Статья будет полезна и тем, кто переходит на Rust из C#, ведь у него аналогичная модель памяти.

Читать дальше →

+30

YuriPanchul 5 сен 2017 в 07:28

Экскурсия по Музею Истории Компьютеров в Калифорнии, с пользой для разработки. Часть 1. ENIAC, Stretch, CDC6600, IBM/360

8 мин

7.9K

FPGA * Алгоритмы * Высоконагруженные системы * Параллельное программирование * Системное программирование *

Господа! Сегодня мы пройдемся с сибирской девушкой Ириной по Музею истории компьютеров в Маунтин-Вью, Калифорния. Причем пройдемся не как туристы, а для принесения пользы России. Я уже писал в предыдущем посте, что один из эффективных способов для студента изучить проектирование процессоров — это взять какой-нибудь древний, но поучительный процессор, найди документацию по его архитектуре (и какую-нибудь информацию по его микроархитектуре), и спроектировать аналог этого процессора на языке описания аппаратуры SystemVerilog (или VHDL, если он вам больше нравится), после чего реализовать процессор на плате ПЛИС / FPGA (какой именно, не важно — Altera / Intel FPGA, Xilinx или Lattice). В качестве учебника для такого упражнения вы можете начать с Харрис & Харрис, после чего продолжить с книгами для более продвинутой стадии обучения, например Шень-Липасти.

Каким образом все это принесет пользу России? Под такие проекты мы собираемся раздавать FPGA платы на конференции которая пройдет 18-22 сентября в Томске. Туда приедут представители МГУ, МФТИ, МИЭТ, МЦСТ, Imagination Technologies, National Instruments итд. Они будет обсуждать, как обновить программу университетов, чтобы сегодняшние студенты через несколько лет проектировали росийские чипы на уровне передовых западных компаний. Там также будет школа-семинар, на которой будут обсуждать, как делать учебные процессоры — начиная от простейшего schoolMIPS от Станислава Жельнио sparf.

Вот первая фотография из музея в Маунтин-Вью — на ней помимо Ирины и ракеты в центре виден небольшой ящичек. Это бортовой компьютер космической станции «МИР» , который проектировали инженеры советского объединения «ЭЛАС», которое трансформировалось в современную зеленоградскую компанию «ЭЛВИС»:

Итак, темы для учебных проектов — начиная из дремучих десятилетий середины XX века:

+15

pekunov 26 авг 2017 в 19:00

Идеи о новых возможностях обычного/параллельного программирования (расширение C++)

6 мин

13K

C++ * Параллельное программирование * Программирование *

Из песочницы

Здравствуйте, уважаемые читатели.

Предлагаю всем, кто заинтересуется, обсудить некоторые основные идеи классического и параллельного программирования в расширении C++, основанном на процедурах/функциях с планированием повторного входа (ПППВ/ФППВ). В минимальном варианте — это процедура или функция, у которой есть статический или динамический план исполнения.

Читать дальше →

+18

23derevo 28 июн 2017 в 21:36

[Питер] Встреча JUG.ru c легендой параллельного программирования Maurice Herlihy — Transactional Memory and Beyond

2 мин

4.5K

Блог компании JUG Ru GroupВысоконагруженные системы * Параллельное программирование * Системное программирование *

У нас праздник! В начале июля в Санкт-Петербурге пройдет SPTCC 2017, летняя школа по параллельному программированию. Одним из лекторов школы станет Морис Херлихи (Maurice Herlihy), легенда параллельного программирования, один из авторов знаменитого учебника «The Art of Multiprocessor Programming».

В четверг, 6 июля, в 19:00 в Университете ИТМО Морис выступит на встрече JUG.ru. На этот раз мы будем говорить не про Java. Тема встречи — транзакционная память.

О чем же нам расскажет Морис?

Транзакционная память

Новое поколение процессорных архитектур предоставляет нам аппаратную транзакционную память (Hardware Transactional Memory — HTM), механизм синхронизации для быстрых транзакций в оперативной памяти. В данном докладе будет показано, что HTM это не просто более быстрый путь для релизации старых-добрых monitor-ов и latch-ей. На самом деле, HTM обеспечивает фундаментальные позитивные изменения в том, как мы программируем многоядерные машины (и возможно даже базы данных), позволяя нам переосмыслить базовые примитивы синхронизации, такие, как lock-и, управление памятью, и многообразие многопоточных структур данных.

Читать дальше →

+20

1 2 ...

9 10

12 13 ...

21 22

Параллельное программирование *

Сказ о тотальном переборе, или Томительное ожидание декрипта

Что ещё необходимо узнать про OpenCL C перед тем, как на нём писать

Физическое моделирование на GPU с использованием compute shader в среде Unity3D

Вычисления на видеокарте, руководство, лёгкий уровень

Достижение максимальной производительности Быстрого Преобразования Фурье на основе управления данными

Суровая сибирская и казахстанская микроэлектроника 2017 года: Verilog, ASIC и FPGA в Томске, Новосибирске и Астане

Доделал игру, работающую на видеокарте

Самая быстрая и энергоэффективная реализация алгоритма BFS на различных параллельных архитектурах

Оффтоп

Введение

Развитие стратегий устойчивости

Бесплатная YouTube-трансляция Joker 2017: Java 9, Concurrency, GC, Spring и, конечно, паззлеры

Глубокое обучение с R и Keras на примере Carvana Image Masking Challenge

На дворе почти 2018, а мы любим колбэки

Асинхронность 3: Субъекторная модель

Предисловие

Введение

Ближайшие события

Behind the scene of TOP-1 supercomputer

Оптимизация TensorFlow на современных архитектурах Intel

SDAccel — проверяем передачу данных

Concurrency паттерны в Rust из Java

Экскурсия по Музею Истории Компьютеров в Калифорнии, с пользой для разработки. Часть 1. ENIAC, Stretch, CDC6600, IBM/360

Идеи о новых возможностях обычного/параллельного программирования (расширение C++)

[Питер] Встреча JUG.ru c легендой параллельного программирования Maurice Herlihy — Transactional Memory and Beyond

Транзакционная память

Вклад авторов