А о чём, собственно, пост? О том, что некоторые алгоритмы хорошо масштабируются горизонтально и можно их запрограммировать с использованием openMPI и запустить на нескольких машинах?
Как часто вам надо считать число Pi? :)
Вся сложность кластеризации реальных задач заключается в поиске параллельных алгоритмов. Детали же, openMPI это будет или нет, уже практически не влияют на результат.
Например, кластеризовать классические RDBMS крайне тяжело, и результат будет далеко не линейным от количества машин. А кластеризовать какое-нибудь key-value хранилище, изначально построенное на концепции eventual consistency и DHT легче лёгкого, ещё и реплик понаделать при этом, при линейном росте производительности на чтение и запись.
Ещё пример: параллелить ECB шифрование легко, CBC — невозможно.
Другие MPI не смотрели? Intel MPI, HP-MPI? Фортран интеловским компилятором с оптимизациями не собирали?
Что касается масштабирования, к сожалению расчетные задачи так линейно себя редко ведут. В основном после прохода некой границы расчет начинает ускоренно замедлятся.
Мы на нашем кластере давно ушли от OpenMPI. Невнятная вещь какая-то. Пользователи постоянно жаловались. В итоге грохнули, переехали обратно на qlogic mpi.
Мой опыт разработки с использованием OpenMPI тоже не ах. Производительность низкая.
Ну он поставляется в комплекте некоторого коммерческого софта, как и Intel-овский. О возможностях использования по отдельности лучше узнайте на офсайтах.
Кластер? Легко!