Comments 6
Не хватает какогонить примера, как со всем этим теперь взлететь
Я не понял о чем статья.
Вы ничего не настроили абсолютно. Мотивация плясок не ясна. Что "это" может делать? Даже если бы вы Docker Swarm подняли на этих двух нодах и то пользы больше было бы. Да и сплит-брейн никто не отменял.
MPI - это вообще про HPC, а не про бизнес-приложения. Типа, там сортировку Хоара распределенную запустить или гены расшифоровывать. Что вы пытаетесь достичь?
Ну и NFS? Взялись за MPI - монтируйте Lustre или Gluster. Какая уж тут отказоустойчивость. В общем, статья бессмысленна и беспощадна, как и вся наша жизнь.
странная установка dev пакета - заголовки и библиотеки для разработки - для того, чтобы mpi поставить... Главный вопрос - зачем все это?
>>Устанавливаем протокол коммуникаций
Наверное "устанавливаем библиотеку". А то прям взять и засетапить протокол звучит странно. Протокол - это определенные правила и структуры данных, их нельзя установить.
Дальше вы поставили OpenMPI и без объявления войны запустили его. На одном узле. А их у вас два (из примера дальше). Как показывает практика SHM работает практически всегда, а вот настроить MPI для работы на более одном узле несколько сложнее.
Вердикт - недоделано.
Автору надо разобраться с отличием кластера высокой производительности от кластера высокой готовности. MPI – это из темы высокой производительности. А про обеспечение высокой готовности (механизм мажоритарного голосования, распределённая файловая система, средства миграции приложений между узлами, дублирование аппаратуры и соединений) в статье вообще ничего нет.
В статье создан (наполовину настроенный) кластер высокой производительности из двух узлов. Надёжность работы приложений такой кластер не увеличивает, а скорее понижает в два раза. Хотя может увеличить производительность специальным образом написанных программ (ориентированных на исполнение в среде MPI) по сравнению с одним компьютером.
Если цель - запутать новичков, то она выполнена. (почему - уже объяснено в других комментах)
Разворачиваем MPI кластер на Linux