Comments 7
Такое ощущение, что им деньги за объем статьи дают.
Такие вещи надо делать многосерийными, иначе народ разбежится.
Прочитал, порадовался, что люди независимо сделали свой маленький Borg, респект им. Манифесты, назначение ресурсов на задачи, раздельное управление классом изоляции и приоритетом размещения (appclass и priority соответственно в терминологии Borg), FQDN-like имена. Даже из lessons learned два пункта присутствуют: глубокая иерархия задач и IP на контейнер. Только Service Discovery нет, что отдельно проговаривается. Но у простых пользователей cluster management вопросы к проприетарному решению могут быть только из праздного любопытства, а архитекторы… не знаю, может на HighLoad своё любопытство удовлетворили? :-)
Mesos на C++. Без шедулера он не работает. Обычно используют связку mesos + marathon, который на java. В реальном большом продакшене ( конкретно у Твиттера ) используется совсем другая связка ( mesos + aurora ).
На момент когда мы на него смотрели, в mesos не было понятия класса изоляции процессов, preemption & scheduling priority, ip per container, распределения трафика и организации сервисов в иерархию. Поддержка распределения дисков в контейнеры в зачаточном состоянии до сих пор. Просто меняя шедулер это туда впилить невозможно.
Для синхронизации миньонов и мастеров mesos использует zookeeper. При массовых авариях это все довольно забавно пытаться заставить работать. Точнее это — один из его фатальных недостатков.
Так что «стабильным», в смысле отказоустойчивости, я бы mesos не назвал.
Mesos в продакшене проявил себя достаточно безбажным, но Марафон — это нечто. Никому не советую его использовать. Писал про Марафон в этом посте в конце.
А что комментировать? Вы ведь то же не по сути статьи комментарий написали. Я внимательно прочел, пытался специально найти, к чему бы прицепиться, чтобы написать комментарий, но не нашел :)
One-cloud — ОС уровня дата-центра в Одноклассниках