Andrey_Rogovsky24 авг 2010 в 11:26

Как сделать облачный (кластерный) хостинг за пару копеек*

3 мин

6.5K

Хостинг

+44

Комментарии 64

Rolex 24 авг 2010 в 11:37

Классический пример кластера c аппаратной избыточностью, но никак не облака. :)

Andrey_Rogovsky 24 авг 2010 в 11:43

Почему?
При необходимости несколько серверов будут работать как один, когда нагрузка спадет — все вернется как и было раньше.
Это ли не принцип облака?

ikoev 24 авг 2010 в 12:05

Five essential characteristics of cloud technology:
On-demand self-service
Broad network access
Resource pooling
Rapid elasticity
Measured service

Andrey_Rogovsky 24 авг 2010 в 12:14

Отмечаем по пунктам:
1) Создание/удаление виртуалок происходит автоматом? Да.
2) Это требует дополнительной расшифровки
3) Пул под виртуалки я делал? Делал.
4) Мониторинг по smb есть? Есть, хоть раз в секунду запускай.
5) Опять-же трафик считаем nginx, а дополнительные виртуалки — через скрипт их создания/удаления

Итого 4 из 5, причем один пункт требует расшифровки.

leave 24 авг 2010 в 12:35

4 — вы уверены, что правильно понимаете, что такое «Rapid elasticity»?

Andrey_Rogovsky 24 авг 2010 в 12:54

Более того, я даже не всегда понимаю, что такое «правильно», так как все относительно.
Так что — больше конкретики.

leave 24 авг 2010 в 17:04

Каким боком «мониторинг по smb» до «ресурсы по запросу — здесь и сейчас»?

Andrey_Rogovsky 24 авг 2010 в 17:28

Очень просто
Если мы видим, что на виртуалке большая нагрузка — делаем ее клон и распределяем нагрузку.

twi 24 авг 2010 в 13:06

On-demand self-service
захотелось — подрочил. Да.

ikoev 24 авг 2010 в 13:38

смешно, да ;)

по всем вышеприведенным терминам найдите определение и поймете, что вы немного другое сделали, а не облако ;)

Andrey_Rogovsky 24 авг 2010 в 13:47

Это облачный хостинг, а не просто облако, да.
Ну так я и писал про это в заголовке.

IgorStepin 24 авг 2010 в 19:17

Для пользователей виртуалок вполне облако: 150 виртуалок достаточно большое число, если хотя бы 20 свободны для динамического расширения, то для большинста LAMP-сайтов вполне хватит. Никто же не спорит, что Amazon EC2 — это облако? А тут еще и автоматическое масштабирование (там только ручное без сторонних сервисов или скриптов).

egorF 24 авг 2010 в 21:19

На EC2 уже оч. давно есть автоматическое масштабирвание, чуть ли не с самого начала. Это одна из важнейших фич EC2.

braindamaged 24 авг 2010 в 11:37

>> Результатом их работы стал так называемый API, который умел находить соседей широковещательным запросом, синхронизироваться до актуального состояния и информировать соседей о всех изменениях с базой.

Это как? Ручная репликация на php, что ли?

Andrey_Rogovsky 24 авг 2010 в 11:43

Да, именно она самая.

mitnlag 24 авг 2010 в 12:05

Именно поэтому данное решение стоит намного дешевле брендов. Бренд подходит для большого круга задач, а Ваше — только для конкретно этой.

Andrey_Rogovsky 24 авг 2010 в 12:10

Вполне, например — компилацию на нем не ускорить, OCR тоже.
Для хостинга — вполне себе решение.

braindamaged 24 авг 2010 в 12:23

И сколько у вас инстансов БД? И каждый DML/SML запускается по очереди на каждой БД?
Я чего-то не понял, видимо…

Andrey_Rogovsky 24 авг 2010 в 12:26

Каждая виртуалка содержит в себе копию БД и всегда синхронизируется с остальными.
Выделенные виртуалки под БД разработчики не захотели использовать.

braindamaged 24 авг 2010 в 12:29

А как вы тогда выцепляете запросы, которые внутри выполняются, и отправляете их на другие виртуалки?

Andrey_Rogovsky 24 авг 2010 в 12:35

Это решали разработчики, правя код. Как я и говорил — надо использовать MySQL-Proxy+Lua, и тогда все это будет работать нативно без правок кода.

Goodkat 24 авг 2010 в 12:17

Распишите подробней про синхронизацию данных, от скриптов до БД.

Andrey_Rogovsky 24 авг 2010 в 12:24

Синхронизация данных на файловом уровне:
lvcreate -L 10G -s -n instance01 /dev/volgroup/instance01template

Синхронизация БД — скрипт на php, у меня он не сохранился. Логика очень простая: Если идет запрос на изменение данных, то он выполняется на всех клонах виртуалки.

Будут более конкретные вопросы — будут более подробные ответы.

Tonik 24 авг 2010 в 12:33

Такое решение синхронизации БД конечно говорит не в пользу разработчиков. :) Мне кажется проще было изучить Lua чем городить такой велосипед. Но это явно вопрос не к вам.

Спасибо большое за статью — вы дали пару очень интересных идей. И показали что «облако» это просто :)

Скажите, а что делалось если причиной нагрузки был сам код? ну скажем с новым релизом кто в коде делал интенсивную работу с диском. получается что такое приложение забивало все свободные «слоты» под виртуалки?

Andrey_Rogovsky 24 авг 2010 в 12:37

Как показала практика — дешевле было поставить пару новых серверов, чем делать оптимизацию.
Ну и конечно, если при постоянном значении трафика нагрузка резко шла вверх — разработчики уже делали дебаг и профайлинг у себя на стенде.

Goodkat 24 авг 2010 в 12:39

ну вот загружает пользователь фоточку, как она синхронизируется по разным машинам?
или генерирует скрипт pdf-документ, делает запись в БД, кладёт файлик в папку /download, как этот файлик раскидывается по виртуалкам?

Andrey_Rogovsky 24 авг 2010 в 13:05

С помощью этого, а крутилось все на паре виртуалок и синхронизировалось через rsync

НЛО прилетело и опубликовало эту надпись здесь

Andrey_Rogovsky 29 авг 2010 в 15:15

I/O всегда есть узкое место

black_crown 24 авг 2010 в 12:45

Хорошо, что еще есть люди на этой планете, которые пишут сноски (*) такого же размера шрифта, как и основной текст))

bondbig 24 авг 2010 в 12:59

вижу слова «облачный» и «виртуализация» — кастую amarao в тред.
Автору спасибо за статью, полезная, ушла в избранное. После долгого отсутствия, Андрей Роговский вернулся и начал снова писать нормальные технические статьи а не оффтопик про политику и мозг.

zeehond 24 авг 2010 в 13:06

занятно, но на cloud не тянет никак

внедрённое и поддерживаемое нами рабочее HA/LB решение для LAMP-хостинга (не претендуя на громкое слово cloud) выглядело так

фронтенд:
2 мастер-хоста веб-фронтенд — DRBD active-active репликация
для избежания split brain, разумеется, fencing
N (в перспективе до бесконечности) вторичных хостов веб-фронтенда — реплицируются с мастеров rsync-ом
все изменения делаются на любом из мастер-хостов, далее сами расползаются по кластеру

DNS-round-robin load balancing — дешёво и сердито
IP адрес внезапно умершей ноды перехватывает соседняя по кластеру нода
пользовательские сессии реплицируются по кластеру через memcache

база данных:
1 активный мастер MySQL
1 спящий мастер, репликация файловой системы DRBD active -> passive на несмонтированный раздел
при умирании активного мастера спящий просыпается, перехватывает IP активного на себя, монтирует раздел, поднимает серверный процесс
ну и N (опять же до бесконечности) слейвов, которые реплицируются с мастеров

доступ PHP-кода через базу работает через класс, который все INSERT/UPDATE/DELETE гонит на мастера, все SELECT — на слейвов (случайно выбирая ноду)

HA выполняется полностью — при отказе _любой_ ноды система работает как ни в чём ни бывало, т.е. no single point of failure
LB выполняется везде, за исключением MySQL-мастера — но он со своими 32 гигами, 4х4 головыми Xeon-ами и SAS-дисками старается вовсю

в дальнейшем были сделаны некоторые улучшения, типа frontend-ноды берут весь контент не с локального диска, а с файлового сервера из двух связанных по infiniband NAS-серверов с DRBD active-active, добавлены сервера для кэширования и отдачи статического контента

в среднем всё это вместе держит нагрузку в 200-300, местами до 1000, запросов страниц в секунду

Tonik 24 авг 2010 в 13:19

Тоже интересный вариант. А можно подробней при помощи чего именно перехватывались IP умирающих машин?

Andrey_Rogovsky 24 авг 2010 в 13:34

Это я тоже делал в свое время, немного иначе правда. Даже презентация на видео есть :)

Тут ведь дело в том, что у меня сайты — не клиентские а корпоративные, и у каждого разработчика свои требования по версиям софта, так что без виртуалок не обойтись.

НЛО прилетело и опубликовало эту надпись здесь

Andrey_Rogovsky 29 авг 2010 в 15:15

Как давно это было?

НЛО прилетело и опубликовало эту надпись здесь

AccessD 24 авг 2010 в 13:06

А присутствует ли в вашем «облаке» присущая облакам гибкость по распределению ресурсов?

Andrey_Rogovsky 24 авг 2010 в 13:37

Смотря что считать за ресурс.
У меня он был один — это трафик, точнее его обработка.

AccessD 24 авг 2010 в 16:25

На отечественном хостинге трафик как раз не ресурс. Куда важнее предоставляемые мощности и место. Облако подразумевает, что вы получаете именно столько, сколько вам надо и вы имеете возможность управлять полученными ресурсами, наращивая и снижая их по мере необходимости.

Andrey_Rogovsky 24 авг 2010 в 17:30

Трафик — это ресурс. Это посетители, которые приносят доход.
Про то, как выделялись ресурсы по необходимости — я уже написал.

AccessD 24 авг 2010 в 18:49

Это ресурс с точки зрения бизнес-модели, а сейчас речь о ресурсах этой карусели как платформы. И в данном случае трафик не в счёт, потому что в нормальных местах вы за него не платите при соблюдении определённого отношения отданного к принятому. Так что ваш кластер называть облаком, ИМХО, несколько некорректно, ибо тут нет той гибкости, которая подразумевается облаками.

Andrey_Rogovsky 26 авг 2010 в 09:30

И какой конкретно гибкости нехватает?

professor_kuvalda 24 авг 2010 в 13:06

> На заполнение стойки хватит суммы с четырьмя нулями

за 100,00 рублей что ли?

Andrey_Rogovsky 24 авг 2010 в 13:36

Нет, блин, за 10 000 зимбабвийских фантиков.

LIAL 24 авг 2010 в 13:22

копейки в нули не считаются
Думаю человек имел ввиду 10к$

FreeLSD 24 авг 2010 в 15:09

Роговский — профессиональный IT тролль.
Кластер с избыточностью можно сделать на связке XEN+DRBD+LustreFS используя Live Migration, но у меня эти Xen с Lustre так и не заработал

Andrey_Rogovsky 24 авг 2010 в 17:31

Как я и писал выше — у меня был выбор OVZ/XEN.

phasma 24 авг 2010 в 16:48

Во-первых, есть еще kvm. Во-вторых, есть уже готовый дистрибутив Proxmox, очень удобный для разворачивания виртуалок

Andrey_Rogovsky 24 авг 2010 в 17:32

Значит три года назад этого еще небыло или было в нестабильном состоянии.

schors 24 авг 2010 в 18:22

Я только не понял одного — а зачем ты это всё сделал? Практиковался в написании скриптов удалённого вызова команд? Какую задачу ты решил, какую нельзя было бы решить отрезав вот этот лишний слой абстракции с поднятием/опусканием VDS? Где сравнительная характеристика «до» и «после» и резюме «позволило»?

sply 24 авг 2010 в 18:43

основная задача — меньше работат руками, быстрее стартовать/останавливать инстансы

schors 24 авг 2010 в 18:55

А прости, зачем их стартовать/запускать? :) Что в данном примере выигранно? Цена этой статьи:
ssh host su root -c 'start/stop'? :)

sply 24 авг 2010 в 19:48

Вот это я не знаю, из статьи тоже не понятно, мутно как-то. Мне другое еще не понятно — зачем сначала нарезать физическую машину на мелкие вдски и потом запускать много мелких инстансов этих вдс — тут огромная потеря производительности впустую. Ладно бы если продавали каждый инстанс как амазон. Но ведь просто сайты хостились. Может быть и правда, чисто из-за красоты идеи.

schors 24 авг 2010 в 20:42

Я это собственно и хотел сказать :)

Andrey_Rogovsky 25 авг 2010 в 06:02

Потому что проектов было больше, чем физических серверов. Это раз.
У проектов были свои требования к софту — кому-то первый апач, кому-то второй, про PHP я вообще молчу. Это два.

Andrey_Rogovsky 25 авг 2010 в 06:01

Затем, что при большой нагрузке на один сайт работало 2-5 серверов одновременно. Причем полностью автоматически.
До этого один сайт на одном сервере смог обрабатывать 1000 паралельных запросов, после сайт выдерживал 5000 паралельных запросов.

happybyte 24 авг 2010 в 19:59

Странная цена на стойку с шестью нолями. Бренды как-то в последнее время сильно подешевели. В 4 ноля можно вложиться. Просто первая цифра не 1.

Andrey_Rogovsky 25 авг 2010 в 06:03

Цены 3-х летней давности. Сколько сейчас стоит набить стойку — не считал.

stanly 26 авг 2010 в 18:07

Андрей, а каким образом Вы определяли, на какой HN какой VE создавать?
Допустим (исходя из описания задачи), все HN имели одинаковую конфигурацию — CPU/MEM/HDD (если имели разную, мой вопрос усложняется).
Каким образом осуществлялся мониторинг overuse ресурсов на каждой HN, чтобы (не дай Бог) на определённой HN не создалось N к-во VE, которые суммарно превышали бы возможности самой HN? ;)

PS: сокращения HN и VE взяты сугубо согласно документации OpenVZ, чтобы большинство читателей при надобности могли бы вникнуть в суть вопроса.
(если называть их общепринятыми среди админов именами, я бы выразился иначе)

Andrey_Rogovsky 27 авг 2010 в 08:22

Это определял не я а скрипты, по состоянию наименьшего LA на HN.
Оверюза небыло — в скрипте были забиты лимиты VE на HN.

НЛО прилетело и опубликовало эту надпись здесь

Andrey_Rogovsky 29 авг 2010 в 15:16

Хранить в mysql

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий