alex14n2 мар 2009 в 23:04

Обслуживание тысяч запросов в секунду на примере XBT Tracker

5 мин

8.4K

Серверная оптимизация *

+65

Комментарии 41

tifon 2 мар 2009 в 23:17

XBTT вобще жостко оптимизирован на скорость и является на данный момент самым быстрым трекером из тех что мне попадались.
Как побочный результат — достаточно запутанный код, который тяжело затачивать под свои нужды.

alex14n 2 мар 2009 в 23:20

+1 к оптимизированности, про запутанность кода — мне так не показалось, объектные «плюсы», большая часть логики, которую имеет смысл «затачивать» в одном методе — insert_peer. впрочем, это скорее спор о вкусе и цвете фломастеров :)

tifon 2 мар 2009 в 23:23

Про фломастеры это вы верно подметили :)
Просто я что бы разобраться потратил достаточно много времени.

alex14n 2 мар 2009 в 23:24

если не секрет — что именно затачивали? в плане обменяться опытом и «заточками»

tifon 2 мар 2009 в 23:37

Я к сожалению сыграл пассивную роль в данном проекте :), все сделал мой товарищ.
Стояла задача заменить PHPBTTracker на XBTT, последний отказывался кушать паскеи.
Проблема оказалась в SHA1 ф-ции, которую пришлось отключить.
Это так, не заточка, а просто нужно было обеспечить совместимость со старой базой.
Позже была идея добавить функционал, так как трекер у нас локальным был, нужно было добавить возможность отдавать список пиров в зависимости от айпи клиента (во внутрисеть — внутресетевые, во внешку — внешние). Вот тут то я и слил, долго думал куда бы приткнуть и так и не осилил по молодости. Сейчас может и получилось бы что, но проблема отпала, так как у многих во внутрисети появился анлим и вопрос мирового трафика уже не стоит так остро.
Трекер жив благодаря его создателю Кравченко Ивану, за что ему респект и уважение :)
Это, кстати, трекер сети Киевского Политехнического Института — bete.tv

PingWin 2 мар 2009 в 23:36

Мне вот как-то тоже код не показался сложным, хотя я под плюсы и не писал толком никогда :) Тем не менее, модифицированный мною (некоторая кастом-функциональность) xbtt работает вот уже более полугода без рестарта… :) Я и проект-то бросил давно :)

tifon 2 мар 2009 в 23:38

Тут скорее у меня просто опыта не хватило. Но все же и сейчас не считаю код красивым.
Генериловал для него диаграммы вызовов, так они очень уже запутанные получались :)

НЛО прилетело и опубликовало эту надпись здесь

Arceny 3 мар 2009 в 05:29

… и ни одного комментария в коде!

Q2W 2 мар 2009 в 23:19

По второй части — накопления запросов — сами доходили до этого.
А по первой части — однопоточном приложении, обрабатывающем запросы без блокировки — очень интересно.

alex14n 2 мар 2009 в 23:22

накопление угу, довольно банальная вещь. мы и в php в этом же проекте аналогично накапливаем часть счётчиков в APC и изредка сбрасываем в базу.

однопоточность в данном случае не идеал, просто так сложилось исторически, на мой взгляд всё-таки работу с базой стоило бы вынести в отдельный thread, но автор не хочет, мне тоже лень.

Q2W 2 мар 2009 в 23:37

> однопоточность в данном случае не идеал
Если Вы о том, что обработка одного запроса может быть слишком долгой, то да, тяжёлые куски лучше выносить в отдельные потоки.
Но, во-первых, в таком варианте количество потоков может быть меньше количества соединений.
А во-вторых, обработка запросов может быть достаточно быстрой, чтобы обойтись одним потоком, и избежать жуткого геморроя с отладкой и дедлоками.

И вообще: блокироваться — это как-то неправильно в принципе +)

alex14n 2 мар 2009 в 23:41

согласен, читаемости и надежности это только в ущерб, а выигрыш сомнительный

sosedoff 3 мар 2009 в 02:03

Это разве все в плане оптимизации? Имхо, это тока вершина айсберга

pwlnw 3 мар 2009 в 08:12

Этим людям хватило. А у вас синдром преждевременной эяк оптимизации.

sosedoff 3 мар 2009 в 20:11

Я имею ввиду оптимизацию системы. Всяко ведь не на стандартной конфигурации все работает.

alex14n 4 мар 2009 в 03:49

система FreeBSD, настроена по мотивам www.opennet.ru/base/net/tune_freebsd.txt.html

но мне хотелось описать именно архитектуру приложения, с акцентом на обработку большими пачками как сетевого I/O так и работы с базой. в теме C10K акцент в основном на отдачу статики, а здесь приложение умудряется ещё и в MySQL всё тысячи запросов в секунду писать

zaartix 3 мар 2009 в 07:59

опа, а еще отдельное спасибо за «ON DUPLICATE KEY UPDATE» =) не знал

shandor 3 мар 2009 в 08:14

По-первому — см. c10k в поисковиках

> и если для каждого создавать свой поток (thread) со своим стеком и постоянно переключаться между ними — ресурсов сервера очень быстро не хватит.
Не более чем точка зрения. Современные ОС могут держать без проблем даже миллионы тредов и выбор thread/poll не всегда столь очевиден, как вы описали.

DaemonI 3 мар 2009 в 10:30

У вас точно такая же точка зрения :) Дело в том, что переключения контекста и стека — это всегда затратно. Тут надо искать золотую середину между количеством тредов и эффективностью работы всего алгоритма. Можно хоть 10 тыс тредов создать, по одному на соединение, но работать они будут едва ли не медленее, чем 100 тредов и ассинхронное IO.

gorl 3 мар 2009 в 10:46

я, разрабатывая сервер для большого количества постоянных соединений остановился на смешанной модели пул процессов (не тредов) + асинхронная работа с сокетами.

DaemonI 3 мар 2009 в 10:57

А почему процессы, а не треды? Процессы — это еще затратнее. Тут еще сброс TLB кеша…

gorl 3 мар 2009 в 11:02

уперся в лимит одновременно открытых файловых дескрипторов.
расширять его по какой-то причине было нельзя.

shandor 3 мар 2009 в 12:01

> У вас точно такая же точка зрения
Откуда вы узнали мою точку зрения? Я её не публиковал :)
Я не говорил, что poll или треды это панацея. Есть задачи, где «рулит» poll, а есть — где «рулят» треды. Есть и такие, где «рулит» золотая середина.

Просто могу посоветовать посмотреть на затраты переключения и размеры стека для треда, к примеру, в том же линуксе. В последнее время всё не столь печально, как раньше, треды стали достаточно легковестными в плане переключения задач.

shandor 3 мар 2009 в 12:02

shandor 3 мар 2009 в 12:03

shandor 3 мар 2009 в 12:04

Сори… имхо хабр должен бороться с дубляжом

НЛО прилетело и опубликовало эту надпись здесь

alex14n 4 мар 2009 в 03:43

www.kegel.com/c10k.html#threaded конкретно NPTL есть ссылка про «10^6 threads»

НЛО прилетело и опубликовало эту надпись здесь

bNN 3 мар 2009 в 10:21

Спасибо за информацию. Сейчас как раз занимаемся переносом трекера с php на xbtt.

alekciy 3 мар 2009 в 10:35

А можно пояснить про актеров в Erlang-е? Что-то я там ни чего подобного не припомню…

nuit 3 мар 2009 в 10:39

Actor model

alekciy 3 мар 2009 в 13:00

Я понял, что это такая модель. Но я ни когда не видел, что бы где-то в Erlang-е использовали это понятие. Хотя из описания данной модели вижу, что VM именно так и работает.

powerman 5 мар 2009 в 23:27

Странно, что никто не упомянул такой недостаток описанной модели, как использование только одного ядра процессора. С некоторой натяжкой можно признать что второе ядро загрузит MySQL. Но если ядер больше двух, то модель с неблокирующим I/O в одном процессе начинает проигрывать модели с несколькими такими процессами.

Кроме того, помимо производительности есть фактор простоты кода (т.е. поддерживаемости приложения). Я тоже много лет занимаюсь неблокирующим I/O, epoll, etc. и могу искренне заявить, что этот код никогда не будет таким же простым как код блокирующего I/O в нитях.

Если для разработки таких серверов использовать языки/системы с очень лёгкими нитями (вроде Inferno), то производительность нитей с блокирующим I/O будет сравнима с производительностью epoll (сам проверял :)). При этом код будет значительно проще, плюс сервер будет автоматически масштабироваться при использовании многоядерных CPU (а в ближайшее время кол-во ядер скорее всего очень сильно увеличится).

akalend 30 окт 2009 в 13:00

всегда найдется то, чем загрузить второе и третье и четвертое ядро.

akalend 30 окт 2009 в 13:02

я не так крут и пишу серверы только год
и до этого использовал блокирующий в/в

ищу примеры неблокирующего I/O
тоже хочу использовать

akalend 30 окт 2009 в 12:59

похожую схему я использовал на tradebox
ну и др проектах

правда это к трекеру не относится,

vzblk 31 янв 2011 в 06:17

Для больших вставок в базу данных я использую механизм load data in file. Непревзойденная скорость вставки. Майскуэль парсит только один запрос, полезные данные в файле почти все, и дополнительных только разделители. Легко справляется с тысячами, десятками и сотнями тысяч строк в секунду. Если структуры таблиц не повзоляют такого делать, то можно делать отдельную таблицу для вставки и из нее делать необходимые инсерты-апдейты по другим таблицам. Эту временную таблицу так же можно создавать в памяти.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий