ValdikSS Sep 18 2013 at 15:43

FQ_CoDel — планировщик пакетов, который сделает все за вас

3 min

28K

Configuring Linux**nix*Network technologies*

+42

Comments 31

MAXH0 Sep 18 2013 at 16:55

>> Сожитель совершает видеозвонок по скайпу, а вы не хотите ему мешать?
Извините, но мне эта фраза слух режет…

unxed Sep 18 2013 at 17:10

В dd-wrt тоже уже есть. «NAT/QoS» -> «QoS» -> «Queueing Discipline».

ValdikSS Sep 18 2013 at 17:11

Здорово! А вот в Tomato, похоже, еще нет…

themiron Sep 18 2013 at 18:39

там уже некому этим заниматься, одни моддерды остались

amarao Sep 18 2013 at 17:47

Спасибо. Завтра потестирую на приличных скоростях и сетевухах.

ValdikSS Sep 18 2013 at 17:50

Буду ждать отчета. Если будете использовать скрипт, помните, что он отключает оффлоадинг.

amarao Sep 18 2013 at 17:52

Разумеется, ручками. За скрипт мне деньги платить не будут, а за знания — будут. Алсо, крайне любопытно, как поведёт себя система в условиях дистресса, то есть когда irq от сетевухи под потолок из-за флуда, например. Если метод позволит дать более fair share между всем происходящим, это будет вообще супер и эврика.

(А так же happy-happy для всех клиентов с ограниченной полосой, потому что им будет можно заказывать меньшую полосу и утилизировать её выше, без снижения показателей).

Dganic Sep 18 2013 at 19:10

А как проверить сработал скрипт или нет? Запускаю юнитом из пакета: aur.archlinux.org/packages/debloat-git/
На двух сетевухах запустился юнит, а на двух нет :( На которых не запустился покупал пол года назад)

ValdikSS Sep 18 2013 at 19:11

tc qdisc. Должно быть fq_codel, а не pfifo_fast.

Dganic Sep 18 2013 at 19:16

Спасибо, значит всё работает. А как проверить сетевуха поддерживает BQL или нет?

ValdikSS Sep 18 2013 at 19:25

Не знаю, честно говоря. У них на сайте есть список, но он старый.

amarao Sep 19 2013 at 07:28

в выводе ip l показывается текущий режим:

2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP mode DEFAULT qlen 1000
3: eth5: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP mode DEFAULT group default qlen 1000

KrD Sep 19 2013 at 08:20

Почти идентично (детали — в «man 8 ip»):

выхлоп

$ ip -0 addr | egrep -ve'^ '
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default
2: teql0: <NOARP> mtu 1500 qdisc noop state DOWN group default qlen 100
3: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
4: wlan0: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc mq state DOWN group default qlen 1000

$ ip link | egrep -ve'^ '
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN mode DEFAULT group default
2: teql0: <NOARP> mtu 1500 qdisc noop state DOWN mode DEFAULT group default qlen 100
3: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP mode DEFAULT group default qlen 1000
4: wlan0: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc mq state DOWN mode DORMANT group default qlen 1000

mrsom Sep 18 2013 at 19:25

Т.е. если бы сравнить всё это дело с flow hash keys dst + HTB с SFQ то разницы конечный юзер не заметит?

Просто вот так сходу даже не верится, что всё это можно будет заменить на
sudo tc qdisc add dev eth0 root fq_codel
А сколько ночей тогда было потрачено…

JDima Sep 19 2013 at 04:07

сайты будут открываться гораздо быстрее, чем с алгоритмами с фиксированными размерами очередей и fifo, которые используются по умолчанию.

Только очевидные замечания:
1) Линковая скорость сетевой карты должна быть не меньше реально возможной скорости обмена между узлами (например — ширина интернет-канала). Если первое выше (так обычно и бывает), то любые приоритезации на конечном сервере без включения шейпера бесполезны — заполнение очередей и дропы происходят где-то дальше.
2) Это никак не поможет скайпу в сценарии "качаю с торрентов, картинка рассыпается". Ибо пакеты задерживаются и теряются на стороне провайдера, и сделать с этим что-то довольно сложно.

А так… Ребята изобрели WFQ, известный сетевому железу черт знает сколько лет, со времен frame relay и раньше. И снизили размеры буферов (что не всегда хорошо — эффективность задействования канала упадет). Здорово…

0Lexx0 Sep 19 2013 at 06:39

> С использованием pfifo_fast пинг при забитом канале повышается до 8мс.
Вы так говорите, будто это серьезный показатель хорошей работы.

+ необходимость своего шейпера без BQL, как бы намекает на отсутствие нормальной борьбы с TCP синхронизацией?

amarao Sep 19 2013 at 07:31

Потестировал. Видимо, важным является ещё наличие шейперов дальше, но в рамках неограниченного линка на скорости среды, разница очень ощутимая.

iperf выдаёт на линке 943 мегабита. Пинг в состоянии простоя — около 0.3-0.5мс

Включение ipeft'а:

pfifo_fast — пинг вырастает до 26мс (iperf — 943 мегабита)
fq_codel — пинг вырастает до 1.9-2 мс (iperf показывает те же 943 мегабита)

Спасибо, выглядит крайне многообещающе.

phprus Sep 19 2013 at 07:50

Скажите пожалуйста, а Вы можете как-нибудь оценить есть ли влияние этого планировщика на справедливость разделения канала при запуске дополнительных TCP-соединений и на то, как быстро эта справедливость устанавливается?

amarao Sep 19 2013 at 08:44

Как раз думаю, заморачиваться или нет.

Ок, раз есть свободное время, сейчас проверю. Два сценария:

1) Nginx + ab через гигабитный интерфейс. fq_codel VS pfifo_fast
2) iperf в бэкграунде в обе стороны + nginx + ab, аналогично. В принципе, ключевым будет изменение latency.

Sirion Sep 19 2013 at 07:56

А есть такая же штука, но ~~с перламутровыми пуговицами~~ для виндовс?

amarao Sep 19 2013 at 09:15

Ок, меня чуть выше уговорили сравнить не пингами, а реальным TCP.

Итак, дано:

два тестовых сервера, на одном 3.11, на другом 3.10, с гигабитным линком через коммутатор. Канал практически чистый (только мой ssh).
Для теста используется тестовая страница nginx с отключенным логгированием и ab с глубиной 1 (т.к. нас не интересует степень параллельности и интересует насколько улучшается скорость запросов, приходящих рядом с толстым потоком). В качестве толстого потока — двухсторонний iperf с длиииным тестом в режиме «сколько сожрёт».

Показатели:

idle-канал:
pfifo_fast Time per request: 0.476 [ms] (mean)
fd_codel Time per request: 0.476 [ms] (mean)

Запускается iperf, в обе стороны:
pfifo_fast: Time per request: 4.573 [ms] (mean)
fd_codel Time per request: 4.582 [ms] (mean)

Забавно. 10-кратное увеличение latency понятно, пользы от fd_codel пока не вижу.

amarao Sep 19 2013 at 10:04

осознал ошибку, тест и нагрузка шла с того же ip. В качестве ab выступал другой сервер из того же сегмента.

idle: Time per request: Time per request: 0.348 [ms]

Запускается iperf, в обе стороны:
pfifo_fast: Time per request: 5.726 [ms] (mean)
fd_codel Time per request: 4.448 [ms] (mean)

Что-то есть, но во-первых от раза к разу плавает (например, только что показало не 4, а аж 10мс mean).

Всё равно не вижу эффекта, кроме быстрых пингов.

JDima Sep 19 2013 at 16:41

Предлагаю иной тест. Даже два. Описываю концепцию глобально — нюансов реализации на *NIX не знаю. Предположим, что сетевой интерфейс — 100мб/с (более наглядно).

1) fd_codel: пара мощных потоков на всю ширину канала и десяток мелких, скажем — фиксированных на 1мб/с, небольшими пакетами. Надо мониторить скорость и дропы по мелким.
2) pfifo_fast: каким-то образом снизить очереди в ОС до небольших значений, 5-10 пакетов, и сравнить по задержкам с ранними результатами.

amarao Sep 19 2013 at 20:30

У меня свой профессиональный интерес к линуксу. Я радостно спохватился, ура, latency-related fix, борьба с залёжными буфферами.

Как показал тест — не очень. latency на tcp-сессию не меняется, и ровно так же сваливается в унылую задницу при перегрузке канала, как и в pfifo.

ValdikSS Sep 20 2013 at 04:48

А вы оффлоадинг на картах отключали?

amarao Sep 24 2013 at 22:44

Я залез в эту область, много читал, ещё больше думал. Во-первых после BQL эффект от CoDel будет сильно меньший (т.к. BQL размер очереди регулирует автоматически).

Во-вторых, да, во всех тестах на latency все HW-assisted должны быть нафиг выключены, потому что мешают дисциплинам дисциплинировать.

В третьих сам fq_codel в дефолтной установке работает от 100мс, то есть в условиях быстрой тонкой сети никак себя проявлять и не должен.

Короче, перепроверять и дочитывать.

pavelsh Sep 24 2013 at 22:56

А как общее мнение? Будет это работать для твоих задач?

amarao Sep 25 2013 at 00:25

У меня сейчас практически нет задач, потому что мне 4 дня в Селектеле работать осталось.

По моей предыдущей практике сеть никогда не была источником затруднений — 10G для большинства практических задач более чем достаточно и канал там всегда недоутилизированный.

Пожалуй, в рамках борьбы за снижение latency, эти вещи имели бы смысл, но в условиях условно-idle канала любые дисциплины вырождаются в fifo или что-то похожее. В худшем случае 2-3 пакета в очереди — ну чего с ними городить.

Если на новом месте работы будут нагруженные по самые яй… wire-speed сервера, там это будет иметь значение.

Опции CoDel я пока ещё не дочитал, дочитаю, попробую поиграться на домашней машине (у меня как раз скорость среды — 100 мегабит в интернет, то есть локальная буфферизация does matter). Хотя по моим наблюдениям с момента перехода с «чужого шейпинга» на «скорость среды» никакая загрузка канала не приводит к катастрофическим лагам (как в случае лимита по скорости методами шейпинга у провайдера).

oisee Sep 19 2013 at 10:48

Почему Кристофер Вальц притворяется Дэном Йорком?

EvilMan Sep 27 2013 at 08:51

Эрик Думазет (Eric Dumazet) написал ещё один шедулер с ёмким названием FQ (FairQueue) с несколькими интересными плюшками. Было бы интересно сравнить его с fq_codel. Подробности тут. Так же ещё небольшая заметка о нём на lwm.net.

amarao Oct 3 2014 at 20:58

Ага, я нашёл, наконец-таки, применение ему. При использовании tcp-туннеля и мультиплексировании в этом туннеле нескольких tcp (обычный tun через ssh, через который все остальные ходят), установка этой дисциплины сильно снижает тупление новых коннектов при активно жрущей толстой сессии, забивающей весь канал.

Типовой пример — стим через vpn (tcp), если он качает игрушку, раньше сёрфить было невыносимо. Теперь — не отлично, но очень даже терпимо.