@ftc24 мар 2023 в 21:01

Когда переподключения ускоряют работу по сети. Разбираемся с быстродействием TCP-сокетов

Средний

7 мин

11K

PHP * C++ * Системное программирование * Сетевые технологии *

Кейс

+26

Комментарии 15

@mbait 24 мар 2023 в 23:29

Тесты - огонь! Посылаем полтора байта и ждём ответ, потому срываем покровы на хабре. Чем iperf не угодил?

@ftc 25 мар 2023 в 06:15

А чем iperf поможет для организации IPC между плюсовым и PHP-шным приложениями? Изначально-то задача именно в этом стояла. А тут я решил детально разобраться, почему вариант "обмениваться через TCP сокеты" так странно себя ведёт.

@AlanDrakes 25 мар 2023 в 06:23

У меня когда-то была обратная задача: собрать на минималистичном железе устройство для теста скорости. И из-за ограниченного объёма памяти для буфера приёма (микроконтроллер) мало что получилось. Хотя обмен данными по кабелю между ПК и устройством таки смог выжать почти 90МБит при TCP соединении.

@ftc 25 мар 2023 в 06:26

А как получилось, что оно именно в память упиралось? Или там размер доступной памяти меньше чем MSS у TCP?

@AlanDrakes 26 мар 2023 в 01:47

Размер доступной памяти был всего 40кБ, что куда как меньше 64кБ у окна. Приходилось изголяться. А для снижения нагрузки на процессорную часть пытался описать подобие Delayed-ACK, но выходила какая-то фигня. В итоге проект так и не заработал как надо из-за сложности и смены потребностей.

@rPman 25 мар 2023 в 02:29

десятков тысяч rps так и не удалось достичь?

@ftc 25 мар 2023 в 06:13

Не ставил себе такую цель. Хотя интересно, можно ли к варианту с shared memory приблизиться.

@ryo_oh_ki 25 мар 2023 в 07:37

10 мс для сетевого пакета это ненормально долго. У вас принципиально что-то не так работает как должно.

@ftc 25 мар 2023 в 08:00

Почитать бы где-нибудь на тему "а как оно правильнее всего делается".
Без учёта многопоточности конечно (т.е. оптимизируем именно обмен между двумя процессами, без попыток сэкономить CPU).

Или если мы тут упираемся в переключения контекста (система не отдаёт нам управление раньше, чем через 10мс) - тогда в таком варианте больше "выжать" не получится. Могу сказать, что у меня эксперимент не совсем чистый - на машине помимо этого теста много всякого крутится, потому это может влиять.

@ryo_oh_ki 25 мар 2023 в 09:05

Или если мы тут упираемся в переключения контекста (система не отдаёт нам управление раньше, чем через 10мс)

Это не совсем так работает, "processor time slice" эффективен только при конкуренции за ресурсы ЦП, если есть свободное ядро - всё выполняется параллельно. Более того, это настраиваемый параметр. Но, не думаю, что в вашем случае это имеет значение.

НЛО прилетело и опубликовало эту надпись здесь

@ftc 26 мар 2023 в 05:55

Да, именно так. Причем получилось, что я делаю 2 раза write (длина, потом тело), а затем read. А в доке не delayed ack написано, что именно такой кейс работает плохо.

@Kohelet 25 мар 2023 в 14:21

Вроде это основы — если вас интересует производительность, собирайте все, что нужно отправить, в одну операцию send.

@ftc 26 мар 2023 в 05:57

Почему и написал эту статью - как по мне, получился хороший пример принципа дырявых абстракций. Мораль - если воспринимать TCP-коннект просто как канал, куда можно посылать и получать байты - можно получить неожиданные и неприятные эффекты.

@takeon 1 апр 2023 в 10:20

net.ipv4.tcp_low_latency=1 сделает то что вы хотите. Или можно попроверять профили tuned, где есть в названии latency.

Ну и классическое

"после починки проблем с ACK"

Это не баг, это фича

Зарегистрируйтесь на Хабре, чтобы оставить комментарий