PatientZero Apr 15 2022 at 14:13

Миллион одновременных соединений

8 min

68K

Server optimization*Server Administration*Network technologies*

Translation

+99

Comments 27

gdt Apr 15 2022 at 15:56

Круто, действительно интересно, спасибо за перевод. Однако я бы еще пару выводов для себя сделал в этом контексте — macOS не нужен, jvm не нужен
Типа если уж принимать миллионы клиентов — можно и заточиться под конкретное железо и ос, и тут jvm скорее мешает чем помогает, а мак очевидно не лучший выбор по итогам тестов :)

thatsme Apr 17 2022 at 11:25

Что-то мне не кажется, что это "круто". Это такой приём "распространено заблуждение что ...", и дальше идёт его опровержение. А на самом деле это заблуждение не так уж и распространено.
Вот 12 миллионов сокетов: https://habr.com/ru/post/460847/
Можно и 20 ... Весь вопрос в ресурсах (ЦПУ/ОЗУ).

vit1251 Apr 19 2022 at 21:51

Какая-то очень странная тут задача у автора. Если он хотел обеспечить обработку максимума сокетов, то добро пожаловать в обработку сырых TCP ... и это не так страшно. Можно сделать хоть миллион, а можно хоть и миллиард сокетов, но дело тут не в количестве, а в качестве обслуживания. Если компания ставит задачей обработку такого числа подключений, то возникает вопрос: "За какое время будет обработан тот или иной запрос?" Скажем если у автора даже NMI операции движения мышки уже испытывали голодание, то говорить о разумном времени обслуживания - нет смысла. Я все это к тому, что изначально нет вопроса в количестве сокетов и подключений, а стоит вопрос именно в эффективности. И конечно когда мы докатились до эффективности, то вопрос каким образом тут оказалось macOS и Java? Эти инструменты вообще про красоту и лень программиста (разумный баланс цена/время). Я все к тому, что важно наверное сначала верно обозначать решаемый вопрос - перед какими-то титаническими подвигами в детских песочницах.

khajiit Apr 20 2022 at 04:41

Движения мышки это не NMI, это polling. А отрисовка курсора — вообще в userspace.

Virviil Sep 21 2023 at 08:12

Можно конечно и заточиться, но если ты стартап с непроверенной гипотезой и сомнительным финансированием - ты хочешь писать быстро в прототипном стиле силами двух с половиной человек, а потом магически отмасштабировать решение на миллионы пользователей.
И это я сейчас про whatsapp + erlang | discord + elixir, подозрительно одинаковые истории успеха. И ВМ там очень помогла.

novoselov Apr 15 2022 at 17:36

The Secret To 10 Million Concurrent Connections

http://highscalability.com/blog/2013/5/13/the-secret-to-10-million-concurrent-connections-the-kernel-i.html

dmitryvolochaev Apr 15 2022 at 18:45

Теоретический предел немного меньше указанного. Портов не 65536, а только 65535, потому что нулевого порта нет.

Кроме того, если доверить операционной системе выбор клиентского порта, то Windows выбирает только номера, начиная с 1024.

В коде для эксперимента connectionsPerAddress по умолчанию 5000, а не 65536 и даже не 65535

A1EF Apr 15 2022 at 23:24

Кстати, а в Linux клиентский порт и вовсе с 32768 начинается:

~ $ sysctl net.ipv4.ip_local_port_range net.ipv4.ip_local_port_range = 32768 60999

DistortNeo Apr 16 2022 at 11:10

В разных операционных системах диапазон портов разный:

https://en.wikipedia.org/wiki/Ephemeral_port

vinrom Apr 16 2022 at 11:51

для window dynamic port range: 49152-65535 для post-vista (https://docs.microsoft.com/en-us/troubleshoot/windows-server/networking/default-dynamic-port-range-tcpip-chang), xp - 1025-5000.

mvv-rus Apr 16 2022 at 16:10

Кроме того, если доверить операционной системе выбор клиентского порта, то Windows выбирает только номера, начиная с 1024.

Старая информация, верная только для Windows NT/2K/XP/2K3

unC0Rr Apr 15 2022 at 20:10

Возможно, проще было не назначать алиасы лупбэку, а просто использовать другие адреса из подсети 127.0.0.1/8

DustCn Apr 15 2022 at 20:41

An IPv6 address consists of 128 bits.

aleks_raiden Apr 16 2022 at 08:14

Было уже раньше, на Хабре тоже (целый цикл): https://habr.com/ru/post/212885/

vasyakolobok77 Apr 16 2022 at 11:02

Немного непонятны некоторые моменты.
Если сервер и клиенты на одной машине, зачем 10.* подсеть, чем 127.* не устроила?
Если суть поставить рекорд, то стоило уменьшить до минимума буферы под TCP, а на стороне сервера увеличить backlog очередь соединений до максимума.

vlanko Apr 17 2022 at 10:06

Так не на одной. Мак+Линукс.

agorshkov23 Apr 16 2022 at 11:51

Интересно, сколько сможет пройти соединений через NAT. Около 65к?

amarao Apr 16 2022 at 14:49

Сколько в настройках conntrack сделаете, столько и будет. Больше миллиона записей conntrack точно выдерживает.

Firelander Apr 18 2022 at 11:43

а есть какие-то способы отслеживания соединений кроме порта? Потому что если все клиенты за NAT будут стучаться к одному и тому же серверу по одному айпи, то как раз теоретический предел меньше этих 65к соединений. По tcp там возможно есть какие-то механизмы, а с udp вопрос

prefrontalCortex Apr 16 2022 at 11:54

Спасибо за статью, очень интересно!

Hidden text

серию фальшивых адресов замыкания на себя (loopback address)

Я чаще наталкивался на вариант перевода "петлевой интерфейс" или "петлевой адрес".

amarao Apr 16 2022 at 14:53

На самом деле проблема нехватки портов обычно касается апстримов у проксирующих серверов (собственно, исходящие соединения). На практике "открытый порт" - это фикция ОС, формализм в её базе. Сколько можно реалистично обслуживать соединений? Чаще всего этот показатель ограничен числом pps, которые может обработать сетевой стек (последний раз, когда я серьёзно занимался бенчмарками - около миллиона на сетевую карту, наверное, сейчас больше).

eigrad Apr 17 2022 at 07:05

Забавно что автор статьи тоже упёрся в исходящие соединения, но почему-то не пришел к выводу что ноги этого "мифа" растут как раз из исходящих соединений на балансере :-).

Paul_Arakelyan Apr 16 2022 at 18:28

Смешались кони и люди, а потом распутались :).

Изначально перепутаны понятия "сокет" (суть дескриптор соединения) и "порт", на чём и построена интрига.

Всю статью можно уместить в пару абзацев:

"Клиент в сторону одной пары server ip:port с одного IP может открыть до 65535 tcp-соединений, с той стороны они потребуют 65535 сокетов, которых можно завести - на сколько памяти и проца хватит. Ибо в tcp-пакетах прописана пары (изменяемый) client IP/port и (неизменный) server ip/port. Кому хочется большего - делает NAT с помощью пула адресов и соединяется с пулом адресов сервера. Хочется странного - можете делать свой протокол поверх UDP или вообще свой протокол.

Обработать дофигища входящих подключений - можно, если у сервера достаточно памяти и проца, и в ОС возможно задать нужные лимиты по сокетам и прочим дескрипторам, но иногда это потребует усилий мозгом - если нужно это сделать быстро."

Spicker Apr 17 2022 at 08:00

У меня сервера на RHEL с 64GB оперативы начинают уходить в себя при ~14500 входящих сессий TWAMP (perfSONAR). Каждая сессия резервирует ~4KB виртуальной памяти. Много ковырял всякие конфиги но ничего внятного добиться не смог. Так что считаю перечитаю несколько раз. Если у кого-то есть готовый рецепт, буду весьма благодарен.

dimuska139 Apr 17 2022 at 09:33

Спустя несколько секунд после начала эксперимента операционная система решила задействовать swap, хотя у меня ещё была память.

Это нормальное поведение. Регулируется с помощью параметра vm.swappiness в файле /etc/sysctl.conf (после сохранения надо перезагрузиться). Он определяет процент оставшейся свободной оперативной памяти, при котором начинается задействоваться swap. Текущее значение этого параметра можно посмотреть с помощью команды cat /proc/sys/vm/swappiness.

morijndael Apr 18 2022 at 01:07

Не совсем

vm.swappiness определяет баланс между файловыми и анонимными страницами, что системе предпочтительнее высвобождать
Если система решит, что оптимальнее будет скинуть что-то в своп вместо сброса файловых кешей, то она имеет полное право так сделать

Вот тут есть перевод классной статьи, где очень подробно разбирается механизм работы swap

dimuska139 Apr 18 2022 at 14:56

Благодарю