
Комментарии 11
Попавшие под подозрение были немедленно отключены, на DNS сервере сброшен кеш (а то мало ли — может уже отравлен), полисер перезапущен. Загрузка канала пошла вверх, пинги на 8.8.8.8 стабилизировались на обычных 18.5 мс - вот оно счатье!
то есть вы региональный провайдер, у вас канал 80Гбит+, который могли положить десяток ваших абонентов, вы же так рассуждали в моменте?
Не совсем понял вашу мысль.
В статье упоминается, что ложился один из серверов, а не канал упирался в потолок.
Так-то и один абонент может сложить канал, если у него есть T-Rex (но у нас не сложит :) )
я понял, вы нагрузку на железо называете, сложить канал и всплеск трафика, ясно.
к вашему посту отношения не имеет, просто вспомнил как в столичном провайдере инцидент решали два топ инженера, сидящие друг перед другом буквально, столи сдвинуты были и на одной и той же циске, одновременно меняли её настройки. минут 15 кряхтели пока тот что помоложе не увидел в логах что циску настраивает не только он. орали долго друг на друга xD
Но по итогу вышла крайне ненадежная вещь, и никакими обновлениями драйверов в Intel за столько лет ничего сделать так и не смогли.
Но ведь вы сами написали, что проблема не в карте, а в значении размера кольцевого буфера.
На одном из портов одной из карт значение размера кольцевого буфера отличалось от соседних, и явно было не то, что настроено изначально.
Касательно же самой карты.
Просто похоронили x710, выпустив на замену линейку E810.
Есть 3 модели этой карты.
Ethernet Controller X710-TM4
Ethernet Controller X710-AT2
Ethernet Controller X710-BM2
Launch Date X710-BM2 - Q4’15, а двух других - Q3’19.
А Launch Date для E810 - Q3'20, т.е. всё выглядит как плановая смена линейки. Предыдущая линейка карт X710 отработала 5 лет и имела max speed 10 Gb\s, а на смену ей пришла линейка E810, где max speed 100 Gb\s, т.е. в 10 раз быстрее.
5 лет вполне нормальный маркетинговый жизненный цикл для линейки сетевых карт.
Но ведь вы сами написали, что проблема не в карте, а в значении размера кольцевого буфера.
Нет. Проблема именно в карте. Значение буфера слетело в ходе работы, никто его не менял. При попытке вернуть на нужное значение - система стала колом.
Как впоследствии выяснилось, такие глюки на x710 ловили и раньше, но было не так критично.
Что касается x520, то они на рынке уже 15 лет, и к ним как-то нареканий нет, в отличие от x710
А что за ПО на серверах? Голый Linux или какой-то специфичный linux-based дистрибутив? Функционал на серверах BRAS или что-то большее?
Голый линукс. Debian. bird, nftables.
Функционал border+NAT+BRAS, другой функционал на других серверах.
а сколько pps в пике ? и nftables насколько производительней NAT делает чем классический iptables masquerade ?
а сколько pps в пике ?
5M
и nftables насколько производительней NAT делает чем классический iptables masquerade ?
Не знаю.
У нас давно CG-NAT используется, поэтому специально не меряли.
Те кто мерял - говорят, nftables выигрывает. Причем сильно.
Спасибо огромное . А что то типа libreqos www.opennet.ru/opennews/art.shtml?num=65075 смотрели или не актуально ?
Из жизни провайдеров: история одного факапа