Как стать автором
Обновить
1108.82
OTUS
Цифровые навыки от ведущих экспертов

Следует ли вам обновить параметры Route Flap Damping?

Время на прочтение6 мин
Количество просмотров1.7K
Автор оригинала: Clemens Mosig

Route Flap Damping (RFD) — это механизм локального подавления оттока обновлений BGP в Интернете. Стандартные параметры конфигурации RFD в маршрутизаторах слишком строгие и вызывают нежелательное блокирование изменений префикса, что приводит к проблемам с доступностью. Исследование 2010 года, посвященное IPv4 (и только одному производителю маршрутизаторов, Cisco), определило набор параметров конфигурации, позволяющих избежать этих проблем.

В этой заметке представлены результаты исследования 2021 года, проведенного мной и моими коллегами из Freie Universität Berlin, IIJ/Arrcus, Université de Strasbourg и HAW Hamburg, целью которого было воспроизвести и расширить результаты аналогичного исследования 2010 года, но на этот раз с учетом IPv6 и еще одного производителя маршрутизаторов (Juniper).

Ключевые моменты:

Текущие рекомендации по конфигурации (BCP 194 и ripe-580) актуальны на сегодняшний день и останутся таковыми в будущем, если сохранятся существующие тенденции, учитывая IPv4 и IPv6.

В 2020 году 3% всех префиксов IPv4 будут вызывать 53,9% обновлений +BGP (74,8% в IPv6).

Операторы сетей должны проверить свои конфигурации RFD на предмет наличия приносящих вред настроек по умолчанию от вендора и предложить Juniper и Cisco обновить стандартные значения в своих реализациях RFD.

3% всех префиксов IPv4 вызвали 53,9% обновлений BGP

Мы измеряли отток BGP с помощью публичных проектов коллекторов маршрутов Isolario, RIPE RIS и RouteViews. Были удалены дубликаты BGP (все атрибуты совпадают), поскольку они не запускали выбор лучшего пути и, скорее всего, были связаны с активностью обновления iBGP в сети точки наблюдения (см. Labovitz и др. и Park и др.).

Рисунок 1 показывает, что абсолютный показатель оттока BGP увеличился за последние десять лет. Этот рост пропорционален количеству активных автономных систем (ASes) в Интернете (размер топологии) (Jia и др.). Кроме того, IPv6, похоже, демонстрирует гораздо большую активность обновления на префикс и в целом. Эта разница между IPv4 и IPv6, при нормализации ее по размеру топологии Интернета, постоянна во времени. По крайней мере, с этой точки зрения, рост активности маршрутизации соответствует общепринятым ожиданиям.

На рисунке 1 мы также можем увидеть, как активность обновления BGP распределяется между префиксами в 2020 и 2010 годах. Во-первых, неактивные префиксы (левая часть графика). Во-вторых, префиксы с некоторой активностью обновления (большинство в середине). В-третьих, наиболее интересная группа — "тяжеловесы" (правая часть графика). Для сравнения, в 2020 году 3% всех префиксов IPv4 вызвали 53,9% обновлений BGP (74,8% в IPv6).

Рисунок 1 - Среднее количество анонсов и отзывов на префикс во всех точках обзора в период с 1 по 7 июня 2010 и 2020 гг.
Рисунок 1 - Среднее количество анонсов и отзывов на префикс во всех точках обзора в период с 1 по 7 июня 2010 и 2020 гг.

На рисунке 2 более подробно рассмотрена почасовая частота обновлений в течение недели для 50 самых популярных префиксов. Изменение поведения префикса является регулярным, если частота обновления превышает 10 обновлений в час в течение всего периода измерения, и нерегулярным в противном случае. Более темные линии показывают, что набор префиксов имеет одинаковую частоту обновления, поскольку линии нарисованы с низким значением альфа (компонента). При рассмотрении этих префиксов в течение более длительного периода, например, с помощью RIPEstat, эти графики растягиваются на недели, а часто и на несколько месяцев (см. пример). Мы не видим причин, по которым это действие по обновлению полезно.

Рисунок 2 - Количество обновлений с разбивкой по часам для 50 самых зашумленных префиксов (ранжированных по кумулятивному количеству обновлений), нормализованное по количеству точек обзора.
Рисунок 2 - Количество обновлений с разбивкой по часам для 50 самых зашумленных префиксов (ранжированных по кумулятивному количеству обновлений), нормализованное по количеству точек обзора.

Каковы же оптимальные параметры конфигурации для RFD?

Для определения оптимальных конфигураций параметров мы выбираем репрезентативное подмножество точек наблюдения в качестве пиров для нашей программы эмуляции RFD. Затем мы анализируем изменения потерь в первую неделю июня 2020 года. Подробнее о нашей установке для измерения RFD можно узнать из нашего документа TMA 2021.

Конфигурирование RFD означает настройку порога подавления. Хороший порог подавления не бывает слишком низким или высоким, поскольку вы не хотите подавлять анонсы префиксов, вызванные нормальным оттоком BGP, и не хотите допускать наихудший отток (тяжелые случаи).

Чтобы полностью оценить последствия использования маршрутизатора с неправильной конфигурацией, на рисунке 3 показана доля префиксов, которые хотя бы раз были демпфированы в нашем наборе точек наблюдения. Пунктирные линии показывают долю префиксов, которые были демпфированы хотя бы одной точкой наблюдения. Боксплот под пунктирными линиями показывает диапазон уровней подавления в точках обзора.

При пороге подавления по умолчанию Cisco (2000) 29% префиксов IPv4 и 37% префиксов IPv6 были демпфированы и, следовательно, недостижимы, по крайней мере, одной точкой обзора! Неудивительно, что доля подавленных префиксов значительно различается в разных точках обзора. Но мы не можем давать индивидуальные рекомендации для каждой сети, поэтому 2000 (и 4000) ни в коем случае не может быть общепринятым порогом подавления.

Рисунок 3 - Боксплот (диаграмма размаха "ящик с усами") по точкам обзора, показывающий долю глобального RIB, который был демпфирован хотя бы один раз. Половина данных находится в рамке, разделенной медианой, а “усы” расположены на уровне 1,5 IQR. Пунктирные линии представляют собой общую долю префиксов, которые были демпфированы хотя бы одной точкой обзора.
Рисунок 3 - Боксплот (диаграмма размаха "ящик с усами") по точкам обзора, показывающий долю глобального RIB, который был демпфирован хотя бы один раз. Половина данных находится в рамке, разделенной медианой, а “усы” расположены на уровне 1,5 IQR. Пунктирные линии представляют собой общую долю префиксов, которые были демпфированы хотя бы одной точкой обзора.

Но какой порог подавления является слишком высоким?

На рисунке 4 мы изобразили другую визуализацию того, как префиксы демпфировались в среднем при различных порогах подавления. В данной строке (для порога подавления) показаны все префиксы, отсортированные по общему количеству обновлений от низкого к высокому, а также по продолжительности их подавления.

При стандартном пороге подавления Cisco префиксы со всех уровней оттока подавляются как минимум один раз. При 6000 подавляется гораздо меньше префиксов, в то время как большинство из верхних 3% все еще подавляются. В качестве общей рекомендации мы по-прежнему считаем, что порог подавления выше 6000, максимум 12000, является наиболее разумным. Опытные пользователи RFD могут начать с 6000, посмотреть, какая часть таблицы маршрутизации подавляется, а затем настроить порог подавления в соответствии со своими потребностями.

Вы можете удивиться, почему для 97% префиксов распределение цветов на приведенном ниже графике выглядит довольно похожим для обеих версий IP, несмотря на то, что абсолютное число обновлений в IPv6 намного выше. Так происходит потому, что медианное число обновлений для префиксов одинаково в обеих версиях IP, при этом само среднее значение в IPv6 в ∼4× раза выше, то есть меньшее число префиксов вызывает больше обновлений в IPv6.

Рисунок 4 - Средняя кумулятивная длительность демпфирования (цвет) для каждого префикса при различных пороговых значениях подавления. Префиксы отсортированы по общему количеству обновлений.
Рисунок 4 - Средняя кумулятивная длительность демпфирования (цвет) для каждого префикса при различных пороговых значениях подавления. Префиксы отсортированы по общему количеству обновлений.

Мы определили рекомендации по параметрам RFD для современного Интернета, но что насчет будущего? Механизм RFD реализует экспоненциальный спад, основанный на периоде полураспада. Это означает, что количество (обычных) обновлений BGP должно увеличиваться экспоненциально, чтобы сделать текущие пороговые значения непригодными. Поскольку такое увеличение является очень маловероятным сценарием, то рекомендации в отношении параметров RFD вряд ли потребуют изменения в будущем. Если наш прогноз оттока BGP окажется неверным и операционные префиксы в будущем продемонстрируют значительно больший отток, то в этом случае гораздо большее беспокойство вызовут совершенно другие проблемы.

В идеале, стандартные параметры конфигурации обновляются в имплементациях вендоров. Понятно, что это может быть неожиданностью для сетевых операторов, которые полагаются на значения по умолчанию. Но вендоры могли бы сделать простое предупреждение о том, что текущая конфигурация устарела и должна быть заменена.

Рекомендации по параметрам RFD

RFD ПАРАМЕТР

CISCO ПО УМОЛЧАНИЮ

JUNIPER ПО УМОЛЧАНИЮ

РЕКОМЕНДАЦИИ: BCP 194 / RIPE-580

Порог подавления

2000

3000

6000

Ограничение на повторное анонсирование

0

1000

0/1000

Ограничение на изменение атрибутов

500

500

500

Ограничение на отзыв

1000

1000

1000

Период полураспада (мин)

15

15

15

Порог повторного использования

750

750

750

Максимальное время подавления (мин)

60

60

60

Таблица 1 - Рекомендации по параметрам RFD

Это исследование было первоначально опубликовано на IEEE/IFIP TMA 2021. Чтобы узнать подробнее, загшяните на сайт rfd.rg.net.


Материал подготовлен в рамках специализации "Network Engineer".

Всех желающих приглашаем на бесплатное demo-занятие «Настройка MPLS L3VPN». На занятии мы:
— Рассмотрим использование MPLSL3VPN для организации частных каналов по сетям поставщика услуг связи.
— Настроим MPLSL3VPN используя VRF.
— Поговорим о типичных неисправностях которые могут возникнуть в процессе настройки.

Теги:
Хабы:
Всего голосов 7: ↑6 и ↓1+5
Комментарии0

Публикации

Информация

Сайт
otus.ru
Дата регистрации
Дата основания
Численность
101–200 человек
Местоположение
Россия
Представитель
OTUS