Почему airtime важнее пересечения каналов

В управлении каналами и мощностью передатчика точек доступа Wi-Fi есть один вечный конфликт: чтобы сеть работала хорошо, нужно знать реальную ситуацию в эфире.

Богатые Cisco, Aruba и прочий Ruckus используют "третий глаз" у точки - отдельный радиоприемник, который для передачи данных вообще не используется. Отдельное радио? В мирное время - премиум-фича. В трудную годину - уже почти статья за растрату бюджетных денег.

Так что же делать нам, простым смертным?

Off-channel сканирование - вынужденное зло

Приходится уводить основное радио с рабочего канала и делать off-channel сканирование. Это всегда немного ломает связь. Получается неприятная рекурсия: чтобы Wi-Fi работал хорошо, его сначала нужно немного поломать диагностикой. Классика жанра - лечишь больного, но начинать приходится сразу с кровопускания.

Без этих данных любая автоматическая настройка RRM - это гадание на кофейной гуще.

Что такое dwell time и почему он бесит пользователей

Off-channel скан - это когда точка уходит на чужой канал, слушает эфир некоторое время (dwell time), собирает счетчики и возвращается назад.

Пока радио не на своём канале, оно не слышит своих клиентов и не может нормально обслуживать трафик. На практике это микро-паузы: растёт задержка, появляется джиттер, вылезают ретраи, голос и видео становятся нервными.

Чем чаще и дольше dwell - тем заметнее эффект. Клиенты начинают звонить в поддержку и орать: "Wi-Fi плохо работает, у меня Яндекс-телемост крякает опять!"

  • Слишком короткий dwell > измерение шумное, как твой сосед-пьяница по ночам

  • Слишком длинный dwell > сеть реально страдает, и ты сам становишься тем самым соседом

Идеального dwell не существует. Есть только вопрос: сколько "налога кровью клиентов" ты готов заплатить за наблюдаемость.

Почему пересечение каналов - не главный враг

Многие до сих пор мыслят Wi-Fi RRM как задачу "развести каналы, чтобы не пересекались". Это важно, но объясняет меньше половины реальных проблем.

Ты можешь выбрать канал с минимальным пересечением и получить днищенский Wi-Fi, потому что канал тупо занят соседями по этажу или с соседних этажей.

И наоборот: канал может выглядеть "грязным" по количеству сетей, но работать отлично, потому что соседей слышно тихо, а трафика у них почти нет. Соседи просто существуют, но не мешают - как тихие соседи, которые точно есть, но их не видно и не слышно.

Wi-Fi страдает не от того, что сосед существует. Wi-Fi страдает от того, что среда занята и ты не можешь передать. Это и есть airtime utilization (busy). Он отвечает на главный вопрос: сколько времени канал занят чужими передачами или помехами, из-за которых твоя точка и клиенты вынуждены молчать и злиться.

Три типичных ситуации, которые пересечение не видит

  1. Канал "почти без соседей", но airtime высокий
    Один соседний девайс льёт трафик 24/7, или внешняя помеха, или кто-то гонит видео на старом железе, которое забивает эфир 5 мегабитами на низком битрейте. Как бабуля, вставшая перед тобой на эскалаторе, когда ты стремительно мчишься к успеху.
    Пересечения мало - эфир забит. Результат: плохая задержка, низкая предсказуемость, клиенты дергаются и требуют достать им Cisco или хотя бы Хуявей.

  2. Канал "с кучей соседей", но airtime низкий
    Особенно ночью или в офисе после работы. Соседей слышно, пересечение страшное, но передавать почти никто не пытается. Реально работать можно отлично.

  3. Не-Wi-Fi интерференция
    Микроволновка из ада, Bluetooth-колонка соседа, радар и т.д. Пересечение по BSSID ничего не покажет — "соседей" как Wi-Fi устройств нет, а эфир занят. Клиенты и точки доступа слышат шум и молчат. Классика: "у меня нет соседей, но Wi-Fi говно".

Почему off-channel нужен именно для RRM

RRM принимает решение "какой канал лучше" - значит ему нужно сравнение каналов. На рабочем канале ты видишь только один столбец реальности.

Без off-channel данных по остальным каналам нет. RRM опирается на косвенные признаки: кто кого слышит, какие каналы "обычно хорошие" и прочая рандомная дичь. Это не оптимизация, это попытка проскочить на Фортуне - звучит заманчиво, но редко срабатывает.

Самое веселое, что радообстановка меняется по времени: утром так, в обед иначе, а вечером и ночью совсем по-другому. Поэтому настроенный wifi это не константа, это не то, что можно сделать 1 раз и забыть, это то, что нужно делать постоянно.

Почему графики airtime по off-channel выглядят как решето и это нормально

При коротком dwell измерения дискретные: попали в "окно" - высокий busy, через минуту тишина - низкий. Это нормально. Off-channel измерения по определению шумные. Лучшее на что можно рассчитывать, это чтобы не красивые, но юзабельные данные собирались не убивая при этом сеть.

Даже с шумом видны пики, тренды, явно плохие каналы. Можно сравнивать каналы между собой. Для RRM этого достаточно. Ниже две картинки, как точка видит эфир, когда сканирование работает практически незаметно для пользователей и пользы приносит примерно 0, а также картинка, где довольно агрессивное сканирование, которое балансирует на грани отказа в обслуживании клиентов, но при этом собирает бесценный airtime usage.

хорошо видно только рабочие каналы относительная темная полоса слева и синяя полоса посередине, несмотря на то, что сканирование выполняется, точка буквально ничего не слышит не на своих рабочих частотах
хорошо видно только рабочие каналы относительная темная полоса слева и синяя полоса посередине, несмотря на то, что сканирование выполняется, точка буквально ничего не слышит не на своих рабочих частотах

.

та же самая точка, но настроенная на агрессивное сканирование и уже помимо рабочих частот видно использование эфира и на соседних каналах
та же самая точка, но настроенная на агрессивное сканирование и уже помимо рабочих частот видно использование эфира и на соседних каналах

Как снизить вред dwell time, но сохранить пользу

  1. Не превращай сканирование в бессмысленную пытку
    Интенсивный off-channel - только когда действительно пересчитываешь конфигурацию или ищешь проблему. Фоновый скан - редкий и незаметный, как хороший киллер.

  2. Лучше много коротких уколов + агрегация, чем одно длинное
    Длинный dwell заметнее ломает связь. Короткие дают шум, но шум сглаживается накоплением.

  3. Никогда не сканируй всеми точками одновременно
    Сам себе создаёшь просадку качества, а потом лечишь последствия своего "лечения". Сам себе яму роешь.

  4. Добавь гистерезис
    Даже если канал ч��ть лучше - не обязательно прыгать. Смена канала сама по себе ощущается пользователями. Решение должно требовать заметного выигрыша. Не дёргайся лишний раз - клиенты и так на нервах.

Главная мысль

Пересечение каналов - это про потенциальный конфликт.
Airtime utilization - про факт, который напрямую бьёт по качеству: задержка, джиттер, потери, скорость, стабильность.

В реальном RRM airtime должен быть главным штрафом. Пересечение - вторичным фактором, который помогает выбрать между примерно равными вариантами или снизить взаимное влияние наших точек.

Off-channel - зло. Он реально ухудшает связь.
Но это контролируемое зло, которое даёт то, без чего Wi-Fi невозможно оптимизировать: видимость реального состояния эфира на чужих каналах.

Если ты не меряешь airtime - ты не управляешь Wi-Fi.