Минус, если что, не мой) За переделанное форматирование отдельный респект, но не стоило так запариваться, я же шутил) А по сути вы в последнем абзаце сами всё верно подытожили. Сигнатура у SSH светится ярче любого VPN, но забанить его... - это значит положить корпсектор. Вот на этой экономической броне он сейчас и выезжает. Возможно я изменю мнение когда столкнусь с блокировкой, но пока на практике это самый ломовой туннель.
Чуть глаза не сломал, но прочитал) Вы вообще про домашний трафик или межсерверный? WG, OpenVPN и L2TP выкосили по сигнатурам. А вот голые SSH-туннели за границу я использую везде. Лично дома (Ростелеком), у клиентов, разбросанных по всей стране (интернет и на юр., и на физ. лицах), и между серверами в ДЦ из RU на иностранные. Я даже не знаю, что будет, если SSH порубят, потому что последствия будут серьезные. Думаю, не рискнут, но это ИМХО.
Не знаю, читали ли вы саму статью или только комментарии, но вы ошибаетесь насчет "любой другой протокол тоже будет работать". На транзитных узлах в РФ точно так же стоят ТСПУ и жестко фильтруют границу (в статье как раз описаны массовые отвалы на РФ-облаках).Попробуйте поднять с такого РФ-сервера в загран какой-нибудь vless: он нагенерит параллельных хендшейков, притворится браузером и тут же поймает поведенческий бан, потому что браузер с серверного IP, это уже аномалия. Голый SSH не банят ровно потому, что межсерверный SSH - это естественный и легитимный трафик. Пока что))
Трансграничный трафик сейчас смотрят под лупой, поэтому многие и страдают. К слову, если точка входа висит на домашнем IP, то там вообще своя магия доверия, но это уже лирика). Но в целом да, SSH решает. Рад, что поняли друг друга) В этом и смысл всего: аккумулировать в РФ, пробрасывать через туннель.
Локальный? Вы мыслите категориями домашнего провайдера) Я мыслю масштабами покрупнее и на местечковые ТСПУ не полагаюсь.Трафик собирается на транзитную ноду внутри РФ, и уже оттуда поднят магистральный SSH-туннель через границу. Внутрироссийский трафик никто не режет, а границу этот SSH пробивает без проблем. Клиенты из абсолютно разных регионов и сетей сидят и горя не знают. Архитектуру надо строить, а не на локального провайдера кивать.
Чем хитрее комбайн для обхода DPI, тем быстрее его банят по поведению. Попытки мимикрировать под обычный HTTPS сейчас только привлекают внимание автоматики. А старый добрый голый SSH работает как часы ровно потому, что не пытается казаться чем-то другим и не плодит параллельные хендшейки. Тот случай, когда дедовский unix-way тупо уделал новомодные протоколы.
Спасибо за статью и идеи. Тема мне близка. Классические таймеры мне не помогают и обычно быстро забрасываются. При гиперфокусе можно просидеть за задачей много часов подряд и совершенно не заметить усталости, а потом выпасть из ритма на несколько дней. Я порой не чувствую физические лимиты в моменте. Поэтому идея оценивать именно уровень сонливости и усталости кажется мне самым правильным подходом.
Отличный материал! Почитал, посмотрел на вашу красоту, а потом перевел взгляд на свою систему дымоудаления на съемной квартире... Крышка с вентилятора снята не просто так — это «открытый аппаратный API» для регулирования режимов 😁 Вдохновился вашей статьёй, пойду дорабатывать!
А я про экономию памяти не писал, я писал о считываении весов только активных экспертов (сколько памяти прочитает CPU/GPU на генерацию следующего токена), т.е. речь именно про ту память которая участвует в процессе вычисления (к слову, ik_llama.cpp умеет не грузить целиком, а только базовые слои и нужных экспертов). Просто констатирую и обосновываю, что для сравнения модель qwen3.6-35b-a3b более близкий аналог к теме статьи.
Смотря по какому показателю, по качеству ответа или по быстродействию. 35B-A3B кратно быстрее 27B... ну 3GB или 27GB в ram/vram памяти? - разница огромна. Поскольку статья именно о быстродействии, то он достигается на моделях со смесью экспертов, как раз за счёт снижения потребления (v)ram. В общем, если сравнивать, то одинаковые архитектуры) Qwen3.6-27B - это не MoE, а статья про MoE (смесь экспертов). В "интеллектуальном" показателе Qwen3.6-27B конечно уйдёт вперёд, но будет в несколько раз медленее. Мой локальный тест именно производительности, для справки: Qwen3.6-27B 7TPS, а Qwen3.6-35B-A3B 35TPS на Xeon W9-3575X (8 каналов памяти, но два чиплета)
Постоянно открытый туннель является долгоживущим TCP-соединением, клиент вынужден регулярно обмениваться с сервером keepalive-пакетами. Я же предлагаю автоматизировать создание туннеля только на время когда нужно пустить по нему трафик.
Всё совершенно верно, спасибо за отличное дополнение! Начиная с Ubuntu 22.10 сервер (sshd) по умолчанию работает через сокеты. А в статье применяется та же самая механика, но уже к клиенту для управления исходящими туннелями, демонстрируя возможности socket activation.
Вручную команду запускать не нужно. Systemd сам дежурит на порту 10201. Как только браузер к нему обращается systemd автоматически поднимает ssh-туннель и передаёт ему это соединение. В этом и заключается главная фишка.
Минус, если что, не мой) За переделанное форматирование отдельный респект, но не стоило так запариваться, я же шутил) А по сути вы в последнем абзаце сами всё верно подытожили. Сигнатура у SSH светится ярче любого VPN, но забанить его... - это значит положить корпсектор. Вот на этой экономической броне он сейчас и выезжает. Возможно я изменю мнение когда столкнусь с блокировкой, но пока на практике это самый ломовой туннель.
Плюсанул в карму за активность)
Чуть глаза не сломал, но прочитал) Вы вообще про домашний трафик или межсерверный? WG, OpenVPN и L2TP выкосили по сигнатурам. А вот голые SSH-туннели за границу я использую везде. Лично дома (Ростелеком), у клиентов, разбросанных по всей стране (интернет и на юр., и на физ. лицах), и между серверами в ДЦ из RU на иностранные. Я даже не знаю, что будет, если SSH порубят, потому что последствия будут серьезные. Думаю, не рискнут, но это ИМХО.
Не знаю, читали ли вы саму статью или только комментарии, но вы ошибаетесь насчет "любой другой протокол тоже будет работать". На транзитных узлах в РФ точно так же стоят ТСПУ и жестко фильтруют границу (в статье как раз описаны массовые отвалы на РФ-облаках).Попробуйте поднять с такого РФ-сервера в загран какой-нибудь vless: он нагенерит параллельных хендшейков, притворится браузером и тут же поймает поведенческий бан, потому что браузер с серверного IP, это уже аномалия. Голый SSH не банят ровно потому, что межсерверный SSH - это естественный и легитимный трафик. Пока что))
Трансграничный трафик сейчас смотрят под лупой, поэтому многие и страдают. К слову, если точка входа висит на домашнем IP, то там вообще своя магия доверия, но это уже лирика). Но в целом да, SSH решает. Рад, что поняли друг друга) В этом и смысл всего: аккумулировать в РФ, пробрасывать через туннель.
Локальный? Вы мыслите категориями домашнего провайдера) Я мыслю масштабами покрупнее и на местечковые ТСПУ не полагаюсь.Трафик собирается на транзитную ноду внутри РФ, и уже оттуда поднят магистральный SSH-туннель через границу. Внутрироссийский трафик никто не режет, а границу этот SSH пробивает без проблем. Клиенты из абсолютно разных регионов и сетей сидят и горя не знают. Архитектуру надо строить, а не на локального провайдера кивать.
Чем хитрее комбайн для обхода DPI, тем быстрее его банят по поведению. Попытки мимикрировать под обычный HTTPS сейчас только привлекают внимание автоматики. А старый добрый голый SSH работает как часы ровно потому, что не пытается казаться чем-то другим и не плодит параллельные хендшейки. Тот случай, когда дедовский unix-way тупо уделал новомодные протоколы.
Классика. Шел писать гуи для обхода блокировок, а написал игру на экран загрузки. Заинтересовало, жаль нет времени посмотреть.
Спасибо за статью и идеи. Тема мне близка. Классические таймеры мне не помогают и обычно быстро забрасываются. При гиперфокусе можно просидеть за задачей много часов подряд и совершенно не заметить усталости, а потом выпасть из ритма на несколько дней. Я порой не чувствую физические лимиты в моменте. Поэтому идея оценивать именно уровень сонливости и усталости кажется мне самым правильным подходом.
Сейчас любой автор мечтает о таком комменте. А то чуть что, сразу пишут, что "опять нейрослоп".
Видимо, этот 1% разработчиков перестарался на 4 пункта. Писали бы ровно в 42 раза больше, то познали бы смысл жизни, вселенной и всего такого.
Отличный материал! Почитал, посмотрел на вашу красоту, а потом перевел взгляд на свою систему дымоудаления на съемной квартире... Крышка с вентилятора снята не просто так — это «открытый аппаратный API» для регулирования режимов 😁 Вдохновился вашей статьёй, пойду дорабатывать!
А это мы про квантование ещё не говорили)
О чёрт, я правда написал «потребление»?) Спасибо @jvw за поправку) Точки над и вроде бы расставлены.
А я про экономию памяти не писал, я писал о считываении весов только активных экспертов (сколько памяти прочитает CPU/GPU на генерацию следующего токена), т.е. речь именно про ту память которая участвует в процессе вычисления (к слову, ik_llama.cpp умеет не грузить целиком, а только базовые слои и нужных экспертов). Просто констатирую и обосновываю, что для сравнения модель qwen3.6-35b-a3b более близкий аналог к теме статьи.
Смотря по какому показателю, по качеству ответа или по быстродействию. 35B-A3B кратно быстрее 27B... ну 3GB или 27GB в ram/vram памяти? - разница огромна. Поскольку статья именно о быстродействии, то он достигается на моделях со смесью экспертов, как раз за счёт снижения потребления (v)ram. В общем, если сравнивать, то одинаковые архитектуры) Qwen3.6-27B - это не MoE, а статья про MoE (смесь экспертов).
В "интеллектуальном" показателе Qwen3.6-27B конечно уйдёт вперёд, но будет в несколько раз медленее. Мой локальный тест именно производительности, для справки: Qwen3.6-27B 7TPS, а Qwen3.6-35B-A3B 35TPS на Xeon W9-3575X (8 каналов памяти, но два чиплета)
С Qwen3.6-35B-A3B было бы точнее , речь всë же о смеси экспертов, а не монолите
Аж олдскулы свело) Спасибо за отличную историческую справку!
Постоянно открытый туннель является долгоживущим TCP-соединением, клиент вынужден регулярно обмениваться с сервером keepalive-пакетами. Я же предлагаю автоматизировать создание туннеля только на время когда нужно пустить по нему трафик.
Всё совершенно верно, спасибо за отличное дополнение! Начиная с Ubuntu 22.10 сервер (sshd) по умолчанию работает через сокеты. А в статье применяется та же самая механика, но уже к клиенту для управления исходящими туннелями, демонстрируя возможности socket activation.
Вручную команду запускать не нужно. Systemd сам дежурит на порту 10201. Как только браузер к нему обращается systemd автоматически поднимает ssh-туннель и передаёт ему это соединение. В этом и заключается главная фишка.