Search
Write a publication
Pull to refresh

Скрипт-реаниматор: автоматическое восстановление упавших SSH-сессий

Level of difficultyEasy
Reading time3 min
Views5.2K

Привет, Хабр! Представим ситуацию: вы настраиваете сервер, работаете с критически важными процессами или изучаете логи - и внезапно SSH-соединение обрывается. Все не сохранённые изменения улетучиваются, прогресс откатывается, а вам приходится переподключаться и начинать всё заново.

В данной статье представлен скрипт-реаниматор для SSH, который:

  • Восстанавливает соединение при любых обрывах

  • Сохраняет рабочую сессию и историю команд

  • Поддерживает tmux/screen для полного сохранения контекста

  • Может отправлять уведомления о проблемах в Telegram

  • Решение представлено для Bash и PowerShell

Введение

SSH-реаниматор фактически является "обёрткой" вокруг SSH-клиента, которая:

  1. Постоянно мониторит соединение

  2. При обрыве делает паузу, пытается перезагрузиться и восстанавливает предыдущее окружение

  3. Логирует все события, если потребуется анализ

Например: вы запускаете бэкап на 3 часа. Без реаниматора в случае обрыва Вам придётся начинать заново, но не в стиуации с реаниматором. Он восстановит создание бэкапа с прогрессом, на котором произошёл обрыв.

Важное уточнение: скрипт не является заменой полноценного решения в стиле Zabbix, Nagios и тд. Он лишь даёт простой и быстрый способ сделать рутинные подключения устойчивыми к сбоям. Может помочь, к примеру, в ситуации с какой-нибудь простенькой VPS, где Zabbix (и прочие) являются чересчур избыточными решениями.

Принцип работы SSH-реаниматора

1. Детектирование обрыва соединения

SSH использует 2 ключевых параметра для мониторинга активности соединения:

ServerAliveInterval (по умолчанию значение "0" - отключено)

  • Определяет интервал в секундах между keepalive-пакетами

  • Со стороны клиента отправляются пакеты для проверки активности сервера

ServerAliveCountMax (по умолчанию значение "3")

  • Кол-во неудачных попыток проверки перед разрывом

  • Умножается на ServerAliveInterval для получения общего таймаута

Посмотрим подробнее пример расчёта:

ssh -o ServerAliveInterval=20 -o ServerAliveCountMax=4 user@host
  • 20 x 4 = 80 секунд без ответа

2. Механизм бесконечного переподключения

Скрипт, который будет описан ниже, использует цикл while true для постоянного поддержания соединения:

while true; do
  ssh -o ServerAliveInterval=30 user@host
  if [ $? -eq 0 ]; then
    break # Корректный выход
  else
    sleep 5 # Пауза перед повторной попыткой
  fi
done

Ключевые моменты:

  • Проверка кода возврата SSH (0 - успех, иные - ошибка)

  • Задержка между попытками для избежания цикла быстрых переподключений

Bash-скрипт

#!/bin/bash

SERVER="user@example.com"
SSH_OPTS="-o ServerAliveInterval=30 -o ServerAliveCountMax=3"
DELAY=5

while true; do
    echo "[$(date +'%H:%M:%S')] Подключение к $SERVER..."
    ssh $SSH_OPTS $SERVER
    
    if [ $? -eq 0 ]; then
        echo "[$(date +'%H:%M:%S')] Сессия завершена"
        break
    else
        echo "[$(date +'%H:%M:%S')] Ошибка соединения. Повтор через $DELAY сек..."
        sleep $DELAY
    fi
done

Bash-скрипт с восстановлением tmux

#!/bin/bash

SERVER="user@example.com"
SESSION="remote_work"
SSH_OPTS="-o ServerAliveInterval=30 -o ServerAliveCountMax=3"

while true; do
    echo "[$(date +'%H:%M:%S')] Подключение к сессии $SESSION на $SERVER..."
    ssh -t $SSH_OPTS $SERVER "tmux attach -t $SESSION || tmux new -s $SESSION"
    
    if [ $? -eq 0 ]; then
        break
    else
        sleep 5
    fi
done

PowerShell-скрипт

$SERVER = "user@example.com"
$SSH_OPTS = "-o ServerAliveInterval=30 -o ServerAliveCountMax=3"
$DELAY = 5

while ($true) {
    Write-Host "[$(Get-Date -Format 'HH:mm:ss')] Подключение к $SERVER..."
    ssh $SSH_OPTS $SERVER
    
    if ($LASTEXITCODE -eq 0) {
        break
    } else {
        Start-Sleep -Seconds $DELAY
    }
}

Как использовать

  1. Сохранить скрипт:

    nano ssh_reconnect.sh
    chmod +x ssh_reconnect.sh
  2. Запустить с логированием:

    ./ssh_reconnect.sh >> ssh_log.txt 2>&1
  3. Запустить в фоновом режиме:

    nohup ./ssh_reconnect.sh > /dev/null 2>&1 &

Также, ещё пара полезных функций:

  1. Telegram-уведомления:

TELEGRAM_API="https://api.telegram.org/bot{TOKEN}/sendMessage"
CHAT_ID="12345"
MESSAGE="Ошибка SSH соединения с $SERVER"

curl -s -X POST $TELEGRAM_API -d chat_id=$CHAT_ID -d text="$MESSAGE"
  1. Автозапуск через crontab:

    @reboot /path/to/ssh_reconnect.sh
  2. Сохранение истории команд:

    ssh $SERVER "cat >> ~/.persistent_history"

Рекомендации

  1. Для критически важных сессий используйте tmux или screen

  2. Настройте оптимальные значения ServerAliveInterval для вашего соединения

  3. Для долгоживущих сессий рассмотрите возможность использования terminal multiplexers

  4. Включите логирование для анализа причин разрывов

Заключение

Представленные в статье скрипты помогут обеспечить надёжное поддержание SSH-соединения, восстановить сессию после обрывов и сохранить рабочее окружение. Решение можно допиливать и адаптировать под различные требования, расширять функционал.

P.S. Я веду свою группу в Телеграмм, буду рад видеть всех, кому интересен процесс написания скриптов и автоматизация в мире IT.

Tags:
Hubs:
If this publication inspired you and you want to support the author, do not hesitate to click on the button
+2
Comments31

Articles