Обновить
366.86

Системное администрирование *

Лишь бы юзер был доволен

Сначала показывать
Порог рейтинга
Уровень сложности

Большой гайд по настройке двух видов балансировщиков трафика

Уровень сложностиСложный
Время на прочтение30 мин
Охват и читатели3K

Привет, Хабр! Меня зовут Андрей Гордиенко, я ведущий специалист поддержки облачных услуг в Selectel.

В прошлых статьях мы разбирались, как устроены сети внутри облака, как обеспечить связность между зонами доступности и какие стратегии масштабирования существуют. Мы научились соединять серверы. Однако этого мало — они должны грамотно делить трафик между собой.

Продолжаем погружение в сетевые технологии: детально изучим тему распределения нагрузок. Пройдем путь от теории к практике. Начнем с простого облачного балансировщика. Затем соберем сложную гибридную схему с использованием глобального роутера, которая распределяет трафик между Москвой и Санкт-Петербургом.

Если вы начинающий системный администратор, DevOps-инженер или просто строите отказоустойчивую архитектуру и хотите понять, как избежать типичных ошибок в балансировке, — прошу под кат.

Читать далее →

Новости

Запуск программ, требующих getrandom() и getentropy(), на ядрах Linux старше 3.17

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели8.8K

Всем привет! Потребовалось на старом ядре linux запустить несколько docker-контейнеров, требующих getrandom и/или getentropy. В ядрах Linux старше 3.17 нет этих системных вызовов. Решение применимо не только к docker, но и к запуску программ на старых ядрах вообще.

Читать далее

Борьба с лавиной информации

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели5.2K

В какой-то момент своей жизни, я стал понимать, что мне все сложнее справляться с информационным давлением. О чем речь? Что за давление? Может вы заметили, что сейчас, как говорится, «из каждого утюга» льется большой поток информации, которую стало не просто фильтровать. И далее по списку: социальные сети, мессенджеры, email почта, банковские приложения, реклама, интернет журналы, телевизор, ютуб, короткие ролики (да, это стоит выделить отдельно), звонки с телефона, СМС, музыка, фильмы, подкасты, радио, куча подписок (и это отдельно).  Если вы трейдер или как то связаны с рынком, то еще и это. Может еще что упустил , но суть в общем в том, что очень много источников информации, которые требуют нашего внимания. Что же делать?

Читать далее

Фишинг без ошибок: как вычислять письма, которые не палятся глазами

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.7K

Фишинг давно перестал быть набором кривых писем с ошибками и подозрительными ссылками. Самые успешные атаки сегодня выглядят как обычная рабочая рутина: письма от HR, документы в облаке, приглашения на созвоны, обновления политик. Они не вызывают недоверия — наоборот, идеально вписываются в привычный контекст коммуникации.

В статье разбирается, почему «идеальный» фишинг опаснее очевидного, какие поведенческие и технические признаки выдают такие письма, где на самом деле искать угрозу — в тексте или в метаданных, и почему защита от современных атак начинается не с чеклистов, а с мышления. На примерах реальных инцидентов показано, как социальная инженерия использует доверие, автоматизм и спешку — и почему даже опытные специалисты иногда кликают «не думая».

Читать далее

«Кажется, тупит сеть. Посмотрите?» — как мы мониторим летенси в Ingress

Уровень сложностиСложный
Время на прочтение23 мин
Охват и читатели4.9K

В 2023 году к нам регулярно приходили разработчики с вопросом: «Кажется, тупит сеть. Посмотрите?» Вопросы были по делу, и каждый раз отвечать было сложно. Когда тойл от подобных обращений превысил разумные пределы, мы решили разработать SLO на летенси в Ingress. Но оказалось, что это не так уж просто.

Читать далее

Как мы случайно сделали стартап, пока учили ИИ работать с реальной инфраструктурой

Время на прочтение5 мин
Охват и читатели11K

Когда мы впервые увидели AI-чаты, это выглядело впечатляюще. Они писали код, помогали с документацией, объясняли архитектурные решения.

Это было хорошо. Но довольно быстро стало понятно главное:

Читать далее

История поиска бага в ядре Linux длиной в год, или нежданные нули из XFS'а

Уровень сложностиСложный
Время на прочтение11 мин
Охват и читатели12K

Наверняка у вас тоже было такое, что сервис работает себе спокойно, радует пользователей своей стабильностью и производительностью, а вас зелёным мониторингом. А в следующий момент хлоп - и нет его. Вы на панике смотрите в логи ошибок, а там или невнятный сегфолт, или просто ничего. Что делать – непонятно, и вообще надо прод спасать, поэтому вы поднимаете его обратно и всё работает как и раньше. Вы ещё пытаетесь разобраться в причинах случившегося, но со временем переключаетесь на другие задачи, а этот случай отходит на дальний план или вообще забывается.

Но это всё хорошо когда вы один, а вот если у вас много клиентов, то рано или поздно у вас возникает ощущение что что-то не так и надо разобраться с этими всплесками энтропии, чтобы найти первопричину подобных событий.

В этой статье описано наше исследование длиною в год,  из которого вы узнаете, почему PostgreSQL(и любое другое приложение) может падать из-за бага в ядре Linux, причём тут XFS и почему очистка памяти может быть не так полезна, как вы о ней думали.

Читать далее

Быстрая миграция на zVirt c любой платформы виртуализации: как это работает

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели5.9K

Привет, Хабр! Меня зовут Павел Князькин, я системный архитектор в Orion soft, занимаюсь развитием платформы виртуализации zVirt. Сегодня мы поговорим о миграции виртуальной инфраструктуры. 

Миграция с иностранных платформ виртуализации, таких как VMware, HyperV, XEN, а иногда даже и с других отечественных систем виртуализации становится актуальной задачей для многих организаций. Но их останавливают трудности перехода: нужно каким-то образом переместить ВМ из одной платформы виртуализации в другую.

В этой статье я подробно разберу механизмы миграции в zVirt и покажу, что перенести ВМ можно достаточно быстро, удобно и без лишних сложностей. Сравню агентский и безагентский подходы, расскажу, как произвести конвертацию физического сервера в ВМ (P2V) и объясню, почему необязательно платить за миграцию каждой «машины».

Читать далее

Механизмы репликации в РЕД АДМ «под капотом». Разбираемся в логике и процессах

Время на прочтение10 мин
Охват и читатели4.6K

Привет, Хабр! На связи снова Дмитрий, инженер по инфраструктурным решениям РЕД СОФТ. В прошлой статье мы разбирали, как настроить службу каталогов РЕД АДМ в ручном режиме, а также рассматривали самые распространённые ошибки в этом процессе. А в сегодняшней статье я постараюсь дать ответ, пожалуй, на весьма сложный вопрос — как работает репликация в РЕД АДМ «под капотом».

Эта статья — больше технический обзор, чем какой-либо чек-лист или инструкция. Мы дотошно пройдёмся по каждому этапу репликации. Я расскажу, что означают сообщения в терминале и подскажу, как на них реагировать. Материал будет интересен всем, кто хочет разобраться во внутренних процессах репликации: её логике, командах и функциях.

Читать далее

Инфраструктура не знает, что сегодня праздник

Время на прочтение4 мин
Охват и читатели4.2K

Согласитесь, что встретить Новый год рядом с семьёй и друзьями - намного приятнее, чем сидеть за ноутбуком в 02:40 и с квадратными глазами разбираться, почему “что-то там легло”, а доступ к нужным секретам остался только у одного человека… который как раз в этот момент режет оливье и не слышит телефон.

Ниже я делюсь своим чеклистом из 8 пунктов. Он помогает спокойно уйти в праздники и не проводить их в обнимку с ноутом. А после прочтения, в комментах, обязательно поделитесь что бы вы еще добавили.

Читать далее

Как работают CSI-драйверы в Kubernetes: принципы, архитектура и жизненный цикл томов (подробный гайд)

Уровень сложностиСредний
Время на прочтение38 мин
Охват и читатели4.9K

В статье подробно разбираем, как устроен CSI (Container Storage Interface), как проходит жизненный цикл тома от PVC до удаления и что на самом деле делают sidecar-контейнеры и драйверы.

Читать далее

Кибербезопасность за 30 дней. Чек-лист для руководителей

Время на прочтение11 мин
Охват и читатели11K

Дверь кабинета распахнулась в три часа ночи. Бледный технический директор, голос дрожит: «Всё. Системы мертвы. Они требуют два миллиона в биткоинах». В голове мелькнула мысль: «Это же фильм какой-то...» Но на мониторах уже мигали красные надписи, а в телефоне зашкаливало количество звонков от клиентов, партнёров, регуляторов.

А когда расследование показало, что хакеры вошли через устаревшую версию WordPress и учётную запись менеджера с правами администратора, он схватился за голову. Не суперхакеры взломали миллиардный бизнес. Его развалили банальные человеческие ошибки и пренебрежение рутиной. Те самые «мелочи», ради которых ИТ-специалисты годами просили внимания.

Читать далее

Интернет без IP и DNS: что было бы, если Tor стал стандартом

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели15K

Tor часто воспринимают как «дверь» в даркнет, но это, по сути, всего лишь сетевая архитектура, маскирующая онлайн-трафик. Сегодня её используют ради анонимности, но в какой-то момент истории эта модель вполне могла претендовать на большее. В статье попробую разобраться с принципами работы Tor и представить альтернативную историю этой анонимной сети.

Читать

Ближайшие события

Как запускать PostgreSQL прямо из бэкапа без restore: FUSE и точечный флэшбэк через postgres_fdw

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.1K

Несколько лет назад я трудился в проекте, где основной биллинг работал на Oracle. Однажды коллега захотел поправить тестовые начисления в таблице abon_charges и выполнил такой запрос:

UPDATE abon_charges SET amount = 0 WHERE service_id = 123 AND v_abon_id = v_abon_id;

На первый взгляд — ничего страшного. Но v_abon_id = v_abon_id истинно для любой строки. Oracle это не игнорирует. Условие становится:

WHERE service_id = 123 AND TRUE

Так запрос обнулил абсолютно все суммы для service_id=123 за десятки месяцев. В таблице было около 1,8 млн строк по этой услуге.

С такой неприятностью в Oracle может помочь механизм Oracle Flashback. Вкратце: находим проблемную транзакцию, в отдельной сессии включаем чтение таблицы на момент до обновления, снимаем копию в отдельную таблицу и отдаём её нашему виновнику для решения проблемы :).

Мы починили всё без простоя и полного восстановления всего кластера. С тех пор мне всегда хотелось иметь такой «точечный флэшбэк» и в PostgreSQL. Особенно в системах, где восстановление базы на несколько терабайтов может занимать часы. И вот недавно мне довелось организовать такое решение в нашем продукте Platform V CopyWala. Это инструмент для бэкапа от СберТеха, который работает с PostgreSQL. Покажу, как всё устроено.

Читать далее

Балансировка DNS-трафика и активные health-check'и апстримов — как и почему мы начали использовать DNSdist

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели5.7K

Коллеги, всем привет!

Долгое время в нашей внутренней сети для обработки DNS-трафика мы использовали только BIND, и нам с ним было хорошо. Но в какой-то момент его возможностей перестало хватать. В статье расскажу, что именно с BIND не так и почему теперь весь DNS-трафик у нас проходит через DNSdist. И что это вообще такое...

Читать далее

Оптимизация Windows Server, если на VPS мало памяти

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели8.5K

Посмотрим, как повысить производительность работы сервера на Windows Server 2016, 2019 или 2022 в среде с ограниченными ресурсами (2−4 ГБ RAM, 2 vCPU), то есть типичного VPS.

Оптимизация сервера — стандартная процедура, которую имеет смысл запускать каждый раз после регистрации нового VPS. Цель — выжать максимум производительности из железа без больших финансовых затрат.

Читать далее

IPv6 в доменных сетях: скрытый фактор атак на Active Directory

Время на прочтение7 мин
Охват и читатели5.3K

Во многих современных IT-системах IPv6, как правило, включён по умолчанию. Это относится и к операционным системам, и к серверам, и к сетевому оборудованию, и к контейнерным платформам. Даже если в компании или проекте официально используется только IPv4, IPv6 чаще всего уже присутствует и функционирует — без явного внимания со стороны архитекторов и специалистов по ИБ. 

Это важный момент, потому что безопасность обычно строится вокруг того, что явно спроектировано. Если протокол не заложен в архитектуру, под него редко настраивают фильтрацию, мониторинг и контроль. IPv6 в таких случаях — не «новая технология», а незадокументированный элемент системы. 

Читать далее

Patroni и логическая реплика в PostgreSQL: как не потерять данные при failover’е

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели8.6K

Если вы используете nofailover: true (а многие так и делают), Patroni не синхронизирует слоты логической репликации — и при переходе на реплику часть данных может исчезнуть навсегда. Рассказываем, почему и как фиксить.

Читать далее

IPsecHub+. Практикум. Деймоны

Уровень сложностиСложный
Время на прочтение12 мин
Охват и читатели6.8K

Дорогие читатели, добрый день. На связи Николай Едомский, руководитель группы сетевых инженеров компании Единый ЦУПИС.

Продолжаем наш практикум! В предыдущей статье мы подготовили базовую конфигурацию для интерфейсов концентратора. Теперь нам предстоит организовать маршрутизацию и зашифровать трафик до филиала.

Читать далее

Сравнение производительных VPS

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.4K

Привет, Хабр! Давненько не брал я в руки шашек =) Почти год назад я опубликовал две статьи с обзорами на бюджетные и средние конфигурации популярных хостинг-провайдеров VDS-серверов. Но когда цена вопроса несколько сотен рублей, это каждый сам может проделать, отталкиваясь от своих потребностей. Другое дело, когда речь про тысячи рублей — далеко не каждый готов потратить такие деньги на эксперименты. А я, хоть и не ныряю в бассейн с монетами, в определённой мере готов к таким расходам,поэтому сегодня расскажу про самые доступные HI-CPU предложения от популярных хостеров. Добро пожаловать под кат.

Читать далее
1
23 ...

Вклад авторов