Обновить
67
1.3
РТК-ЦОД@rt-dc

IaaS и дата-центры

Отправить сообщение
да, для этого в процессе сертификации по процессам эксплуатации проверяют наличие и исполнение так называемых MOP (Method of Procedures). В них как раз прописывается пошаговый порядок проведения работ по обслуживанию элементов инфраструктуры и инструменты, которые необходимо или наоборот запрещено использовать.
Ну и много внимания они уделяют подготовке персонала и подрядчиков, чтобы возле щитов не появлялись всякие мадамы с металлической линейкой :)
Переключение на резервные маршруты в случае с темной оптикой – по сути организация новой кроссировки. Организация новой кроссировки занимает до 8 часов и требует следующих работ:

  • анализ существующей схемы включения клиента
  • внесение изменения через другую магистраль
  • создание задания на новую кроссировку
  • выписывание оптических патчкордов
  • прокладка
  • тестирование
  • переключение старой трассы на новую

Данные работы выполняются инженерами профильных групп, а не дежурной группой. К тому же не у всех клиентов имелись резервные маршруты, требовалось согласование с клиентами по построению новых маршрутов
Да, часть сотрудников растим из дежурных инженеров, об этом рассказывали здесь.
Ну а вообще, хорошим людям мы всегда рады, даже если в данный момент на сайте не висит соответствующей вакансии. Так что можно смело отправлять резюме на job@dtln.ru в любое время :)
Так вот же он :)
В каждом отделе от 5 до 15 человек. Самые большие — это отделы сети и виртуализации.
По инструментарию для схем см. выше.

И что-то мне кажется скорость опроса 1 раз в секунду — это мечты.

Для кого мечты, а для кого — реальность :) Да, штатные средства позволяют добиваться такой частоты опроса не для всех параметров, но у нас для этого есть собственная разработка.

Тренды по этим параметрам, так же храните в базе?
Алгоритмы, сроки хранения?

Хранение статических данных организовано на базе rrd-файлов. В зависимости от параметра данные могу хранить до 5 лет.
Для создания этих схем используем SCADA-фреймворк собственной разработки.
Данный фремворк включает в себя все свойственные SCADA-системам функции, позволяющие визуализировать состояния оборудования и информировать об аварийных ситуациях. Источником данных является система NAGIOS, которая подключена к фремворку с помощью сервиса MK-LIVESTATUS. Он позволяет оперативно получать аггрегированные данные по всему оборудованию площадок.
По поводу анализаторов с Ethernet. Это удобно, если объемы небольшие. У нас реализован такой вариант в одном из залов, клиент очень настаивал. Но в общем случае для нас такой вариант не очень оптимален, и вот почему. К каждому анализатору придется свою кроссировку тянуть. На одном щите у нас до 4 анализаторов, в зале может быть до 12 щитов. Со всеми этими проводами мы потеряем в емкости кабельных лотков, потратимся на дополнительные коммутаторы и займем очень ценные для нас юниты под них.

По поводу качества электроэнергии: у нас промышленные UPS, которые выдерживают достаточно большие скачки и колебания. Если идут частые пропадания (просадки) электричества от города, то спасут правильные настройки АВР (уставки и задержки), лучше переключится на ДГУ и переждать, решить проблему. Также аккуратно и с задержками переключаемся обратно на город, когда напряжение приходит в норму.

Ваших навыков может хватить, чтобы пропустить ступень «дежурный инженер» :) Чтобы не гадать, давайте поступим следующим образом: присылайте свое резюме на job@dtln.ru, а коллеги из HR рассмотрят его и расскажут про вакансии, которые совпадают с вашим опытом. Успехов!
Как мы говорили ранее в статье, для дежурных у нас как раз есть возрастное ограничение до 24 лет)
Часть вакансий мы не публикуем на сайте.
Если мы не говорим о дежурных инженерах, а о специалистах в профильных отделах, то таких кандидатов мы тоже рассматриваем и принимаем.
С необходимостью предоставления именно бумажных экземпляров журналов и пр. не сталкивались. По крайней мере при прохождения лицензирования как телеком-оператора.
Как лицензиатов ФСТЭК и ФСБ, нас тоже проверяют, но и там вроде нет жестких требований по бумажному носителю.
рады, что пригодилось в хозяйстве :)
Да, небольшая, но есть. В планах — полноценная столовая.
В данный момент резервного копирования на shared ленту у нас нет, но планируется. Те клиенты, которые используют ленту сейчас, арендуют у нас под себя отдельные библиотеки.
По технической реализации тут может быть два варианта:

1. Оперативный бэкап может хранится на вашей площадке, а после, например, 2 недель копии будут отъезжать на внешнюю площадку для архивного хранения. Можно сразу запараллелить эти два процесса, выставив для этих бэкапов разное время хранения. Вот как это может выглядеть.

image

2. Резервное копирование выполняется сразу на нашу площадку, но это будет менее оптимально в плане скорости передачи и восстановления данных.

Подробно про мониторинг электроснабжения будет отдельная статья. Если коротко, то мы мониторим всю цепочку – от городских вводов до PDU в стойках. Во всех щитах установлены анализаторы тока. Напряжение на входе и выходе ИБП – это слишком важный показатель, чтобы замерять его раз в час. Отсутствие напряжения на входе или выходе ИБП – уже аварийная ситуация.

Теперь про охлаждение. Если это чиллерная схема, то у нее большая инерционность. С учетом баков-аккумуляторов температура в залах точно не будет расти так, как вы говорите.
Наш опыт с фреоновой схемой также показывает, что отключение половины кондиционеров на пару минут (например, во время тестирования ДГУ) не приведет к критическому повышению температуры. Точных измерений мы не делали, но скорее всего речь идет об 1 градусе в минуту, а не в секунду.

Мониторинг на базе Nagios, DCIM не используем.
В нашей практике в дежурной смене (даже ночной) 4 инженера, поэтому если смотрящему за мониторами захочется в туалет, покурить, сделать кофе, то он сначала дожидается, пока его подменят на посту, и только идет делать свои дела.
да, railo, конечно, опечатался.
Подробнее обязательно расскажу, но в отдельной статье про инстурменты.
Карты делаем с помощью серверных скриптов (Ralio в частности) как надстройка над системой мониторинга.
В центре мониторинга можно переключаться между дата-центрами и инженерными системами. Часть экранов располагается рядом с машинными залами, они сенснорные и поддерживают функциональность drill-down.
<img src="" alt=«image»/>

Информация

В рейтинге
1 686-й
Откуда
Москва и Московская обл., Россия
Зарегистрирован
Активность