Pull to refresh
21
0
Dmitry Asafyev @dasafyev

User

Send message

Мониторинг и алертинг серверов Supermicro (sensor metrics) через Prometheus

Reading time7 min
Views6.7K

Рассказываем о процессе настройки сбора метрик серверов Supermicro с помощью утилиты IPMItool и Prometheus. 

Инфраструктура нашей компании поддерживается на высоком уровне SLA, что требует от нас измерения, наблюдения и отправки отчетов, фиксирующих метрики производительности систем, в том числе серверов, которые мы предоставляем в аренду.

У нас возникла необходимость внедрения централизованного механизма опроса IPMI/iDRAC/TP-IPMI для обнаружения перегрева, проблем с системой охлаждения и т. д. и повышения качества предоставляемого оборудования в целом. Проще говоря, мы планируем внедрить систему опроса датчиков с портов управления материнских плат, чтобы оперативно обнаруживать перегрев, неработающие или частично работающие вентиляторы и другие проблемы с охлаждением (например, проверять обороты кулеров или физическое наличие вентилятора в разъеме).

Читать далее

PXE деплой ESXI-Foreman

Level of difficultyEasy
Reading time13 min
Views4.1K

Рассказываем как PXE-деплой ESXi-Foreman может упростить вашу работу с виртуализацией и сэкономить время и усилия при установке и настройке серверов ESXi.

Сегодня в большинстве компаний широко применяется виртуализация в инфраструктуре, что позволяет размещать различные сервисы компании и эффективно использовать ресурсы физических серверов. В связи с этим мы приняли решение внедрить виртуализацию VMware ESXi. При выборе метода установки мы рассмотрели два варианта: Legacy и UEFI.

Читать далее

Топ-10 видеокарт для машинного обучения

Level of difficultyEasy
Reading time10 min
Views72K

Как правильно выбрать видеокарту и максимально эффективно обрабатывать большие объемы данных и выполнять параллельные вычисления.

Читать далее

Подходит ли Nvidia RTX A4000 ADA для машинного обучения?

Level of difficultyEasy
Reading time14 min
Views6.9K

В апреле компания NVIDIA выпустила на рынок новый продукт — графический процессор малого форм-фактора RTX A4000 ADA, предназначенный для применения в рабочих станциях. Этот процессор пришел на смену A2000 и может быть использован для выполнения сложных задач, в том числе для научно-исследовательских и инженерных расчетов и для визуализации данных.

RTX A4000 ADA оснащена 6144 ядрами CUDA, 192 тензорами и 48 ядрами RT, оперативной памятью GDDR6 ECC VRAM объемом 20 Гб. Одно из ключевых преимуществ нового графического процессора — его энергоэффективность: RTX A4000 ADA потребляет всего 70 Вт, что снижает затраты на электроэнергию и уменьшает тепловыделение в системе. Графический процессор также позволяет управлять несколькими дисплеями благодаря подключению 4x Mini-DisplayPort 1.4a.

Читать далее

Сравниваем процессоры Ryzen 9 7950X и Ryzen 9 5950X в тестах

Level of difficultyEasy
Reading time10 min
Views12K

В этой статье мы сравним новый процессор от компании AMD — Ryzen 9 7950X с предыдущим поколением — Ryzen 9 5950X от этого производителя и попытаемся ответить на вопрос «Насколько выгодно перейти к использованию новых процессоров для решения рабочих задач?».

Читать далее

Сервер с собственным облаком

Level of difficultyEasy
Reading time4 min
Views75K

Nextcloud — это бесплатный облачный сервис с открытым исходным кодом, позволяющий хранить, синхронизировать и обмениваться файлами и документами. Сервис обеспечивает безопасный доступ к данным из любого места и с любого устройства, используя шифрование на уровне передачи и хранения данных и является хорошей альтернативой как различным платным сервисам, так и ownCloud.

Nextcloud предоставляет множество функций, таких как календарь, контакты, задачи, заметки, чат и многое другое, а также поддерживает различные технологии (WebDAV, TOTP, WebAuthn, Oauth2, OpenID Connect, 2FА). Управление приложениями и стабильность их работы может отличаться, как и их стоимость. Впрочем, большинство приложений бесплатны. Приложения можно легко устанавливать и настраивать в зависимости от потребностей пользователя.

Nextcloud обеспечивает возможность интеграции с другими сервисами, такими как Google Drive, Dropbox и Amazon S3. Это позволяет пользователям обмениваться файлами между различными облачными хранилищами. Nextcloud также позволяет управлять правами доступа к файлам и папкам, что обеспечивает безопасность и конфиденциальность данных. Пользователи могут устанавливать права доступа на уровне групп и отдельных пользователей, а также управлять доступом к файлам через ссылки.

Читать далее

Настройка автоматической установки  TrueNAS

Reading time6 min
Views13K

В статье «Автоматическая установка платформы TrueNAS» мы рассказывали, что для автоматической установки на виртуальные и физические серверы теперь доступна операционная система TrueNAS SCALE. Расскажем об автоматической установке подробнее.

Почему мы запустили именно SCALE, а не CORE? Давайте сравнивать и выбирать. Разработчик этих операционных систем собрал основные различия в таблицу. Видим, что с точки зрения функционала их почти нет. Основное отличие между версиями заключается в базовой ОС и, соответственно, в типе встроенной виртуализации, а еще у SCALE-версии заявлена возможность масштабирования ZFS на несколько узлов при помощи распределенной файловой системы Gluster. И да, поддержка ZFS на SCALE-версии реализована все же через DKMS.

Затем нужно было выяснить, на какие серверы мы сможем ставить тот или иной TrueNAS. Мы поддерживаем единый список операционных систем как для «дедиков», так и для «виртуалок». В теории (по инструкциям для установки Install и Installing SCALE) список поддерживаемого оборудования и систем виртуализации тоже не особенно отличается, но будем проверять. С поддержкой физических серверов у обеих систем проблем нет, но вот наша стандартная конфигурация клиентской VM с диском Virtio-SCSI не нравится инсталлятору TrueNAS CORE, а точнее — он не видит такой тип диска. Подобная ситуация была и с автоматизацией установки Windows, и решали мы ее добавлением необходимых драйверов в инсталлятор. Установщик TrueNAS SCALE же видит диск «из коробки». А еще CORE-версия поддерживает меньшее количество разнообразных 10G-адаптеров. В общем, если не видно разницы, то зачем платить больше дорабатывать CORE под наши реалии, когда можно взять SCALE? Берем.

Читать далее

Настройка сервера для Rocket.Chat

Level of difficultyEasy
Reading time4 min
Views18K

Rocket.Chat — это открытая платформа для обмена сообщениями и видеоконференций с открытым исходным кодом. Rocket.Chat доступен для скачивания на GitHub, выпущен по лицензии MIT. Он позволяет обмениваться сообщениями в режиме реального времени, поддерживает голосовые и видеозвонки, обмен файлами и интеграцию с другими приложениями. Rocket.Chat работает на различных операционных системах и платформах, в том числе на Linux, Windows, macOS, Android и iOS, и может быть установлен как на собственном сервере, так и на облачных платформах. 

HOSTKEY является официальным партнером Rocket.Chat и использует его в повседневной работе с 2015 года. Мы можем продавать корпоративные лицензии и обслуживать лицензированные установки.

Читать далее

Мониторинг HTTP и SSL через Prometheus blackbox_exporter

Reading time6 min
Views26K

Автор: DevOps компании Hostkey Никита Зубарев

Инфраструктура нашей компании поддерживается на высоких уровнях SLA, что требует от нас измерять, наблюдать и отправлять отчеты, которые фиксируют метрики производительности систем.

В одной из прошлых статей мы рассмотрели варианты установки федерации Prometheus, Alertmanager и Node Exporter, но у нас также есть задача мониторинга задержки производительности наших приложений и точного выявления проблемных конечных точек. Мы отслеживали время отклика всех конечных точек, которые использовались в потоке приложения, и с помощью BlackBox Exporter обнаружили наши конечные точки, вызывающие задержку. Соответственно, перед нами возникла задача наладить мониторинг статус-кодов ответов наших web-сервисов, а также сроков действия SSL-сертификатов.

Читать далее

Автоматическая установка платформы TrueNAS

Reading time5 min
Views16K

Команда «ХОСТКЕЙ» добавила новую платформу для хранения и управления данными — TrueNAS. Мы хотим рассказать об этом интересном дистрибутиве тем клиентам, которые ищут простое и удобное решение для управления данными при аренде серверов.

TrueNAS — это быстрое и надежное решение для хранения и управления данными, которое позволяет значительно улучшить качество предоставляемых услуг. TrueNAS предлагает широкий спектр возможностей: создание датасетов, виртуальных машин и контейнеров, использование Windows Shares, Unix Shares, Block Shares, WebDAV Shares. Одно из главных преимуществ TrueNAS — возможность простой установки нескольких десятков полезных приложений: Minio, Nextcloud, Plex, Syncthing, WG Easy и т. д. С полным списком приложений, доступных пользователям TrueNAS SCALE, можно ознакомиться на сайте TrueNAS. Использование TrueNAS SCALE позволит увеличить масштабирование проектов и гарантировать быстрый доступ к данным.

Читать далее

Действительно ли DAPC выгоднее BIOS default performance?

Reading time6 min
Views2.5K

Изучение производительности сервера может быть очень полезно, особенно если вы работаете с ресурсоемкими приложениями. Одним из способов повышения производительности является настройка параметров BIOS. В этой статье мы попытаемся ответить на вопрос, действительно ли DAPC выгоднее BIOS default performance.

Читать далее

Проверка работы сервера Proxmox Backup

Reading time3 min
Views7.2K

Как проверить стабильность работы сервера Proxmox Backup и избежать потери времени.

Разработчики PBS стремились создать интуитивно понятное решение, удобное для пользователя и с простым интерфейсом, и им это вполне удалось. Однако наша практика показала, что новым пользователям Proxmox не хватает наглядной и простой инструкции для работы с этой системой виртуализации. И мы решили исправить эту ситуацию. 

Читать далее

Proxmox-репликация

Reading time7 min
Views20K

Автор — Султан Усманов, специалист отдела DevOps компании Hostkey 

Как быстро и просто настроить Proxmox-репликацию и что нужно учитывать в процессе развертывания.

Относительно недавно для клиентов нашей компании стала доступна к автоматической установке система виртуализации Proxmox. Предварительно мы тестировали качество предоставления подобной услуги и параллельно разбирались, как администрируется Proxmox. Своим опытом я бы хотел поделиться в небольшой серии статей. Начну с того, как выполнить репликацию Proxmox.

Proxmox-репликация предоставляет преимущества для повышения доступности и производительности вашей инфраструктуры. Она позволяет создавать копии виртуальных машин, а также переносить их на другие серверы в случае аварии, т.е. обеспечить более высокую доступность и производительность инфраструктуры виртуализации.

Читать далее

Создание сервиса Single sign-on с напоминаниями для пользователей

Reading time4 min
Views3.2K

Как сделать простую и надежную систему смены пароля и помочь пользователям не забыть вовремя поменять свой пароль.

Читать далее

Какие видеокарты выгоднее для бизнеса — RTX 4090 или серверная RTX A5000?

Reading time6 min
Views17K

Сравниваем новую игровую видеокарту от компании Nvidia — GeForce RTX 4090 и мощную серверную карту RTX A5000: рассказываем об их характеристиках и оцениваем эффективность в решении бизнес-задач.

Читать далее

Миграция виртуальных серверов с oVirt на VMware

Reading time5 min
Views4.5K

В ходе проведения работ по оптимизации парка физических серверов и уплотнению виртуализации перед нами возникла задача переноса виртуальных серверов с oVirt на VMware. Дополнительной проблемой стала необходимость сохранить возможность отката на oVirt-инфраструктуру в случае возникновения каких-либо осложнений в процессе миграции, т.к. для хостинговой компании стабильность работы оборудования является приоритетной задачей. 

Читать далее

Сбор логов при помощи Go

Reading time7 min
Views4.7K

Автор: Александр Тряпкин, DevOps компании Hostkey

Здравствуйте, уважаемые читатели Habr! В этой статье я хочу поделиться своим опытом решения задачи сбора логов при помощи Go. Как начинающий DevOps, я выбрал для изучения и решения рабочих задач язык программирования Go. Для отправки syslog-логов доступна библиотeка syslog, но увы, она нам не подходит, поскольку данный пакет недоступен на Windows, а задача — сделать мультиплатформенный отправщик логов установки системы на удаленный syslog-сервер. Дополнительно есть потребность отправлять логи в кастомном формате, а именно — в json, для упрощения их последующей обработки. При этом важно, чтобы программа выполнялась одинаково на Linux и на Windows, не требовала установки, выполняла свою задачу и удалялась из системы, поэтому придется изобрести небольшой велосипед. Приступим.

В качестве принимающей стороны мы будем использовать syslog-ng. Рассмотрим параметры, которые нам интересны в части сбора логов — от специфики параметров зависит, как мы будем их отправлять.

Сначала указываем новый source для приема логов с удаленных серверов, и тут есть варианты — в зависимости от наших потребностей можно собирать логи по UDP, TCP, а также использовать TLS для шифрования и аутентификации. Наиболее интересным вариантом является TLS, но мы рассмотрим и другие методы — от простого к более сложному.

1) UDP. Для сбора логов по UDP потребуется следующие параметры в конфигурации syslog-ng:

Читать далее

Развертывание Windows UEFI с использованием Foreman

Reading time5 min
Views3.4K

Автор: DevOps Team Leader компании Hostkey Егор Гараджа

В прошлой статье мы рассказали, как нам удалось решить проблему установки Windows и Linux через Foreman в Legacy-режиме (BIOS/MBR). Другой важной задачей стала поддержка инсталляций в режиме EFI. В случае Foreman этот вопрос решается через использование отдельного загрузчика. Для Linux наш выбор пал на Grub2, и реализация загрузки оказалась достаточно тривиальной — нами была создана конфигурация Grub для загрузки initrd и ядра.

В случае с Windows ситуация сложнее. Изначально загрузка Windows осуществлялась через расширение для iPXE. Проблема, однако, в том, что это расширение, как и многие другие (memdisk и т. п.), не поддерживалось официально для EFI-версии загрузчика. Кнечно, можно попытаться решить этот вопрос самостоятельными правками и сборкой нужных модулей, но мы в целом хотели уйти от iPXE, поскольку это не совсем честный pxe-загрузчик, а скорее мини-операционная система со своими драйверами для сетевых карт, что изредка создавало проблемы при инсталляциях.

Мы сделали попытку использовать модуль Grub2, позволяющий смонтировать по http образ диска и загрузиться с него. Этот вариант не сработал, так как производительность модуля при работе по сети оказалась очень низкой, не говоря уже о стабильности.

В результате изучения вопроса мы пришли к следующим вариантам решения проблемы:

Читать далее

WindowsPE Live-CD в инфраструктуре Jenkins/Foreman

Reading time5 min
Views3K

Автор: DevOps Team Leader компании Hostkey Егор Гараджа

Много лет назад нами был выбран путь с загрузкой wim-образа WindowsPE через iPXE. Образ собирался на инфраструктуре Microsoft вручную, за кухней следил один человек. С ростом компании и усложнением задач мы решили максимально автоматизировать процессы сборки и управления образом. В это же время перед нами возникла задача по поддержке UEFI-инсталляций, оказавшаяся не такой тривиальной, как можно предположить.

Мы уже рассказывали об устройстве кухни по сборке LiveCD для Linux на базе Centos/RockyLinux, которую мы используем в компании Hostkey. Пришло время поговорить об устройстве сборки WindowsPE-дистрибутива в Linux-инфраструктуре, автоматизации этого процесса с помощью Jenkins и разворачивании систем на базе MS Windows через этот хэлпер.

Традиционно PXE-deploy Windows реализуется в рамках общей инфраструктуры Microsoft, включая DHCP/DNS/TFTP и прочие сервисы. В нашей инфраструктуре узловым сервером для развертывания ОС является Foreman, и разворачивать деплойную среду отдельно для Microsoft с самого начала казалось нецелесообразным.

Читать далее

Мониторинг служб Linux c помощью Prometheus

Reading time2 min
Views9.6K

Автор: Senior Devops. Ведущий специалист по инфраструктуре Hostkey Никита Зубарев

В прошлой статье мы рассказывали, как для мониторинга сервисов с помощью Prometheus настроить сбор метрик и отображение тревог. Однако в процессе эксплуатации возник вопрос, как мониторить отдельные службы на серверах Linux. Например, в одной из прошлых статей мы описывали кейс использования веб-консолей Ovirt c помощью Apache Guacamole. Теперь рассмотрим, как организовать мониторинг работы сервисов на Linux-машинах.

Читать далее

Information

Rating
Does not participate
Location
Amsterdam, Noord-Holland, Нидерланды
Date of birth
Registered
Activity