Как стать автором
Обновить
411

IT-инфраструктура *

Инфоцентры + базы данных + системы связи

Сначала показывать
Порог рейтинга
Уровень сложности

Как мы ускорили деплой облачной платформы в 20 раз и избавились от панических атак

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 4K

Привет, Хабр! С вами снова Антон, все еще DevOps-инженер в Selectel. И да, в этот раз ни слова про шеринг GPU, не пугайтесь. :)

Недавно на DevOps Conf я рассказал, как мы в отделе DataML-продуктов используем GitLab и Terraform, чтобы деплоить облачную платформу за 24 минуты вместо восьми часов, избавиться от костылей на серверах и получать больше удовольствия от работы. Вот ссылка на сам доклад. В этой статье я поделюсь этим опытом, дополню свой рассказ примерами, а для самых терпеливых оставлю ссылку на бесплатный двухнедельный тест той самой платформы.
Читать дальше →
Всего голосов 40: ↑41.5 и ↓-1.5 +43
Комментарии 5

DevOps на IBM: как мы навели порядок в 700 системах, перейдя от bash к IaC

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 5.9K

В инфраструктуре заказчика имелся большой зоопарк систем, не объединенных единой логикой. Надо было навести порядок и наладить автоматизацию, особенно после того, как в этом уже поучаствовали сотрудники различных подразделений и сторонних компаний, не особо озабоченных единой концепцией.

Нам повезло, что заказчик сам не до конца представлял, что именно хочет, поэтому в проекте было много пространства для творчества и возможности применить методологию DevOps, в том числе к системам на AIX. Ну а началось все с одного болезненного инцидента.

Читать далее
Всего голосов 18: ↑18 и ↓0 +18
Комментарии 11

Используй Силу, Люк: Single Pane of Glass в Мире SRE

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 1.6K

Привет, Хабр! Меня зовут Кирилл, я работаю в IT более 13 лет. Сначала инженером по внедрению, потом DevOps, потом SRE, также работал руководителем группы сопровождения. Сейчас SRE в VK Рекламе, поэтому знаю, как важно делать правильные инструменты для анализа проблем. 

В любом проекте и компании я иногда сталкивался, а иногда сам создавал проблему: огромное количество дашбордов. Вспомните ситуацию, когда вы в Grafana ищете какой-нибудь дашборд, пишете, например, «Tarantool», и вам выпадает огромный список дашбордов, которые кто-то до вас насоздавал. Это могут быть кастомные дашборды, которые кто-то делал для какого-нибудь инцидента, или просто созданные другими специалистами. Часто бывает, что половина этих дашбордов нерабочие или на них нет чего-то полезного. 

Как правило, обилие дашбордов создаёт ряд проблем: информационную перегрузку, потерю фокуса, сложность восприятия, а самое главное, затруднение исследований инцидентов. Попробуйте себе честно ответить на вопрос: глядя на свой дашборд, вы можете понять, работает ваша система или нет? Если нет, то читайте дальше. 

Читать далее
Всего голосов 29: ↑29 и ↓0 +29
Комментарии 0

Автоматизируем сеть Яндекса с Милошем: сервис конфигураций оборудования

Время на прочтение 19 мин
Количество просмотров 6.2K

Задумывались ли вы о том, как изменить конфигурацию сразу на нескольких сетевых устройствах? Что, если нужно сделать это на всей сети с сотнями и тысячами единиц оборудования? А что, если приходится делать это каждый месяц на железе от пяти разных производителей? Очевидное решение для подобных задач — автоматизация. Но реализовать её можно не одним способом, а в процессе наткнуться не на одни грабли.

Меня зовут Вадим Воловик, и я руковожу проектами разработки в Yandex Infrastructure. Наша команда NOCDEV отвечает за автоматизацию сетей всего Яндекса. Давно хотелось рассказать о задачах такого масштаба, но по ходу написания материала стало понятно, что тема тянет на целый цикл. Так что мы с коллегами расскажем о самых интересных примерах автоматизации в отдельных постах.

В этой статье проведём небольшую экскурсию по нашему сетевому «хозяйству» в десятки тысяч устройств и остановимся подробнее на том, как при таком объёме мы автоматически обновляем конфигурации.

Читать далее
Всего голосов 26: ↑26 и ↓0 +26
Комментарии 16

Истории

AFCOM: Бум ИИ стимулирует инновации в проектировании и строительстве ЦОД

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 775

В своем последнем отчете AFCOM (Association For Computer Operations Management) отмечают, что стремительное развитие искусственного интеллекта и широкое распространение цифровых сервисов стимулируют спрос на инновационные технологии в области проектирования ЦОД. Однако в ходе проведения исследования в AFCOM пришли к выводу, что хотя индустрия дата-центров и переживает «бум в области проектирования и строительства инфраструктуры», вместе с тем возникают и новые проблемы в таких ключевых аспектах, как энергопотребление, охлаждение и реализация целей устойчивого развития.

Команда редакции Хабра КРОК подготовила для вас перевод ключевых трендов из отчета AFCOM. Читайте под катом!

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 0

1 апреля — о серьёзном: факапы бэкапов

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 12K

Первое апреля — день, когда все смеются, а разработчики и админы могут плакать, потому что 31 марта, во всемирный день бэкапа, происходит лютый шабаш хакеров, мошенников, интернет-хулиганов и всех тех, кто не против попробовать на прочность IT-мир. Мы попросили пользователей Хабра рассказать о своих факапах с бэкапами, чтобы другие могли поучиться в том числе на чужих ошибках. И, конечно, желательно их не повторять. Ну и, конечно, за такую информацию положены симпатичные призы.

Боишься ли ты не делать бэкапы?
Всего голосов 65: ↑64 и ↓1 +63
Комментарии 80

Как развернуть Minecraft на сервере и сделать бэкап мира

Время на прочтение 7 мин
Количество просмотров 5.6K

Minecraft открывает большие возможностями для творчества. Вы можете реализовать креативные идеи, играть вместе с друзьями и создавать сообщество единомышленников. А будучи администратором сервера — получаете полный контроль над поведением игроков, можете поддерживать порядок в сообществе или сохранять изменения мира.

Посмотрим, как развернуть сервер Minecraft на операционной системе Ubuntu и создать бэкапы в объектное хранилище через утилиту s3fs. Подробности — под катом.
Читать дальше →
Всего голосов 37: ↑37 и ↓0 +37
Комментарии 21

Руководство по Kubernetes для хейтеров Kubernetes

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 8.3K


Есть среди программистов такая фракция, в которой Kubernetes пользуется дурной репутацией как чрезмерно сложный пожиратель времени и технология, которой следует сторониться стартапам. Использовать Kubernetes в рамках небольшой команды — явный признак инженерного переусложнения.

Я и сам замешан в перемывании косточек на эту тему.
Читать дальше →
Всего голосов 20: ↑17 и ↓3 +14
Комментарии 10

Бэкапы для самых маленьких и матерых

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 13K

Представьте: вы недавно основали небольшое веб-приложение. Но только он стал расти как полноценный проект — Бац! — серверы легли, а данные не сохранились. Нужно было делать бэкапы. Казалось бы, совет достаточно простой и базовый, но какой тип резервного копирования выбрать? И как правильно к нему «подойти»?

Сегодня — международный день бэкапов. Кажется, это отличный повод, чтобы вспомнить, почему резервное копирование так важно, какое оно бывает и как его настроить. Подробности под катом!
Читать дальше →
Всего голосов 32: ↑32 и ↓0 +32
Комментарии 10

Нидерланды сделают все, чтобы оставить ASML в стране: миллиардные инвестиции и всесторонняя помощь

Время на прочтение 4 мин
Количество просмотров 32K

Привет, Хабр! Недавно мы опубликовали статью «ASML собирается уйти из Нидерландов. Производитель литографов целится на международный уровень». В ней говорилось о том, что производитель самых современных литографов в мире планирует перенести штаб-квартиру из Нидерландов из-за проблем с инфраструктурой и логистикой. Но теперь, кажется, все изменилось: чиновники решили помочь компании решить все эти проблемы. Подробности под катом!
Читать дальше →
Всего голосов 64: ↑58 и ↓6 +52
Комментарии 65

Как работает etcd с Kubernetes и без него

Время на прочтение 23 мин
Количество просмотров 6.5K

Если вы когда-либо взаимодействовали с кластером Kubernetes, скорее всего, он был основан на etcd. etcd лежит в основе работы Kubernetes, но несмотря на это, напрямую взаимодействовать с ним приходится не каждый день.

Этот перевод статьи от learnk8s познакомит вас с принципами работы etcd, чтобы вы могли глубже понять внутреннюю работу Kubernetes и получить дополнительные инструменты для устранения неполадок в вашем кластере. Мы установим и сломаем кластер etcd с тремя нодами и узнаем, почему Kubernetes использует etcd в качестве базы данных.

Читать далее
Всего голосов 22: ↑22 и ↓0 +22
Комментарии 2

Пасхалочки от строителей при развёртывании ЛВС, или зачем нужен технадзор

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 20K

Когда поднимаешь сеть на только что отстроенном объекте, в идеальном мире строители уже подготовили для тебя помещения, протянули СКС, подвели питание и сделали всё что нужно. В реальности синхронизации между поднимающими сеть интеграторами и строителями не всегда придают должное значение. Что может пойти не так?

Расскажу вам об очень показательном кейсе такого рассинхрона. Я Сергей Шульгин, эксперт по сетевым технологиям ИТ-компании К2Тех. И этой историей я как бы намекаю, зачем в крупных проектах нужен технадзор и почему мудрые заказчики кровью вписывают его в договор с интеграторами.

В этой истории всё кончится хорошо, потому что мы неплохо тушим пожары и импровизируем в моменте. А потом делаем выводы. Подобные истории учат нас строить процессы иначе и видеть подводные камни заранее. Надеюсь, вам эта история поможет избежать некоторых организационных ошибок без необходимости учиться на собственном опыте.

Читать далее
Всего голосов 62: ↑62 и ↓0 +62
Комментарии 39

История 16-летнего подростка взломавшего ЦРУ

Время на прочтение 12 мин
Количество просмотров 5.9K
Подросток перехитривший правительство США. Эта история может показаться началом сюжета вымышленной истории о супергерое. Итак, как же у 16-летнего подростка получилось взломть ЦРУ.

image

Новая звезда в мире хакерства


Пока большинство детей его возраста играли в футбол, Мустафа аль-Бассам задавал начало своему будущему как одному из самых знаменитых хакеров в истории. Кто же этот вундеркинд?

Мустафа родился в 1995 году в Багдаде, Ирак. Когда ему было 6 лет, он и его семья иммигрировали в Великобританию и поселились в юго-восточной части Лондона. Мустафа рассказывает, что очень рано почувствовал тягу к компьютерам. Это началось, когда ему было 8 лет и его отец однажды пришел домой с компьютером. Совсем юный молодой парень начал часами проводить время за компьютерными играми, но его интерес к ним приобрел очень необычный оборот, особенно для 8-летнего ребенка. У Мустафы начали возникать мысли чуть шире, чем у обычного подростка: «А как на самом деле работают компьютеры?». И именно по причине его любознательности, в 8 лет он начал изучать компьютерное программирование и открыл для себя много нового об алгоритмах, цифровом кодировании и анализе данных.
Он даже начал создавать свои собственные веб-сайты с помощью программы Microsoft FrontPage и размещать их в сети

image

Как восьмилетний ребенок мог все это делать — уму непостижимо. Затем интересы Мустафы переключились с создания сайтов на манипуляции с чужими вебресурсами. Он взламывал сайты и переписывал их коды.
Читать дальше →
Всего голосов 28: ↑21 и ↓7 +14
Комментарии 1

Ближайшие события

PG Bootcamp 2024
Дата 16 апреля
Время 09:30 – 21:00
Место
Минск Онлайн
EvaConf 2024
Дата 16 апреля
Время 11:00 – 16:00
Место
Москва Онлайн
Weekend Offer в AliExpress
Дата 20 – 21 апреля
Время 10:00 – 20:00
Место
Онлайн

Тесты «Тринити»: совместимость со средствами доверенной загрузки

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 1.1K

Как часто процесс внедрения какого-нибудь ПАК в сервер затягивается из-за того, что «выключили — внедрили — включили — всё лежит». Причём, лежит не 5 минут, а, например, 5 дней, пока вокруг бегают инженеры, пытаясь понять, почему не заводится. Порой попытки внедрить так, чтобы соответствовать требованиям регуляторов, заканчиваются неудачей с пометкой «не внедряется». О том, сколько случаев потери критической информации происходит при таких процессах, можно и не говорить. Мы и есть эти бегающие инженеры — RnD-отдел российского производителя серверов и системного интегратора «Тринити». Когда с родного ИТ-рынка ушли мировые бренды, но появилось много разной техники, часто неизвестной ни интеграторам, ни тем более заказчикам, у нашей команды значительно прибавилось работы. Ведь эту технику надо тестировать на функциональность и совместимость с нашими серверами, чем мы и занимаемся целыми днями. Вот, решили делиться результатами. 

Так вышло, что наш корпоративный хабра-блог долго стоял на паузе, но теперь всё. Начнём со средств доверенной загрузки (СДЗ) для аппаратных платформ объектов критической инфраструктуры (КИИ), которыми мы недавно укомплектовали очередную партию наших серверов.  

Читать далее
Всего голосов 12: ↑12 и ↓0 +12
Комментарии 9

Запуск MacOS 13+ в VMware на процессорах AMD (OpenCore)

Время на прочтение 7 мин
Количество просмотров 3.2K

Всем привет. Делюсь своими изысканиями по запуску виртуальных машин MacOS на процессорах AMD. Возможно кому-то будет полезным.

Предыстория: в наличии несколько виртуалок, с которыми долгое время не было никаких проблем. Версии - от Mojave до Monterey, они даже обновлялись штатно. Далее, при апдейте на Ventura/Sonoma ловим кернел панику - никакие рекомендации из интернета не помогли. Глаз пал в сторону хакинтоша, но как его конфигурировать под вмварь тоже оказалось не совсем понятным, поэтому и напишу этот гайд:
вводные - Ryzen 5950X, Windows 10, VMware Workstation 16.2 (была версия 16.0, пока не столкнулись в проблемой апдейта макоси).

Читать далее
Всего голосов 18: ↑18 и ↓0 +18
Комментарии 2

Медленное выполнение команды TRUNCATE: анализ проблемы блокировок спинлока в SQL Server

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 2K

Приветствую всех читателей Хабра! Меня зовут Михаил, я администратор DBA в компании «Автомакон». На данный момент работаю на проекте для «ВкусВилл».

Решил затронуть одну из насущных проблем, связанную с работой SQL Server, а именно со спинлоками в нем. Да, даже такой зрелый и стабильный продукт как Microsoft SQL Server иногда подкидывает неожиданные задачи. Этот кейс хорошо демонстрирует, насколько увлекательные и интересные задачи решают администраторы баз данных. 

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 5

Фабрика должна расти: настраиваем игровой кластер Factorio

Время на прочтение 7 мин
Количество просмотров 11K

Игроки Factorio делятся на две группы. Одни отвергают игру в первые часы, а другие «залипают» на несколько суток и строят масштабные производственные линии. Несмотря на отличную оптимизацию игры, некоторые базы настолько велики, что даже самый мощный компьютер перестает справляться. Это, конечно, не устраивает тех, кто намерен продолжать играть.

Привет, Хабр! В этой статье покажу, как поднять выделенный игровой сервер Factorio. А также также поведаю о проекте, который соединяет отдельные серверы в один большой мир. Подробности под катом!
Читать дальше →
Всего голосов 48: ↑47 и ↓1 +46
Комментарии 33

ClickHouse как бэкенд для Prometheus

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 7.2K

Привет! Меня зовут Михаил Кажемский, я Lead DevOps в IT‑интеграторе Hilbert Team. В последнее время к нам часто обращаются заказчики, которым нужна помощь с организацией хранения долгосрочных метрик в российских облаках. Так как для многих эта задача сейчас актуальная, в данной статье мы с моим коллегой Денисом Бабичевым решили рассказать, как мы используем мощные возможности ClickHouse для эффективного долгосрочного хранения метрик Prometheus. В статье вы найдете рекомендации по использованию инструмента и описание альтернативных решений, таких как Thanos, Grafana Mimir и Victoria Metrics.

Читать далее
Всего голосов 22: ↑22 и ↓0 +22
Комментарии 2

Почему в 2024 году у кого-то ещё нет CRM?

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 7.7K

Энто как же, вашу мать, 
Извиняюсь, понимать?
/Л. Филатов/

Представьте себе: вы приходите в офис компании, а там бухгалтер сидит над главной книгой, правой рукой попеременно откладывает ручку и щёлкает деревянными костяшками на больших счётах. Предварительные данные записаны карандашом и, если что, стираются огромным серо-голубым ластиком «Архитектор». Часть оборотных средств лежит в сейфе в кабинете бухгалтера, а за остальными он или она ходит пару раз в месяц в банк, где заполняет от руки платёжное поручение из специального ящичка. Скорее всего, вы решите, что видите сон из детства или какой-то бред (зависит от года рождения). И для 2024 года это и правда бред. Но поставить компьютеры каждому сотруднику не значит начать работать продуктивно, с другим результатом. Вот это вполне себе данность для компаний малого и даже среднего бизнеса.

Читать далее
Всего голосов 30: ↑25 и ↓5 +20
Комментарии 7

Как добавить системности в мониторинг продакшна: параметры и тулинг для инцидент-менеджмента

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 2K

На проде что‑то сломалось — такова суровая реальность, случается с лучшими из нас, увы. Что часто происходит в подобных случаях: ловим алерты, бежим смотреть графики и логи, вызваниваем из отпуска разработчика, который занимался этой функциональностью, выкатываем фикс, проводим пост‑мортем. Это реакция на уровне здравого смысла, классика.

Но когда речь заходит о недозаработанных из‑за инцидента деньгах, расстроенных пользователях — любое улучшение, даже небольшое, на доли процента — может принести ощутимый результат.

Давайте поговорим, как подойти к вопросу мониторинга методологически — задействовать инструментарий инцидент‑менеджмента. Обсудим, как оценивать критичность сервисов и какие системы могут быть полезны для отслеживания проблем.

Статья ориентирована в первую очередь на тех, кто прямо сейчас занимается мониторингом на уровне общей инженерной грамотности, но пока не использует в явном виде инцидент‑менеджмент как подход.

А что дальше?
Всего голосов 23: ↑22 и ↓1 +21
Комментарии 3