IT-инфраструктура *

Инфоцентры + базы данных + системы связи

Статьи Посты Новости Авторы Компании

antonaleks605 4 апр в 12:14

Как мы ускорили деплой облачной платформы в 20 раз и избавились от панических атак

Средний

12 мин

Блог компании Selectel IT-инфраструктура *Облачные сервисы *IT-компании

Привет, Хабр! С вами снова Антон, все еще DevOps-инженер в Selectel. И да, в этот раз ни слова про шеринг GPU, не пугайтесь. :)

Недавно на DevOps Conf я рассказал, как мы в отделе DataML-продуктов используем GitLab и Terraform, чтобы деплоить облачную платформу за 24 минуты вместо восьми часов, избавиться от костылей на серверах и получать больше удовольствия от работы. Вот ссылка на сам доклад. В этой статье я поделюсь этим опытом, дополню свой рассказ примерами, а для самых терпеливых оставлю ссылку на бесплатный двухнедельный тест той самой платформы.

Читать дальше →

+43

rearranged 4 апр в 12:03

DevOps на IBM: как мы навели порядок в 700 системах, перейдя от bash к IaC

Средний

8 мин

5.9K

Блог компании КРОК Системное администрирование *IT-инфраструктура *DevOps *

Кейс

В инфраструктуре заказчика имелся большой зоопарк систем, не объединенных единой логикой. Надо было навести порядок и наладить автоматизацию, особенно после того, как в этом уже поучаствовали сотрудники различных подразделений и сторонних компаний, не особо озабоченных единой концепцией.

Нам повезло, что заказчик сам не до конца представлял, что именно хочет, поэтому в проекте было много пространства для творчества и возможности применить методологию DevOps, в том числе к системам на AIX. Ну а началось все с одного болезненного инцидента.

+18

silabeer 4 апр в 11:58

Используй Силу, Люк: Single Pane of Glass в Мире SRE

Средний

11 мин

1.6K

Блог компании VK Блог компании Конференции Олега Бунина (Онтико) IT-инфраструктура *DevOps *

Кейс

Привет, Хабр! Меня зовут Кирилл, я работаю в IT более 13 лет. Сначала инженером по внедрению, потом DevOps, потом SRE, также работал руководителем группы сопровождения. Сейчас SRE в VK Рекламе, поэтому знаю, как важно делать правильные инструменты для анализа проблем.

В любом проекте и компании я иногда сталкивался, а иногда сам создавал проблему: огромное количество дашбордов. Вспомните ситуацию, когда вы в Grafana ищете какой-нибудь дашборд, пишете, например, «Tarantool», и вам выпадает огромный список дашбордов, которые кто-то до вас насоздавал. Это могут быть кастомные дашборды, которые кто-то делал для какого-нибудь инцидента, или просто созданные другими специалистами. Часто бывает, что половина этих дашбордов нерабочие или на них нет чего-то полезного.

Как правило, обилие дашбордов создаёт ряд проблем: информационную перегрузку, потерю фокуса, сложность восприятия, а самое главное, затруднение исследований инцидентов. Попробуйте себе честно ответить на вопрос: глядя на свой дашборд, вы можете понять, работает ваша система или нет? Если нет, то читайте дальше.

+29

vadvolo 4 апр в 10:30

Автоматизируем сеть Яндекса с Милошем: сервис конфигураций оборудования

19 мин

6.2K

Блог компании Яндекс Блог компании Yandex Cloud & Yandex Infrastructure IT-инфраструктура *Сетевые технологии *Сетевое оборудование

Задумывались ли вы о том, как изменить конфигурацию сразу на нескольких сетевых устройствах? Что, если нужно сделать это на всей сети с сотнями и тысячами единиц оборудования? А что, если приходится делать это каждый месяц на железе от пяти разных производителей? Очевидное решение для подобных задач — автоматизация. Но реализовать её можно не одним способом, а в процессе наткнуться не на одни грабли.

Меня зовут Вадим Воловик, и я руковожу проектами разработки в Yandex Infrastructure. Наша команда NOCDEV отвечает за автоматизацию сетей всего Яндекса. Давно хотелось рассказать о задачах такого масштаба, но по ходу написания материала стало понятно, что тема тянет на целый цикл. Так что мы с коллегами расскажем о самых интересных примерах автоматизации в отдельных постах.

В этой статье проведём небольшую экскурсию по нашему сетевому «хозяйству» в десятки тысяч устройств и остановимся подробнее на том, как при таком объёме мы автоматически обновляем конфигурации.

+26

CrocInc 2 апр в 15:34

AFCOM: Бум ИИ стимулирует инновации в проектировании и строительстве ЦОД

Простой

5 мин

775

Блог компании КРОК IT-инфраструктура *Исследования и прогнозы в IT *Читальный зал Искусственный интеллект

Аналитика

Перевод

В своем последнем отчете AFCOM (Association For Computer Operations Management) отмечают, что стремительное развитие искусственного интеллекта и широкое распространение цифровых сервисов стимулируют спрос на инновационные технологии в области проектирования ЦОД. Однако в ходе проведения исследования в AFCOM пришли к выводу, что хотя индустрия дата-центров и переживает «бум в области проектирования и строительства инфраструктуры», вместе с тем возникают и новые проблемы в таких ключевых аспектах, как энергопотребление, охлаждение и реализация целей устойчивого развития.

Команда редакции Хабра КРОК подготовила для вас перевод ключевых трендов из отчета AFCOM. Читайте под катом!

+15

Exosphere 1 апр в 20:45

1 апреля — о серьёзном: факапы бэкапов

Простой

10 мин

12K

Блог компании Хабр Информационная безопасность *IT-инфраструктура *Хранение данных *

Дайджест

Первое апреля — день, когда все смеются, а разработчики и админы могут плакать, потому что 31 марта, во всемирный день бэкапа, происходит лютый шабаш хакеров, мошенников, интернет-хулиганов и всех тех, кто не против попробовать на прочность IT-мир. Мы попросили пользователей Хабра рассказать о своих факапах с бэкапами, чтобы другие могли поучиться в том числе на чужих ошибках. И, конечно, желательно их не повторять. Ну и, конечно, за такую информацию положены симпатичные призы.

Боишься ли ты не делать бэкапы?

+63

romanova_ase 1 апр в 13:54

Как развернуть Minecraft на сервере и сделать бэкап мира

7 мин

5.6K

Блог компании Selectel IT-инфраструктура *Облачные сервисы *IT-компании

Minecraft открывает большие возможностями для творчества. Вы можете реализовать креативные идеи, играть вместе с друзьями и создавать сообщество единомышленников. А будучи администратором сервера — получаете полный контроль над поведением игроков, можете поддерживать порядок в сообществе или сохранять изменения мира.

Посмотрим, как развернуть сервер Minecraft на операционной системе Ubuntu и создать бэкапы в объектное хранилище через утилиту s3fs. Подробности — под катом.

Читать дальше →

+37

Albert_Wesker 31 мар в 17:01

Руководство по Kubernetes для хейтеров Kubernetes

Средний

6 мин

8.3K

Блог компании Timeweb Cloud IT-инфраструктура *Облачные сервисы *Kubernetes *

Кейс

Перевод

Есть среди программистов такая фракция, в которой Kubernetes пользуется дурной репутацией как чрезмерно сложный пожиратель времени и технология, которой следует сторониться стартапам. Использовать Kubernetes в рамках небольшой команды — явный признак инженерного переусложнения.

Я и сам замешан в перемывании косточек на эту тему.

Читать дальше →

+14

Doctor_IT 31 мар в 11:17

Бэкапы для самых маленьких и матерых

Простой

9 мин

13K

Блог компании Selectel Веб-разработка *IT-инфраструктура *Резервное копирование *IT-компании

Роадмэп

Представьте: вы недавно основали небольшое веб-приложение. Но только он стал расти как полноценный проект — Бац! — серверы легли, а данные не сохранились. Нужно было делать бэкапы. Казалось бы, совет достаточно простой и базовый, но какой тип резервного копирования выбрать? И как правильно к нему «подойти»?

Сегодня — международный день бэкапов. Кажется, это отличный повод, чтобы вспомнить, почему резервное копирование так важно, какое оно бывает и как его настроить. Подробности под катом!

Читать дальше →

+32

DRoman0v 30 мар в 11:19

Нидерланды сделают все, чтобы оставить ASML в стране: миллиардные инвестиции и всесторонняя помощь

4 мин

32K

Блог компании Selectel IT-инфраструктура *Производство и разработка электроники *IT-компании

Привет, Хабр! Недавно мы опубликовали статью «ASML собирается уйти из Нидерландов. Производитель литографов целится на международный уровень». В ней говорилось о том, что производитель самых современных литографов в мире планирует перенести штаб-квартиру из Нидерландов из-за проблем с инфраструктурой и логистикой. Но теперь, кажется, все изменилось: чиновники решили помочь компании решить все эти проблемы. Подробности под катом!

Читать дальше →

+52

Liloon21 28 мар в 19:34

Как работает etcd с Kubernetes и без него

23 мин

6.5K

Блог компании Слёрм IT-инфраструктура *DevOps *Kubernetes *

Туториал

Recovery Mode

Перевод

Если вы когда-либо взаимодействовали с кластером Kubernetes, скорее всего, он был основан на etcd. etcd лежит в основе работы Kubernetes, но несмотря на это, напрямую взаимодействовать с ним приходится не каждый день.

Этот перевод статьи от learnk8s познакомит вас с принципами работы etcd, чтобы вы могли глубже понять внутреннюю работу Kubernetes и получить дополнительные инструменты для устранения неполадок в вашем кластере. Мы установим и сломаем кластер etcd с тремя нодами и узнаем, почему Kubernetes использует etcd в качестве базы данных.

+22

SShulgin 28 мар в 13:33

Пасхалочки от строителей при развёртывании ЛВС, или зачем нужен технадзор

Средний

8 мин

20K

Блог компании К2Тех IT-инфраструктура *Беспроводные технологии *Сетевое оборудование

Кейс

Когда поднимаешь сеть на только что отстроенном объекте, в идеальном мире строители уже подготовили для тебя помещения, протянули СКС, подвели питание и сделали всё что нужно. В реальности синхронизации между поднимающими сеть интеграторами и строителями не всегда придают должное значение. Что может пойти не так?

Расскажу вам об очень показательном кейсе такого рассинхрона. Я Сергей Шульгин, эксперт по сетевым технологиям ИТ-компании К2Тех. И этой историей я как бы намекаю, зачем в крупных проектах нужен технадзор и почему мудрые заказчики кровью вписывают его в договор с интеграторами.

В этой истории всё кончится хорошо, потому что мы неплохо тушим пожары и импровизируем в моменте. А потом делаем выводы. Подобные истории учат нас строить процессы иначе и видеть подводные камни заранее. Надеюсь, вам эта история поможет избежать некоторых организационных ошибок без необходимости учиться на собственном опыте.

+62

HannaBilova 28 мар в 13:09

История 16-летнего подростка взломавшего ЦРУ

12 мин

5.9K

Блог компании ua-hosting.company Информационная безопасность *Антивирусная защита *IT-инфраструктура *Социальные сети и сообщества

Подросток перехитривший правительство США. Эта история может показаться началом сюжета вымышленной истории о супергерое. Итак, как же у 16-летнего подростка получилось взломть ЦРУ.

Новая звезда в мире хакерства

Пока большинство детей его возраста играли в футбол, Мустафа аль-Бассам задавал начало своему будущему как одному из самых знаменитых хакеров в истории. Кто же этот вундеркинд?

Мустафа родился в 1995 году в Багдаде, Ирак. Когда ему было 6 лет, он и его семья иммигрировали в Великобританию и поселились в юго-восточной части Лондона. Мустафа рассказывает, что очень рано почувствовал тягу к компьютерам. Это началось, когда ему было 8 лет и его отец однажды пришел домой с компьютером. Совсем юный молодой парень начал часами проводить время за компьютерными играми, но его интерес к ним приобрел очень необычный оборот, особенно для 8-летнего ребенка. У Мустафы начали возникать мысли чуть шире, чем у обычного подростка: «А как на самом деле работают компьютеры?». И именно по причине его любознательности, в 8 лет он начал изучать компьютерное программирование и открыл для себя много нового об алгоритмах, цифровом кодировании и анализе данных.
Он даже начал создавать свои собственные веб-сайты с помощью программы Microsoft FrontPage и размещать их в сети

Как восьмилетний ребенок мог все это делать — уму непостижимо. Затем интересы Мустафы переключились с создания сайтов на манипуляции с чужими вебресурсами. Он взламывал сайты и переписывал их коды.

Читать дальше →

+14

OlgaRode 28 мар в 13:05

Тесты «Тринити»: совместимость со средствами доверенной загрузки

Простой

9 мин

1.1K

Блог компании Тринити Информационная безопасность *Системное администрирование *IT-инфраструктура *Законодательство в IT

Обзор

Как часто процесс внедрения какого-нибудь ПАК в сервер затягивается из-за того, что «выключили — внедрили — включили — всё лежит». Причём, лежит не 5 минут, а, например, 5 дней, пока вокруг бегают инженеры, пытаясь понять, почему не заводится. Порой попытки внедрить так, чтобы соответствовать требованиям регуляторов, заканчиваются неудачей с пометкой «не внедряется». О том, сколько случаев потери критической информации происходит при таких процессах, можно и не говорить. Мы и есть эти бегающие инженеры — RnD-отдел российского производителя серверов и системного интегратора «Тринити». Когда с родного ИТ-рынка ушли мировые бренды, но появилось много разной техники, часто неизвестной ни интеграторам, ни тем более заказчикам, у нашей команды значительно прибавилось работы. Ведь эту технику надо тестировать на функциональность и совместимость с нашими серверами, чем мы и занимаемся целыми днями. Вот, решили делиться результатами.

Так вышло, что наш корпоративный хабра-блог долго стоял на паузе, но теперь всё. Начнём со средств доверенной загрузки (СДЗ) для аппаратных платформ объектов критической инфраструктуры (КИИ), которыми мы недавно укомплектовали очередную партию наших серверов.

+12

Okeu 28 мар в 11:20

Запуск MacOS 13+ в VMware на процессорах AMD (OpenCore)

7 мин

3.2K

IT-инфраструктура *Виртуализация *

Из песочницы

Всем привет. Делюсь своими изысканиями по запуску виртуальных машин MacOS на процессорах AMD. Возможно кому-то будет полезным.

Предыстория: в наличии несколько виртуалок, с которыми долгое время не было никаких проблем. Версии - от Mojave до Monterey, они даже обновлялись штатно. Далее, при апдейте на Ventura/Sonoma ловим кернел панику - никакие рекомендации из интернета не помогли. Глаз пал в сторону хакинтоша, но как его конфигурировать под вмварь тоже оказалось не совсем понятным, поэтому и напишу этот гайд:
вводные - Ryzen 5950X, Windows 10, VMware Workstation 16.2 (была версия 16.0, пока не столкнулись в проблемой апдейта макоси).

+18

Mihpetu 27 мар в 19:58

Медленное выполнение команды TRUNCATE: анализ проблемы блокировок спинлока в SQL Server

Средний

6 мин

Блог компании Автомакон SQL *IT-инфраструктура *Microsoft SQL Server *IT-компании

Приветствую всех читателей Хабра! Меня зовут Михаил, я администратор DBA в компании «Автомакон». На данный момент работаю на проекте для «ВкусВилл».

Решил затронуть одну из насущных проблем, связанную с работой SQL Server, а именно со спинлоками в нем. Да, даже такой зрелый и стабильный продукт как Microsoft SQL Server иногда подкидывает неожиданные задачи. Этот кейс хорошо демонстрирует, насколько увлекательные и интересные задачи решают администраторы баз данных.

+15

Firemoon 27 мар в 13:47

Фабрика должна расти: настраиваем игровой кластер Factorio

7 мин

11K

Блог компании Selectel IT-инфраструктура *Серверное администрирование *Игры и игровые консоли

Игроки Factorio делятся на две группы. Одни отвергают игру в первые часы, а другие «залипают» на несколько суток и строят масштабные производственные линии. Несмотря на отличную оптимизацию игры, некоторые базы настолько велики, что даже самый мощный компьютер перестает справляться. Это, конечно, не устраивает тех, кто намерен продолжать играть.

Привет, Хабр! В этой статье покажу, как поднять выделенный игровой сервер Factorio. А также также поведаю о проекте, который соединяет отдельные серверы в один большой мир. Подробности под катом!

Читать дальше →

+46

devops_ht 26 мар в 18:56

ClickHouse как бэкенд для Prometheus

Средний

8 мин

7.2K

Системное администрирование *IT-инфраструктура *Хранение данных *Хранилища данных *DevOps *

Туториал

Привет! Меня зовут Михаил Кажемский, я Lead DevOps в IT‑интеграторе Hilbert Team. В последнее время к нам часто обращаются заказчики, которым нужна помощь с организацией хранения долгосрочных метрик в российских облаках. Так как для многих эта задача сейчас актуальная, в данной статье мы с моим коллегой Денисом Бабичевым решили рассказать, как мы используем мощные возможности ClickHouse для эффективного долгосрочного хранения метрик Prometheus. В статье вы найдете рекомендации по использованию инструмента и описание альтернативных решений, таких как Thanos, Grafana Mimir и Victoria Metrics.

+22

Axelus 26 мар в 13:03

Почему в 2024 году у кого-то ещё нет CRM?

Простой

7 мин

7.7K

Блог компании RegionSoft IT-инфраструктура *SaaS / S+S *CRM-системы *Софт

Энто как же, вашу мать,
Извиняюсь, понимать?
/Л. Филатов/

Представьте себе: вы приходите в офис компании, а там бухгалтер сидит над главной книгой, правой рукой попеременно откладывает ручку и щёлкает деревянными костяшками на больших счётах. Предварительные данные записаны карандашом и, если что, стираются огромным серо-голубым ластиком «Архитектор». Часть оборотных средств лежит в сейфе в кабинете бухгалтера, а за остальными он или она ходит пару раз в месяц в банк, где заполняет от руки платёжное поручение из специального ящичка. Скорее всего, вы решите, что видите сон из детства или какой-то бред (зависит от года рождения). И для 2024 года это и правда бред. Но поставить компьютеры каждому сотруднику не значит начать работать продуктивно, с другим результатом. Вот это вполне себе данность для компаний малого и даже среднего бизнеса.

+20

banet1k 26 мар в 12:13

Как добавить системности в мониторинг продакшна: параметры и тулинг для инцидент-менеджмента

Средний

8 мин

Блог компании Сравни IT-инфраструктура *Service Desk *DevOps *

Туториал

На проде что‑то сломалось — такова суровая реальность, случается с лучшими из нас, увы. Что часто происходит в подобных случаях: ловим алерты, бежим смотреть графики и логи, вызваниваем из отпуска разработчика, который занимался этой функциональностью, выкатываем фикс, проводим пост‑мортем. Это реакция на уровне здравого смысла, классика.

Но когда речь заходит о недозаработанных из‑за инцидента деньгах, расстроенных пользователях — любое улучшение, даже небольшое, на доли процента — может принести ощутимый результат.

Давайте поговорим, как подойти к вопросу мониторинга методологически — задействовать инструментарий инцидент‑менеджмента. Обсудим, как оценивать критичность сервисов и какие системы могут быть полезны для отслеживания проблем.

Статья ориентирована в первую очередь на тех, кто прямо сейчас занимается мониторингом на уровне общей инженерной грамотности, но пока не использует в явном виде инцидент‑менеджмент как подход.

А что дальше?

+21

3 4 ...

49 50

IT-инфраструктура *

Как мы ускорили деплой облачной платформы в 20 раз и избавились от панических атак

DevOps на IBM: как мы навели порядок в 700 системах, перейдя от bash к IaC

Используй Силу, Люк: Single Pane of Glass в Мире SRE

Автоматизируем сеть Яндекса с Милошем: сервис конфигураций оборудования

Истории

AFCOM: Бум ИИ стимулирует инновации в проектировании и строительстве ЦОД

1 апреля — о серьёзном: факапы бэкапов

Как развернуть Minecraft на сервере и сделать бэкап мира

Руководство по Kubernetes для хейтеров Kubernetes

Бэкапы для самых маленьких и матерых

Нидерланды сделают все, чтобы оставить ASML в стране: миллиардные инвестиции и всесторонняя помощь

Как работает etcd с Kubernetes и без него

Пасхалочки от строителей при развёртывании ЛВС, или зачем нужен технадзор

История 16-летнего подростка взломавшего ЦРУ

Новая звезда в мире хакерства

Ближайшие события

Тесты «Тринити»: совместимость со средствами доверенной загрузки

Запуск MacOS 13+ в VMware на процессорах AMD (OpenCore)

Медленное выполнение команды TRUNCATE: анализ проблемы блокировок спинлока в SQL Server

Фабрика должна расти: настраиваем игровой кластер Factorio

ClickHouse как бэкенд для Prometheus

Почему в 2024 году у кого-то ещё нет CRM?

Как добавить системности в мониторинг продакшна: параметры и тулинг для инцидент-менеджмента

Вклад авторов

Работа