Все потоки
Поиск
Написать публикацию
Обновить
561.76

IT-инфраструктура *

Инфоцентры + базы данных + системы связи

Сначала показывать
Порог рейтинга
Уровень сложности

Транзакционная работа с топиками: архитектура и сравнение решений в Apache Kafka и YDB Topics

Время на прочтение14 мин
Количество просмотров4.3K

Привет, Хабр! Меня зовут Алексей Николаевский, и мы с командой делаем СУБД Яндекса. С 2013 года в Яндексе использовали Kafka для потоковой передачи данных. Но Kafka со временем перестала справляться с растущими объёмами, и в 2017 году мы перешли на своё решение.

Брокер сообщений YDB Topics во многом вдохновлялся Kafka: в нём также есть топики, партиции и аналогичные способы работы с данными. Но есть и существенные отличия, о которых в конце прошлого года я рассказал на московской конференции HighLoad. Под катом — адаптированная для Хабра статья по мотивам этого доклада: про архитектуру транзакций в обеих системах и интересные для разработчиков детали и нюансы, которые мы обсуждали на конференции.

Читать далее

Снижаем стоимость инференса. Часть 1. Популярные подходы и что помогло нам повысить утилизацию GPU на 70%

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров1.5K

Привет, Хабр! Меня зовут Данила Гудынин, я DevOps-инженер направления Evolution ML Inference в Cloud.ru. В мире машинного обучения GPU — главный актив, но что делать, когда ваши дорогостоящие видеокарты используются всего на 50%? Мы у себя столкнулись именно с такой проблемой и, чтобы наши клиенты не платили за простаивающие ресурсы, разработали собственную технологию виртуализации GPU.

В этой статье пробежимся по верхам и расскажем, какие подходы рассматривали, и что в итоге позволило нам даже в условиях очень дорогого железа снизить цены до уровня западных облаков без просадки в производительности. А во второй части, которую опубликуем позже для тех, кто готов к глубокому погружению в оптимизацию GPU, мы поделимся готовыми алгоритмами для каждого из способов оптимизации и дадим «списать» немножко кода. Можете подписаться, чтобы не пропустить.

Узнать больше

Как настроить EVPN/VXLAN на коммутаторе: разбираемся на примере KORNFELD

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров5K

Привет, Хабр! Меня зовут Алексей Августинович, я принимаю участие в разработке операционной системы для линейки коммутаторов KORNFELD. В этом материале расскажу о возможностях нашей сетевой операционной системы, а именно — о поддержке функциональности L2 VXLAN. 

Настройка EVPN/VXLAN в сетях дата-центров — задача не из простых. Поэтому в материале я поделюсь шаблонами конфигураций, которые вы можете адаптировать под свои задачи, так как логика настройки и синтаксис у KORNFELD схожи с популярными вендорами.

Читать далее

Как снять метрики со служебных подов кластера Kubernetes

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4K

Мониторинг служебных компонентов Kubernetes в пространстве kube-system часто остается за пределами первоначальной настройки кластера. Однако стабильность таких компонентов как kube-apiserver, kube-scheduler и kube-controller-manager напрямую определяет работоспособность всей системы. Сбор метрик с этих подов требует точной настройки механизма обнаружения и безопасного доступа к их эндпоинтам.

Привет, Хабр! Меня зовут Катя Низовцева, я системный администратор в Selectel. В этой статье я покажу практическую методику развертывания vmagent с помощью Helm и настройки конфигураций для сбора метрик с ключевых системных компонентов. Это обеспечит видимость их состояния без избыточной сложности. Мы увидим в Victoria Metrics Cluster метрики, снимаемые с подов в служебном неймспейсе kube-system. Но обо всем по порядку.

Читать далее

Зрелое железо, к которому нужно найти подход: тестируем российские коммутаторы Eltex для ЦОД

Время на прочтение73 мин
Количество просмотров10K

Санкции, проблемы с параллельным импортом и требования регулятора ставят нас перед неизбежным вопросом — чем заменить привычное западное? Да так, чтобы не переучиваться с нуля на новую архитектуру и синтаксис. К сожалению, заявления производителей не всегда соответствует реальности. Поэтому, что железо, что ПО нужно тщательно тестировать. Что мы и делаем в нашей технической лаборатории.

Недавно к нам приехали коммутаторы для ЦОД российского вендора Eltex. И эта статья открывает цикл материалов, посвященных тестированию данного оборудованию в разных условиях. 

Читать далее

От небольшой мастерской к ML-фабрике: как мы Yandex AI Studio пересобирали

Время на прочтение11 мин
Количество просмотров2.2K

Сегодня на Yandex Neuro Scale 2025 наша ML‑команда представила обновлённую AI Studio — платформу с большим набором инструментов для разработки ИИ‑агентов в единой end‑to‑end‑среде. Среди новинок — визуальный конструктор агентов, поддержка популярных API и реализация протокола MСP, механизмы AI search.

Агентские платформы уже какое‑то время находятся на пике популярности. Поэтому с одной стороны нашей задачей было учесть уже сформированные лидерами отрасли лучшие практики. А с другой — обобщить собственный опыт разработки и внедрения агентов, использующих большие языковые модели, и избавить разработчиков от проблем при инференсе.

Вместе с коллегами из команды разработки Анастасией Каримовой и Дмитрием Рыбалко покажем, как это устроено под капотом:

— какие особенности эксплуатации нам нужно было учесть, чтобы найти баланс между производительностью и качеством;

— как мы сталкивались с особенностями опенсорс‑инструментов для ML и учились справляться с этим разными способами;

— как мы упростили создание голосовых агентов и заодно уменьшили latency запросов.

Читать далее

Цифровая энтропия: почему ваш сервер с аптаймом в 1000 дней — это ходячий мертвец, и как с этим жить

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров32K

Привет, коллеги! Хочу рассказать одну историю. Был у нас в стойке один сервер. Назовем его «Феникс». Работал как часы, аптайм — 986 дней. Мы им гордились, ставили в пример новичкам, мол, вот как надо настраивать железо и софт. А потом пришло время планового техобслуживания в дата-центре. Простое выключение-включение. «Феникс» больше не взлетел. RAID-контроллер решил, что с него хватит, а заодно прихватил с собой пару дисков из массива. Вот тогда я впервые по-настояшему задумался о том, что цифровой мир подчиняется тем же жестоким законам, что и физический.

В теории, код и данные — это нечто вечное. Биты не ржавеют, скрипты не изнашиваются. Но на практике любая сложная система со временем деградирует. Это не просто отказ железа ; это медленный, неумолимый «постепенный скат в беспорядок» , который затрагивает всё: софт, конфигурации, данные. Это явление, которое я для себя называю  цифровой энтропией, — наш с вами постоянный и невидимый враг. Наша работа — не просто строить системы, а вести непрерывную войну с их неизбежным распадом.  

Эта статья — путешествие по самым темным уголкам цифровой энтропии. Мы заглянем в глаза её самым жутким проявлениям, поделимся байками из серверной и вооружимся как тактическими командами для экстренных случаев, так и стратегическими концепциями, которые помогут держать хаос в узде.

Читать далее

Можно ли перейти с Oracle или MS SQL на СУБД из Реестра российского ПО без переписывания всей хранимой логики?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров5.4K

Можно ли перейти с Oracle или MS SQL на СУБД из Реестра российского ПО без переписывания всей хранимой логики?
Один из возможных подходов к решению этой задачи.

Читать далее

От Pizza Hut до платформенной экономики: эволюция сервисов

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2K

С 1 октября 2026 года в силу вступает № 289-ФЗ — закон, регулирующий работу цифровых платформ. Формально это про правила работы сервисов в России, но на самом деле — продолжение долгой мировой истории, начавшейся ещё в 90-х. В статье расскажу, какой была первая система для онлайн-покупок, почему первым интернет-сервисом считается сайт доставки пиццы и как эволюция сервисов закономерно привела нас к регулированию.

Читать

Хождение по граблям, или создаем свой мини корпус для NAS, 26ssd 3+5hdd

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров5.5K

Хождение по граблям, или создаем свой мини корпус для NAS, 26ssd 3+5hdd

Есть у нас старая добрая народная традиция, «раз в год» зачем-то строить свой домашний сервер. Всякие «облаки», и тому подобный «паропанк», не наш путь и не наш метод.

Но есть особое темное искусство на этой стезе, сделать свой домашний сервер, ещё немного своим и домашним. Кастомизировать его, например, сделать для него свой корпус. ) А вы, наверное, подумали про сделать свою материнскую плату и т. д.?! Что-то мне подсказывает, что скоро и до этого дойдем. По крайней мере очень хотелось бы. )

Так как желания, иметь (ещё кто кого) свой домашний сервер, идет в купе с желанием путешествовать, то ко всем прочим хотелкам добавилась миниатюрность. Нужно было впихнуть имеющееся железо в максимально возможно маленький корпус.

И так идём на Грабли...

Как мы отказались от транспондеров: практический переход на 400G ZR+

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.3K

В самом начале всё выглядело достойно: надёжные Arista DCS-7170-64C-F с 64 портами по 100G, проверенные временем, отвечающие всем актуальным на тот момент требованиям. Мы развернули их по всем дата-центрам и чувствовали себя уверенно. Это выглядело оптимальным решением для текущего объёма задач.

Но инфраструктура не стоит на месте, особенно когда бизнес растёт. Количество клиентов росло, вместе с ними — сложность и требования к сети. Понадобилось больше гибкости, изоляции, междатацентровой связности. Мы начали смотреть в сторону VXLAN — и тут выяснилось: профиль Q-in-Q в Arista сильно (реально сильно) ограничивает количество MAC-адресов. Не баг, не фейл — просто особенности архитектуры, которая не была рассчитана на те масштабы, в которые мы стремительно ворвались.

Вывод был очевиден: пора готовиться к следующему этапу.

Читать далее

Finetuning без греха: как кастомизировать AI и не сломать его

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров1.2K

Создание кастомной AI-модели для бизнеса кажется простой: скачал базовую модель, загрузил данные — и вот уже готовый AI-юрист или диагност. Но на практике компания часто получает беспомощного «Франкенштейна», который генерирует полную ахинею. Итог — месяцы работы впустую и выброшенный бюджет.

В чем же ошибка? Finetuning — это не волшебная палочка для мгновенного результата, а точный хирургический инструмент. Его неверное применение не улучшает модель, а буквально калечит ее.

С вами вновь Александр Константинов — технический эксперт из Cloud.ru. И на этот раз мы разберем, как избежать главных ошибок тонкой настройки: от принятия решения о ее необходимости до семи смертных грехов, которые губят большинство проектов.

Читать дальше

«Политика открытых дверей»: как один скрипт обрушил защиту домена

Время на прочтение8 мин
Количество просмотров9.3K

Всем привет! На связи Дмитрий Неверов, руководитель направления тестирования на проникновение в Бастионе. Мы профессионально ломаем системы безопасности компаний. Разумеется, с разрешения их владельцев. Расскажу кейс, за который я получил ачивку «Фаворит года по версии жюри» Pentest Awards 2025.

Представьте: крупная инфраструктурная компания с регулярными пентестами, серьезным бюджетом на ИБ и жесткими регуляторными требованиями. Казалось бы, что тут можно сломать? А мы взяли и получили права доменного администратора, начав путь с непривилегированной учетки сотрудника. И никаких бэкдоров или zero-day, только чистая работа с Active Directory.

Самое интересное — как несколько на первый взгляд безобидных настроек превратились в билет к полному контролю над доменом. Сейчас покажу всю цепочку от начала и до победного DCSync.

Читать далее ⟶

Ближайшие события

Выбрал Колибри-АРМ и не прогадал: история замены SCCM в крупной ИТ-инфраструктуре

Время на прочтение17 мин
Количество просмотров1.7K

Привет, Хабр! На связи Денис Мурунов, руководитель практики базовых инфраструктурных сервисов К2Тех. Дано: крупной организации нужно заменить Microsoft SCCM на тысячах рабочих мест. На столе — два российских решения: Зодиак АйТиЭм, с которым мы познакомились пару лет назад (читайте наш обзор), и Колибри-АРМ — относительно новый продукт с амбициями. Заказчик к выбору подошел основательно: сначала провёл самостоятельное пилотирование и тестирование решений. Затем мы подготовили подробное сравнение по требованиям ТЗ от заказчика, провели демонстрации. Полученные нами результаты говорили в пользу Зодиака, однако с учетом всех факторов выбор пал на Колибри. Почему?

Читайте в статье, что стало решающим аргументом при выборе, почему даже еще развивающийся продукт может оказаться стратегически верным решением и чему учит непростое внедрение.

Читать далее

Как снизить затраты на генеративный ИИ: практическое руководство по выбору видеокарты

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров2.4K

Привет, Хабр! Я Идрис Юсупов, занимаюсь направлением искусственного интеллекта в AutoFAQ. Мы делаем омниканальную платформу на базе ИИ для поддержки клиентов и сотрудников.

Недавно я решил проверить, какие видеокарты выбрать для генеративного ИИ. Почему это важно? Потому что для компаний вопрос выбора железа всегда болезненный. Оно должно помогать решать задачи и при этом оставаться в разумных рамках по стоимости.

Материал будет полезен ИТ-директорам, архитекторам решений и инженерам, которые выбирают видеокарты для запуска генеративного ИИ в корпоративной инфраструктуре. В статье расскажу, где хватает проверенных карт, а где уже стоит смотреть на новое поколение вроде Blackwell. Под катом — цифры, метрики и выводы.

Читать далее

Сетевой нейтралитет: как развивались законы, регулирующие интернет

Время на прочтение7 мин
Количество просмотров609

Сетевой нейтралитет — это не только технический или академический концепт, а часть сложной правовой и политической истории, где ключевую роль играют законы, интерпретации Federal Communications Commission (FCC, Федеральная Комиссия по связи) и решения судов. За красивыми фразами об «открытом интернете» стоит длительная борьба за формулировки и полномочия, и чтобы понимать суть споров, важно видеть контекст — историю законодательства и юридических классификаций.

Меня зовут Ольга Макарова, я директор департамента коммерческого управления ресурсами технического блока МТС. Вы читаете второй материал из цикла «Сетевой нейтралитет: не совсем то, что так называют». Я расскажу, как академическое понятие превратилось в юридическую категорию, к каким важным определениям и тезисам пришло американское законодательство.

Читать далее

Кастомизация Keycloak: Keycloakify вместо Freemarker – причины, боли, решения

Время на прочтение9 мин
Количество просмотров2.5K

Всем привет! Меня зовут Артем, я фронтенд разработчик в Банки.ру. Недавно перед нашей командой встала задача внедрить SSO-аутентификацию через Keycloak для клиентских сервисов. Помимо базовой настройки важно было полностью переработать стандартные формы входа, чтобы они соответствовали корпоративному стилю и UX-требованиям.

Эта статья будет полезна фронтенд-разработчикам, которые хотят кастомизировать интерфейс Keycloak, не жертвуя современным стэком, скоростью разработки и здравым рассудком. А также командам, которые находятся на этапе выбора решения для авторизации из имеющихся на рынке. Мы разберём практические шаги внедрения, покажем код и честно расскажем о подводных камнях, с которыми столкнулись сами.

Читать далее

Сопротивление сотрудников при внедрении CRM

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров430

Внедрение CRM – важный процесс, который нередко встречает сопротивление сотрудников.

Почему так происходит и как превратить сопротивление в поддержку, расскажем в этой статье.

Отсутствие вовлеченности в процесс внедрения

Распространены случаи, когда сотрудники, в будущем ключевые пользователи CRM, не участвуют в процессе выбора и внедрения. Как правило, это происходит в крупных компаниях и вызывает сопротивление. Сотрудники чувствуют себя отстраненными от процесса и боятся, что система будет выбрана без учета их реальных потребностей. Они критикуют систему, указывая на ее неудобства и несоответствия.

В этом случае и в принципе по дефолту мы стараемся привлечь ключевых сотрудников к процессу предварительной настройки и демонстрации, помогая почувствовать себя частью команды.

Наши специалисты проводят опросы и интервью с целью учесть все потребности для корректной настройки. CRM настраивается согласно требованиям компании, проводится демонстрационная встреча. Мы собираем обратную связь и при необходимости вносим корректировки. Также демонстрируем и разбираем кейсы успешного внедрения в других компаниях.

Изменения в бизнес-процессах

Сотрудники боятся изменений, особенно если они связаны с современными технологиями.

Опасения понятны, но основная цель современной CRM – это оптимизация и упрощение бизнес-процессов.  Компании получают возможность использовать лучшие практики для продаж, маркетинга и клиентского сервиса, зарекомендовавшие себя в крупных российских компаниях, а также готовые отраслевые решения для более стремительного развития бизнеса. Например, целесообразно внедрить готовое решение от вендора и развивать силами одного бизнес-аналитика, умеющего работать с технологией low-code.

Читать далее

Телеграм: голосуй и проиграешь

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров16K

За последние дни количество моих знакомых и друзей, пострадавших от угона их телеграм-аккаунта, значительно выросло. Схема далеко не новая, я даже считал, что уж про нее слышали все, но оказалось это не так, и память людей довольно коротка.

В этой статье мы разберем двухэтапную схему с угоном и монетизацией tg-аккаунтов, а именно:

— Как именно происходит угон? Важен ли нарратив, используемый в социальной части?
— Достаточно ли только одной ошибки пользователя?
— Как именно аккаунты монетизируют?
— В чем главные фишки автоматизации работы злоумышленников на базе нейросетей?
— Как именно злоумышленники противодействуют жертве и попыткам вскрыть обман?
— Почему схема настолько успешна и что можно с этим сделать?
— Применима ли она к иным мессенджерам?

Интересно? Добро пожаловать под кат, а если посчитаете полезным — распространите.

Потерять аккаунт

От наскальных рисунков до S3: эволюция хранения данных

Время на прочтение12 мин
Количество просмотров6.5K

Как вы храните данные? Используете файловое хранилище, S3, базы данных, держите файлы прямо на сервере, храните все локально на HDD, SSD или даже флешке — вариантов масса, на любой вкус и цвет. В этой статье я предлагаю вспомнить, как развивалось хранение информации и как мы прошли путь от наскальной живописи до приватного S3. Это поможет разобраться, какую технологию лучше использовать для ваших задач. 

Читать далее

Вклад авторов