Все потоки
Поиск
Написать публикацию
Обновить
535.69

IT-инфраструктура *

Инфоцентры + базы данных + системы связи

Сначала показывать
Порог рейтинга
Уровень сложности

3D-печать прямо на чипе: новый способ охлаждения процессоров. Как это работает

Время на прочтение4 мин
Количество просмотров8.7K

3D-печать давно перестала быть развлечением для гиков и шагнула в самые разные сферы — от строительства до медицины и электроники. Но самые радикальные изменения происходят на микроуровне: именно там маленькие технологические трюки способны перевернуть целые индустрии.

Компания Fabric8Labs научилась «выращивать» медные охлаждающие пластины прямо на процессорах с пиксельной точностью (еще ИИ вовлекают). Это не маркетинговый штамп, а рабочая технология, которая позволяет создавать сложные микроструктуры для отвода тепла. Давайте посмотрим, что это и как работает.

Читать далее

Просто и подробно о том, как работают ChatGPT и другие GPT подобные модели. С картинками

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров42K

Эта статья — длиннопост о том, как работают ChatGPT и другие GPT подобные модели

Внутри

🔠 Подробно про токены, токенизатор и контекстное окно

❓ Почему GPT модели работают лучше на английском, чем на русском

🔢 Как большие языковые модели работают с числами

Два моих убеждения о том, почему важно понимать принцип работы нейросетей

Непонятная технология воспринимается как магия

Люди любят наделять неживое свойствами живого

LLM сочетают в себе эти два свойства: они достаточно сложны в устройстве и естественны в общении. Это сочетание снижает критичность восприятия — люди могут воспринимать ChatGPT и подобные интерфейсы как разумных существ, что приводит к переоценке их возможностей, повышенной внушаемости и определенным психологическим рискам — эмоциональной зависимости или мании величия от «особых отношений» с ИИ.

Узнать, как же они работают 🦄

Как подружить Bitwarden CLI с пайплайном деплоя

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.6K

Недавно впервые занялся деплоем своих проектов и столкнулся с привычной для новичка проблемой: как аккуратно подгружать секреты для бэкенда и фронтенда. На словах всё просто: подключи .env. На деле — копипаст, дублирование, отсутствие истории и точного контроля доступа.

Решение — Bitwarden Secrets Manager + CLI. Централизованно храним ключи, раздаём доступ выборочно и автоматически подтягиваем их при деплое. В статье покажу, как настроить всё с Docker, NestJS, Vite и Coolify, чтобы деплой стал безопасным и удобным.

Читать далее

Cloud4Y строит ЦОДы в МО: сводка новостей – Часть 7

Время на прочтение4 мин
Количество просмотров1.3K

Привет, Хабр!

Лето — не повод сбавлять обороты. Строительство ЦОДов в Марфино и Мытищах продолжается, и мы делимся с вами свежими новостями. Если вдруг пропустили предыдущие серии — ловите ссылки: раз, два, три, четыре, пять, шесть.

Читать далее

Автоматизация клиентского сервиса

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров401

Автоматизация обслуживания клиентов — важный фактор работы компании, помогающий отстроиться от конкурентов, повысить производительность труда, снизить затраты и удерживать лидерство на рынке в своей сфере.

В статье расскажем, что дает компании цифровизация услуг и какие для этого используются инструменты. Приведем примеры решений для автоматизации обслуживания клиентов.

Читать далее

Миграция программируемых логических контроллеров в непрерывном производстве: кейс и грабли

Время на прочтение8 мин
Количество просмотров5.7K

Кейс: замена иностранных ПЛК на заводе по производству непрерывного стекловолокна, сокращение простоев и внедрение мотивации персонала без остановки производства 

Замена иностранных ПЛК на отечественные: что пошло не так и как исправили 

В 2024 году выполнена замена 12-летних Schneider TSX на отечественные программируемые логические контроллеры (ПЛК) и SCADA-платформу — прямо на работающей линии непрерывного производства стекловолокна, где каждая остановка печи = потеря партии и дорогостоящий простой. В этом посте рассказываем, как за полгода ушли от сбоящих контроллеров к полностью отечественной архитектуре с Modbus-TCP, LD-кодом и отчётами, которые легли в основу механизма мотивации операторов. 

Структура 

Материал основан на практическом опыте инженеров, работавших над миграцией установки по получению непрерывного стекловолокна на отечественные ПЛК и SCADA. В статье описываются технические решения и сложности, с которыми столкнулись в процессе замены оборудования. Все цифры и схемы приведены для наглядности и воспроизводимости. 

Читать далее

Защищенный DECT-телефон Gigaset R700H PRO: безупречная работа в агрессивных средах

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров912

Влагозащищенный и пыленепроницаемый DECT-телефон Gigaset R700H PRO со степенью защиты IP65 — это надежное и многофункциональное устройство, которое стабильно работает под прямым потоком воды (под дождем), в условиях повышенной влажности или в пыльных производственных помещениях.

Читать далее

История о том, как я флешку по воздуху прокинул

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров16K

Знаете, этой статьи могло и не быть. Если бы не один случай, который меня так взбесил, что пришлось искать решение.

Какое решение?

Автомасштабируем узлы кластера Kubernetes. Часть 1

Время на прочтение10 мин
Количество просмотров2.5K

Автомасштабирование узлов кластера Kubernetes и горизонтальное масштабирование подов позволяют быстро расширить ресурсы при пиковых нагрузках. Но сложные приложения могут не нагружать поды или узлы максимально, но требовать дополнительных ресурсов, например, для параллельной обработки нескольких объектов в очереди. Триггером масштабирования кластера может быть не утилизация, а события от внешних систем — например, очереди сообщений Kafka, системы мониторинга Prometheus или от платформы CI/CD.

Всем привет! Меня зовут Илья Смирнов, я архитектор решений в Cloud.ru. Расскажу, как лучше справляться с пиковыми нагрузками, если вы развернули свое приложение в кластере Kubernetes. Вместе запустим такое демо-приложение и посмотрим, как с ним работают классические подходы автомасштабирования — в этой части, а затем попробуем масштабировать кластер по событиям с помощью KEDA (Kubernetes-based Event Driven Autoscaler) — в следующей. Не пропустите!

Читать далее

Как не потерять свои контейнеры у себя в инфраструктуре?

Время на прочтение10 мин
Количество просмотров1.5K

Проблемы больших инфраструктур и связанный с ними хаос не только не исчезли с распространением контейнеризации, но и приняли новые очертания. Многие платформы с открытым кодом поддерживают работу только с одним кластером, некоторые решения зависят от качества соединения между узлами и «не любят» потери соединения.

Опираясь на опыт других проектов, мы сформировали свое видение защиты мультикластерных инфраструктур и реализовали его в своем продукте для обеспечения безопасности контейнеризированной инфраструктуры. Как именно — читайте в этой статье.

Читать далее

Как выбрать VDS под задачи: 10 реальных сценариев и советы

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.8K

VDS/VPS берут в том случае, когда нужен контроль над сервером и гарантированные ресурсы. Но сценарии использования всегда различаются — кому-то нужен интернет-магазин, кому-то почтовый или игровой сервер, а кто-то вовсе хранит там архив с фото своего кота. Под катом я собрал типичные кейсы и советы о том, на что смотреть при выборе VDS под конкретные задачи. Приглашаю. 

Читать

Киберугрозы в первом полугодии 2025 года: анализ векторов атак на облачные и гибридные инфраструктуры

Время на прочтение11 мин
Количество просмотров1.7K

Привет, Хабр! Меня зовут Юрий Наместников, я руковожу Cloud Security Operations в Yandex Cloud, и сегодня мы поговорим о результатах анализа кибератак в первом полугодии 2025 года.

За первые шесть месяцев 2025 года мы зафиксировали более 25 тыс. попыток кибератак на облачные и гибридные инфраструктуры. В этом отчёте с результатами нашего исследования рассказываем об актуальных угрозах и тенденциях, которые видели как в собственном контуре, так и в целом у российских компаний в первом полугодии

Читать далее

60 бесплатных уроков сентября: от Golang и FastAPI до ML и Kubernetes

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров6.8K

Хотите прокачать навыки в Golang, понять, как работает FastAPI, освоить практики MLOps или разобраться с Terraform? В сентябре вас ждут 60 бесплатных уроков по разным ИТ-направлениям: программирование, архитектура, инфраструктура, безопасность, тестирование, ML, аналитика и управление.

Каждое занятие — это разбор реальных задач, практические советы от экспертов и возможность понять, куда развиваться дальше. Выбирайте интересную тему и присоединяйтесь.

Читать далее

Ближайшие события

Как приручить LLM: подбор инфраструктуры для инференса. Часть 1

Время на прочтение10 мин
Количество просмотров8.6K

Привет, Хабр! Меня зовут Антон, и сейчас я активно занимаюсь вопросами инфраструктуры для ML и AI. Когда клиент приходит с запросом в духе «Разверните мне Qwen», невольно задаешься вопросом: «А какая инфраструктура нужна для такой задачи?» Но если запрос становится более конкретным, например, «Разверните Qwen так, чтобы держать 10 RPS с задержкой до пяти секунд», то можно и вовсе растеряться. Как подобрать конфигурацию под такие требования?

В серии статей разберемся, как отвечать на такие вопросы. Рассмотрим, какие инструменты помогают быстро подобрать оптимальную инфраструктуру, как тестировать производительность инференса и автоматизировать процесс. Посмотрим, как пройти путь от ручных запусков примеров моделей до автоматизированного анализа работы фреймворков на GPU с подбором оптимальной конфигурации.

А еще в последнее время мне нравится тематика викингов и драконов (особенно та часть, которая связана с медовухой). Вместе мы напишем книгу по приручению самых разнообразных драконов или, как в простонародье, open source LLM. В ней рассмотрим разные типы драконов, какие «GPU-седла» подходят под каждого и какие инструменты использовать для приручения. Садитесь поудобнее, заваривайте что-нибудь крепкое и айда в уникальное путешествие на дракаре в волшебную долину драконов!

Читать далее

«Поехали!»: запускаем ракету оптовых продаж по советам тех, кто летал

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров324

Интегратор выгрузил B2B-платформу на боевой сервер, передал доступы, обучил команду — день X настал. Кажется, можно выдохнуть? На самом деле — нет. Запуск не означает завершение внедрения, он лишь открывает новый, не менее ответственный этап. Именно сейчас важно действовать так, чтобы сохранить нервы, удержать клиентов и команду, оправдать вложения и продолжить путь к полной автоматизации оптовых продаж.

В предыдущих материалах цикла я уже разбирал:

Читать далее

(x)RDP broker for Linux

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.8K

Как часто в своей работе вы задумываетесь о необходимости обеспечения удаленного доступа для пользователей? Как на счет 100% бесплатных решений?
Да, такое мы все любим, но уж очень невелик выбор подобных решений под Linux...

Читать далее

Foreman в изоляции: как мы построили отказоустойчивую и безопасную систему для массового деплоя ОС

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.6K

Делимся опытом трансформации нашей инфраструктуры: от децентрализованных экземпляров Foreman с публичными IP до защищённой, изолированной архитектуры с централизованным управлением через GitLab, повышенной безопасностью и легкой масштабируемостью.

Читать далее

Предиктивная аналитика в сфере эксплуатации и ремонта оборудования

Время на прочтение6 мин
Количество просмотров939

Сегодня хотим рассказать о том, как прогноз, основанный на качественной аналитике, помогает избегать лишних затрат на ремонт.

Каждому предприятию время от времени приходится останавливать свой производственный процесс для нужд технического обслуживания и ремонтов (ТОиР). Остановы можно разделить на два типа: плановые (регламентные) и внеплановые (аварийные). Очевидно, все стремятся минимизировать количество любых остановов производства, отдавая в случае чего предпочтение плановым (управляемым), попутно желая оптимизировать затраты на ТОиР в целом.

Читать далее

Как мы нашли уязвимость в Mailcow, или немного о безопасности в open source

Время на прочтение4 мин
Количество просмотров4.7K

У коммерческих решений есть очевидные плюсы: профессиональная поддержка, регулярные аудиты, соответствие стандартам и сертификация. Open source — бесплатен, гибок, позволяет глубоко кастомизировать систему под свои нужды и, как правило, поддерживается активным сообществом.

Но независимо от выбранного подхода нужно полагаться только на себя и самостоятельно проверять безопасность всех компонентов, которые вы внедряете в инфраструктуру. Даже если речь идет о популярном проекте с тысячами звезд на GitHub…

Привет, Хабр! Меня зовут Наташа Баранова, я специалист по анализу защищенности веб-приложений в Selectel. Сейчас расскажу, как мы нашли критическую уязвимость в одном из open source-проектов с 10 000 звезд.

Читать далее

Как и зачем мы в YADRO сделали свою MLOps-платформу

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров5.2K

В нашей компании есть много проектов, связанных с AI. Всем им нужны ресурсы для работы с моделями на GPU. «Хотим, чтобы только мы имели доступ к оборудованию», — это лишь одно из требований инженеров из AI-дивизиона, а еще нужно оптимизировать использование GPU-ресурсов, вести их учет и быстро подготавливать оборудование к передаче другой команде.

Привет, Хабр! Меня зовут Вадим Извеков, я руководитель группы сопровождения платформы машинного обучения в YADRO. Сегодня расскажу, почему мы решили создать свою MLOps-платформу, как она устроена и для чего используется. 

Читать далее

Вклад авторов