Обновить
1024K+

Облачные сервисы *

SaaS, облака и как в них живётся данным

321,58
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как мы построили корпоративного RAG-ассистента: от личного стартапа до внутреннего продукта

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели3.3K

Привет, Хабр! На связи команда Рунити под руководством Антона Ивахненко: Дмитрий Виноградов, руководитель направления разработки, менеджер продукта Карина Калеева, ML-инженер Александр Михеев и тех.лид Владимир Устьянцев. 

В этой статье мы рассказываем про RAG-ассистента, который скоро у нас появится. Этот ассистент ищет по Confluence и GitLab одновременно, уважает права доступа и не отправляет корпоративные данные наружу. Но обо всём по порядку. 

Читать далее

Новости

StarRocks в облаке Selectel. Проверяем, как аналитическая СУБД ведет себя под нагрузкой

Время на прочтение15 мин
Охват и читатели3.8K

Идея развернуть аналитическую базу данных в облаке часто выглядит привлекательно — до того момента, пока администратор не начинает прикидывать реальную нагрузку в продакшене, а бизнес — итоговую стоимость. Именно здесь у многих появляются сомнения, и выбор все чаще смещается в сторону более осязаемых решений — например, выделенной инфраструктуры, где проще заранее оценить пределы производительности и стоимости.

Я Антон Стеблянко, архитектор больших данных. В статье расскажу, как совместно с командой из компании «СР-ТЕХ» протестировали в облаке Selectel российский форк СУБД StarRocks Pro и проверили, насколько система подходит в качестве основы для построения аналитического хранилища данных.

Читать далее

6 часов писать паттерны вручную vs 1 минута с AI-агентом: как мы автоматизировали DSL

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6K

Привет, Хабр! На связи Лиза Плюснина — лингвист-разработчик чат-ботов. Я работаю с платформой JAICP — одним из продуктов Just AI для создания голосовых и текстовых ботов. Мы с командой регулярно сталкиваемся с необходимостью написания и тестирования паттернов на специфичном языке JAICP DSL — процесс регулярный, довольно монотонный и отнимает много времени.

Когда в компании проходило обучение по AI-агентам, мы воспользовались моментом и решили: хватит это терпеть, пора автоматизировать!

Так родилась идея создать AI-агента, который бы взял на себя написание паттернов и автотестов к ним. Рассказываем, как мы это сделали, с какими трудностями столкнулись и что из этого вышло.

Читать далее

Как считать стоимость CPU, RAM и Storage во внутренней инфраструктуре (часть 2 из 5)

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели4.6K

Меня зовут Дмитрий, я руковожу отделом ИТ-инфраструктуры и сервисов в Ви.Tech, IT-дочке ВсеИнструменты.ру. Когда у компании одновременно есть свои датацентры, частное облако и несколько публичных облаков, вопрос стоимости вычислительных ресурсов быстро перестает быть бухгалтерской формальностью. Без понятной модели невозможно нормально распределять затраты, сравнивать варианты размещения и объяснять, почему одна и та же виртуальная машина в разных контурах обходится по-разному.

В этом материале я разберу, из чего складывается стоимость единицы вычислительного ресурса в гибридной инфраструктуре и как подойти к расчету так, чтобы потом использовать эти цифры в аллокации затрат, бюджетировании и планировании.

С оборудованием, которое закупается под конкретный проект, все обычно довольно прозрачно: его стоимость можно сразу отнести на конкретного внутреннего заказчика. С публичными облаками тоже все относительно просто: цену задает провайдер, а наша задача сводится к корректному учету потребления и распределению расходов.

Сложнее всего обстоит дело с частной виртуализацией. Здесь цена ресурса не лежит на поверхности, ее приходится собирать из стоимости железа, запаса под отказоустойчивость, коэффициентов переподписки и сопутствующей инфраструктуры.

Поэтому дальше я сосредоточусь именно на частных системах виртуализации и на простом примере покажу, как посчитать стоимость 1 ядра CPU и 1 GB RAM.

Для простоты будем считать, что кластер виртуализации состоит из однотипных серверов. Допустим, в каждом сервере установлены 2 CPU по 64 ядра и 1024 GB RAM. Тогда стоимость сервера складывается из стоимости памяти, стоимости процессоров и стоимости платформы, куда входит все остальное: сетевые карты, материнская плата, корпус, блоки питания и прочие компоненты.

Читать далее

Практика FinOps и ITFM: как считать, распределять и планировать ИТ-расходы (часть 1 из 5)

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели2.5K

Меня зовут Дмитрий, я руковожу отделом ИТ-инфраструктуры и сервисов в Ви.Tech, IT-дочке ВсеИнструменты.ру. Когда в компании одновременно есть локальная инфраструктура, облако, общие платформенные сервисы и выделенные ресурсы под продукты, считать ИТ-расходы "в среднем по больнице" уже не получается. Мы пришли к модели, в которой у каждого ресурса есть понятные метки, владелец и правило аллокации. В этой части разберу, с чего такая модель вообще начинается.

Нам была нужна не красивая финансовая схема, а рабочий способ ответить на простые вопросы: кто потребляет ресурсы, кто за них платит и как эти затраты потом распределять внутри компании. Без этого невозможно нормально считать стоимость сервисов, обсуждать экономику инфраструктуры и планировать развитие не по ощущениям, а по цифрам.

FinOps и ITFM в этой логике не спорят друг с другом, а закрывают разные части одной задачи. FinOps помогает навести порядок в потреблении и расходах, особенно в облаке. ITFM дает более широкую рамку: как связать ресурсы, бюджеты, внутренние сервисы и центры ответственности.

Дальше разберем основу такой модели: какие типы затрат нужно разделять, чем выделенные ресурсы отличаются от общих и какие атрибуты стоит заложить сразу, чтобы потом не переделывать учет на ходу.

Читать далее

Какие заблуждения у вас есть об AWS

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6K

В AWS здорово то, что этой платформе уже почти двадцать лет. Печально в AWS то… что ей уже почти двадцать лет. Если вы уже долгое время пользуетесь ею, то вам может быть сложно заметить тем изменений её «фундаментальных» сервисов. Хуже того: даже если вы относительный новичок в AWS, вам всё равно довольно легко найти устаревшие посты, объясняющие всё так, как было раньше, но не сейчас. В своей статье я перечислю часть примеров такой эволюции, которые помогут вам, если вы запутаетесь.

Читать далее

От события до дашборда в облаках: практика по созданию потоковой платформы на Kubernetes

Уровень сложностиПростой
Время на прочтение48 мин
Охват и читатели5.6K

С задачей построения платформы для потоковой обработки данных по тем или иным причинам сталкиваются многие компании. И довольно часто подобная разработка превращается в попытку «создать ракету», не понимая сути происходящего под капотом. При этом для решения подобной задачи достаточно иметь набор инструментов и знать принципы их настройки на каждом из этапов.

Меня зовут Сергей Емельянов. Я руководитель Core-команды VK Tech. В этой статье я пошагово покажу процесс построения синтетической платформы для обработки потоковых данных на Kubernetes.

Читать далее

Как мы построили отказоустойчивое облако для 1С: от локальных серверов к надежному резерву в ЦОД

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.3K

В крупных компаниях (да и в небольших, если уже совсем откровенно) остановка работы 1С — это не просто технический сбой. Это замороженные процессы, потерянные операции и упущенная выгода. Риск остановки 1С сильно повышается, если вся инфраструктура размещается исключительно на локальных серверах, которые в любой момент могут выйти из строя или потребовать планового обслуживания. Именно с такой ситуацией столкнулся один из наших клиентов, и в этой статье мы расскажем, как создали для него полноценное резервное облако, обеспечив непрерывность работы и защиту данных.

Читать далее

DataOps + FinOps: как хранить и обрабатывать данные, не переплачивая

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели5.1K

Когда счет за облако приходит в конце месяца, а финдир молча передает вам распечатку с суммой на 40% больше прошлого месяца, это верный признак того, что проблемы начались и сами собой не решатся. Не будет такого, что сегодня перерасход есть, а завтра все вдруг придет в норму. Не придет. Данных со временем становится больше, пайплайны запускаются чаще, хранилище разрастается, а понимания куда уходят деньги из ниоткуда не появляется. И, чтобы навести порядок, используют практики DataOps и FinOps.

DataOps выстраивает процессы работы с данными между командами: автоматизацию пайплайнов, контроль качества, управление изменениями и единые правила работы с данными на всех этапах обработки. FinOps делает стоимость инфраструктуры прозрачной для инженерных команд и позволяет понимать, сколько стоят архитектурные и технические решения. Когда данные о потреблении и стоимости становятся видны, появляется возможность управлять расходами и принимать обоснованные решения по инфраструктуре.

Читать далее

Переписать нельзя оставить: как мы…

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели5.1K

Привет, Хабр! 

Меня зовут Алексей Кирдяшкин, я занимаюсь инфраструктурной разработкой в Timeweb Cloud.

У нас есть сервис App Platform (раньше он назывался Apps). Если коротко, это управляемая платформа поверх VDS для деплоя приложений напрямую из Git, без ручной настройки серверов и танцев с бубном. 

Я застал App Platform еще в виде MVP, участвовал в его адаптации под инфраструктуру, работал над архитектурой — по сути, провел сервис от первого прототипа до продакшена с реальной нагрузкой. Конечно, все работало — приложения деплоились, пользователи приходили, платформа росла. Но с ростом стали заметны архитектурные решения, которые были оправданы для MVP, но плохо подходили для большого сервиса. 

Поэтому мы взяли и… полностью пересобрали уже работающий сервис с нуля. Как, зачем и почему — в этой статье. 

Читать далее

Бережливое производство на складе: почему успешное внедрение WMS начинается с Lean‑аудита, а не с закупки серверов

Время на прочтение20 мин
Охват и читатели3.5K

Привет, Хабр! На связи INTEKEY — системный интегратор в складской логистике. Мы разрабатываем и внедряем WMS, но парадокс нашей работы в том, что успешная автоматизация склада почти всегда начинается не с софта, а с разбора физических процессов.

Часто компании решают, что проблему очередей, пересорта и сорванных окон отгрузки «закроет» новая программа. Закупаются серверы, терминалы сбора данных, планируются сложные интеграции. Но уже на этапе запуска выясняется: у складских операций нет единого стандарта, приоритеты раздаются в ручном режиме, а статусы в системах не отражают реальность.

В итоге дорогая WMS начинает обслуживать неустойчивый процесс, и часть проблем переезжает в цифровой контур. Появляются ручные обходы, «костыли» в архитектуре, падение доверия к данным, и те проблемы, ради которых затевался ИТ-проект, остаются с вами — только уже в оцифрованном виде.

Чтобы система реально поддерживала процесс, а не пыталась залатать его дыры, мы всегда используем логику: сначала аудит и выравнивание процессов, и только затем — «прошивка» правил в цифровом контуре. И здесь на первый план выходит бережливое производство (Lean).

Сразу оговоримся: внедрение бережливого производства на складе — это не разовая инициатива, не просто наведение порядка по системе 5S и не мотивационная “кайдзен-доска”. Это жесткий, измеримый подход к управлению складским потоком, нацеленный на поиск узких мест и устранение потерь.

В этом подробном экспертном гайде мы без «воды» разберем, как принципы Lean работают в складской логистике. Мы подготовили практическую модель, с которой можно начать реальные улучшения прямо сейчас.

Читать далее

Как A2A‑протокол обеспечивает оркестрацию ИИ‑агентов

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели7.7K

Мир AI-разработки стремительно движется от парадигмы «один модельный вызов — один ответ» к системам, в которых множество специализированных агентов решают сложные задачи совместно. Представьте себе оркестр, где каждый музыкант — это отдельный AI-агент со своей специализацией: один анализирует данные, другой генерирует код, третий проверяет результаты. Такие мультиагентные системы позволяют декомпозировать и задачу ускорять выполнение за счёт параллельной работы. Крупнейшие игроки — Google, Microsoft, IBM — уже делают ставку на эту парадигму как на фундамент приложений следующего поколения.

Однако путь от прототипа к работающему продукту усеян типичными провалами. На Reddit (MachineLearning) или Хабр разработчики часть жалуются: «Агенты теряют контекст при передаче задач», «Они зациклились в бесконечных дебатах, сожгли весь бюджет на токены, а результата нуль». Анализ таких кейсов показывает: дело не в «глупости» LLM или неудачных промптах. Корень зла почти всегда лежит в отсутствии грамотной оркестрации.

В этой статье я подробно разберу тему оркестрации AI-агентов с использованием протокола A2A, а также его эффективное расширение за счет AGP, чтобы показать, как эти инструменты упрощают сложные мультиагентные системы.

Читать далее

Эффективный мониторинг облачных решений: переходим к очередям и клиент-серверному взаимодействию

Время на прочтение15 мин
Охват и читатели6.2K

Привет! На связи команда Yandex Monium, это вторая часть серии про эффективный мониторинг. Исторически Monium был разработан командой Yandex Infrastructure как внутренняя observability‑платформа и использовался для мониторинга критических сервисов внутри Яндекса. В прошлый раз мы рассказали о том, что важно знать про мониторинг в целом, а также рассмотрели подробнее асинхронные задачи. На примере кейса с таинственным зависанием задач мы увидели, как с помощью метрик можно определить не очевидную проблему, вызванную скрытым багом. 

Но вполне возможно, что у вас всё взаимодействие происходит через очереди, а не через асинхронные задачи. Далее в этой статье:

— В первой части разберём кейсы на примере in‑memory‑очереди. Это также применимо для различных типов очередей, в том числе для Apache Kafka. 

— Во второй части перейдём к клиент‑серверному взаимодействию.

Читать далее

Ближайшие события

Почему я перестал держать БД в голове и сделал Structly

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K

Привет, меня зовут Константин, я backend-разработчик. В свободное время делаю продукты в Elevo.

При разработке сервисов база данных быстро перестаёт быть «просто таблицами» - это десятки сущностей, связи, схемы и данные, от которых зависит логика всего продукта. И всё это нужно держать в голове.

Проблема в том, что контекст не держится вечно. Переключился на другой проект, сделал паузу - и начинаешь терять детали. Возвращаешься и тратишь время на то, чтобы заново понять собственную же архитектуру.

Так появился Structly - простой инструмент, который позволяет видеть структуру базы прямо перед глазами и не терять контекст.

Читать далее

Новый ЦОД Рег.облака в Москве и зачем там GPU

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.2K

Привет, Хабр! На связи Илья Мартысь из Рег.облака. Сегодня расскажу, как мы переезжали в новый московский дата-центр, почему именно DataHouse «Магистральный-1» и при чем здесь серверы с NVIDIA H200.

Читать далее

Как раздать десятки публичных IP сотням виртуальных машин и не упасть

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели8.4K

Недавно в MWS Cloud Platform появилась поддержка Egress NAT. В статье разберём архитектуру распределённой системы трансляции адресов, почему мы выделяем порты блоками и как обеспечиваем корректную передачу обратного трафика в условиях ECMP-маршрутизации. Плюс как это всё переживает рестарты, потерю событий и рассинхронизацию и всё равно сходится к правильному состоянию.

Читать далее

Сократили срок выхода задач в продакшен почти вдвое: что реально сработало

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели8K

Команда разработки может работать много и активно, но продукт все равно будет выходить медленно. Рассказываю на своем опыте, какие изменения в процессах помогли почти вдвое сократить срок выхода задач в продакшен и сделать релизы предсказуемыми.

Читать далее

OmniOS как основа «домашнего облака»

Время на прочтение9 мин
Охват и читатели12K

Где-то в конце лета 2025-ого я собирал NAS-сервер. Чисто для себя, под свои нужды и хотелки, и совершенно не планировал что-то публично описывать. Всю необходимую информацию искал через google, а тот раз-через-раз в результатах поиска подкидывал вот эту статью:

Хардкорный NAS: как собрать хранилище на OmniOS и не сойти с ума

Я долго проходил мимо этой ссылки, ибо сам заголовок вызывал массу вопросов, и почему-то казалось, что несогласие с автором заставит меня написать что-то в ответ. Так и получилось после прочтения. Я зачем-то зарегистрировался на Хабре и пишу эти буквы.

Читать далее

РКН и «сибирская блокировка»

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели117K

В конце ноября 2025г. у части интернет провайдеров в Сибирском и Дальневосточном округах появились проблемы с использованием TLS прокси. Блокировка появлялась после активации прокси для всей системы, но не при проксировании отдельных сайтов.

Читайте далее чтобы узнать что я обнаружил.

Читать далее

Облачные модели Ollama в задачах code review — честное сравнение на примерах

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели14K

AI всё чаще используется в разработке: генерация кода, автодополнение, агентные IDE. Но возникает логичный вопрос - можно ли доверить LLM полноценный code review?

В этой статье я решил проверить это на практике. Я сравнил несколько моделей, доступных через Ollama Cloud - Qwen 3.5, GPT-OSS и DeepSeek v3.1 - и дал им проанализировать реальные Pull Request из легаси-проекта на Python.

Спойлер: некоторые модели показали неожиданно хороший результат.

Читать далее
1
23 ...