Все потоки

Облачные вычисления *

Концепция общего доступа к ресурсам

40

Рейтинг

СтатьиПостыНовостиАвторыКомпании

xenander 21 мая в 10:35

Устранить нельзя оставить — разбираем ситуацию с уязвимостями в российской виртуализации

18 мин

7.5K

Виртуализация * СофтОблачные вычисления *

Мнение

Привет, Хабр!

Уже больше 10 лет я работаю с виртуализацией, и за это время успел в разной степени потрогать самые разные платформы. Естественно, до 2022 года это была в большей степени VMware, а параллельно с ней и разный опенсорс, в последние же годы руки добрались и до некоторых наших платформ.

Вообще идея этой статьи у меня зародилась после первых волн санкций, но, видимо, тогда ее время еще не пришло — ничего было непонятно, но очень интересно.

Спустя 4 года российские платформы заметно подросли, обзавелись пользователями и вменяемыми кейсами. С другой стороны, сама по себе тема виртуализации успела обрасти определенным слоем маркетинга и разнообразными мифами.

Зачем я пишу эту статью?

Мне уже давно хочется разобраться, как сейчас обстоят дела с безопасностью виртуализации в разрезе наиболее используемых в РФ платформ — как отечественных, так и не очень. Наверное, в глубине души мне хочется как-то суммировать то, что я сам увидел и осмыслил за это время, и ответить на ряд вопросов — действительно ли так страшно оставаться на иностранных платформах, как об этом говорят, и как обстоят дела у российских вендоров.

Если эта статья кому-то поможет — буду очень рад.

Читать далее

+6

ngcloud 21 мая в 10:09

Компьютерное зрение: что получается, когда у вас не идеальная лаборатория, а дождь, снег и подвижный манипулятор

Простой

7 мин

7.4K

Блог компании NubesИскусственный интеллектОблачные вычисления * IT-инфраструктура * Облачные сервисы *

Кейс

В проектах с компьютерным зрением есть неприятная правда: почти все выглядит убедительно, пока не сталкивается с реальной площадкой. На слайдах обычно все просто: камера смотрит, модель распознает, система фиксирует событие. Но в жизни вместо эталонных датасетов появляются снег, дождь, блики, разные ракурсы, подвижные камеры, бюджетные ограничения и обычные промышленные условия, в которых надо получить результат.

Именно с такой задачей к команде разработчиков «Формат кода» пришел заказчик этого проекта. Причем сразу с несколькими сценариями, связанными с компьютерным зрением.

Облако Nubes в этой истории стало средой для тяжелой инженерной работы: хранения видеоданных, подготовки датасетов, предобработки, обучения моделей, оценки метрик и повторных циклов дообучения. Подробнее рассказали в статье.

Читать далее

-1

skovalev 18 мая в 15:57

Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X

5 мин

15K

Блог компании SelectelСерверная оптимизация * Машинное обучение * ВидеокартыОблачные вычисления *

Мнение

На майском HPC User Forum в Остине AMD рассказали о MI430X — ускорителе серии MI400, который позиционируется как инструмент для научных вычислений. Пока индустрия увлечена инференсом и считает токены в секунду на FP4, AMD напомнила, что CFD-код (Computational Fluid Dynamics) не интересует, насколько быстро чип умножает восьмибитные числа.

Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этой статье мы мысленно «разберем» MI430X и обсудим, насколько новинка подходит для «ядерных расчетов» и машинного обучения. Подробности под катом!

Узнать подробности

+40

Qwertcoser 15 мая в 12:57

Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Средний

5 мин

8.9K

Машинное обучение * Алгоритмы * Высоконагруженные системы * Облачные вычисления * Big Data *

Обзор

Recovery Mode

Перевод

Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-значений, буферы). Для полного обучения той же модели нужно уже 84–128 ГБ памяти. Даже с такими методами, как checkpointing активаций или offloading на CPU, требования остаются высокими, особенно для моделей с 70 миллиардами параметров.

Квантизация помогает снизить требования к памяти, уменьшая точность представления весов модели без значительной потери качества. В этой статье разберём основные форматы числовой точности, используемые в квантизации LLM, их особенности и ограничения. Также рассмотрим NF4 — ключевую инновацию из статьи про QLoRA, и разберём, зачем нужны такие методы, как блочная квантизация, двойная квантизация и квантизация по квантилям.

Читать далее

+7

vazhendima 15 мая в 11:12

Мультитенантность в FinOps: Проектируем ядро системы учета расходов

Средний

7 мин

2.4K

Блог компании ИнферитDevOps * Облачные сервисы * Облачные вычисления * Анализ и проектирование систем *

Обзор

«Кто виноват и что делать?» — эти два вопроса, которые классики русской литературы адресовали обществу, сегодня как никогда актуальны для IT‑директоров и финансовых руководителей. Только «виноват» не конкретный человек, а не оптимально работающая инфраструктура, а ответ на вопрос «что делать?» — внедрять FinOps.

FinOps — это не технология, а организационная методика. Важная часть инструментария для FinOps это правильно построенная информационная система, которая собирает, хранит и дает анализировать данные о расходах и нагрузке. В этой статье мы разберем архитектурное ядро такой системы.

Читать далее

+3

gigaparsec 14 мая в 11:29

Как построить и проверить катастрофоустойчивость в облаке: от плана до Game Day

Средний

17 мин

9.1K

Блог компании VK TechБлог компании VKIT-инфраструктура * Системное администрирование * Облачные вычисления *

Довольно много компаний при работе в облаке выстраивают катастрофоустойчивость, ориентируясь на условные «лучшие практики»: составляют планы, предусматривают резервные площадки, настраивают репликацию. Вместе с тем во время реальных инцидентов многие сталкиваются с тем, что все предусмотренное не работает или работает не так, как ожидалось: восстановление занимает часы вместо минут, данные теряются в критическом для бизнеса объеме, а команды оказываются не готовы к действиям в условиях стресса.

Причина часто кроется в том, что меры обеспечения катастрофоустойчивости либо обеспечиваются формально («чтобы было»), либо проектируются без учета полного цикла рисков — от технических ограничений до организационной готовности.

В статье разберем, как проектировать решения, которые переживают не отдельные сбои, а крупные аварии.

Читать далее

+38

ZabLen 14 мая в 07:40

Препарируем графическую подсистему Windows. Протокол SPICE в современном графическом стеке, часть 2

Сложный

20 мин

6.6K

Виртуализация * Системное программирование * Облачные вычисления * 3D-графика *

Обзор

Мы продолжаем увлекательное путешествие по миру удалённого доступа. В предыдущей части заглядывали под капот протокола доставки рабочего стола SPICE, а сейчас на операционный стол попала великая и ужасная ОС Windows - точнее, её графическая подсистема. Заглянем в её недры и окунёмся в её философию и историю развития. И заодно найдём интересные параллели в Linux.

Это вторая часть цикла про протокол SPICE и то, как он вынужден работать в современных условиях. Наша конечная цель - создать пилот стримингового агента для виртуальной машины на ОС Windows.

Приглашаю под кат всех, кто работает или сталкивается с системами виртуализации, с протоколом SPICE, с виртуальными машинами в принципе; кто интересуется такими темами как удалённый доступ и компьютерная графика; да и вообще всех любознательных!

В бездну виндового угнетения

+8

ZabLen 12 мая в 07:30

Изнанка Remote Desktop. Протокол SPICE в современном графическом стеке, часть 1

Сложный

24 мин

7.3K

Виртуализация * Системное программирование * Облачные вычисления * 3D-графика *

Обзор

Вы когда‑нибудь пользовались виртуальной машиной в Linux? Весьма вероятно, что это был QEMU/KVM + SPICE.

Виртуальные машины на spice://localhost:5900 работают достаточно бодро, тогда как подключение по сети может вызвать самые разные эмоции. Причиной тому является специфическая архитектура, которая идёт вразрез с современными диспетчерами среды рабочего стола. И вялая поддержка протокола open‑source сообществом.

Но нас, безбашенных русских инженеров, это нисколько не останавливает! Открываю цикл статей, где мы заглянем внутрь протокола SPICE и графической подсистемы Windows, чтобы провести увлекательный экскурс и разобраться в деталях. После чего создадим пилот нового решения — стриминговый агент для виртуальной машины на ОС Windows.

В первой части мы возьмёмся за сам протокол и увидим, почему SPICE ориентирован на Windows (да, я не шучу). В следующих частях пойдём разбираться в богатствах Windows и в возможностях для нас ~~присосаться~~ подключиться через системное API к потоку фреймов.

Приглашаю под кат всех, кто работает или сталкивается с системами виртуализации, с протоколом SPICE, с виртуальными машинами в принципе; кто интересуется такими темами как удалённый доступ и компьютерная графика; да и вообще всех любознательных.

Поехали!

+6

Matve_Agafonov 10 мая в 14:16

apache iceberg и его философия

Простой

9 мин

9.1K

Big Data * Data Engineering * Хранение данных * Облачные вычисления * Базы данных *

Мнение

Из песочницы

iceberg и его философия metadata расскажем почему iceberg эффективно выполняет запросы и прост в управлении данными благодаря своей metadata

Читать далее

+3

Cloud4Y 7 мая в 13:04

Cloud4Y строит ЦОДы в МО. Часть 15

4 мин

8K

Блог компании Cloud4YIT-инфраструктура * Серверное администрирование * Облачные сервисы * Облачные вычисления *

Контейнерный ЦОД в Марфино пережил первые реальные аварийные отключения, принял первых гостей и обзавёлся соседями — тремя дизельными электростанциями и двумя газопоршневыми установками. Рассказываем, как прошёл апрель.

Читать далее

0

petrovcargoex 4 мая в 13:54

База FinOps: Почему счет за облако каждый месяц растет и что с этим делать

Простой

11 мин

9.3K

Блог компании Практики FinOpsОблачные вычисления * Облачные сервисы * IT-инфраструктура * IT-стандарты *

Обзор

Модель pay-as-you-go, которую предлагают в облаке, всегда была палкой о двух концах. С одной стороны, история вроде честнее некуда: платишь ровно за то, что заказал. Как в ресторане. Но, с другой, именно она практике нередко приводит к такому перерасходу, что поневоле начинаешь задумываться, а нужно ли нам вообще это облако?

На самом деле чудес не бывает, и я намеренно перевел pay-as-you-go как “платишь за то, что заказал”. Внимание: заказал, а не потребил. Потому что в этом и заключается первая проблема – нет, не облаков, – а тех, кто их использует. Компании регулярно выходят за рамки бюджетов, потому что платят за ресурсы, которыми де-факто не пользуются. Тут и забытые тестовые стенды, и старые проекты, которые продолжают генерировать счета, и простаивающие виртуальные машины с запасом по мощности, и чего только не. В результате до 30% облачного бюджета просто улетает впустую. А у некоторых и того больше.

Плюс – усложнение архитектуры как таковой. Если раньше одно приложение работало на одном сервере, то теперь они состоят из десятков разных микросервисов, и каждому нужна своя база, свой кэш, своя очередь. А ведь еще есть тестовое окружение, staging, CI/CD и много других английских слов. И за все надо платить. Да, по отдельности вроде копейки. Но когда таких сервисов 100 или 200, сумма выходит приличная. Добавим сюда накладные расходы и получим еще минимум 15-25% к счету. А хотелось бы эти деньги оставить у себя в кармане. О том, как это сделать, сегодня и поговорим.

Читать далее

+5

Coder89 1 мая в 18:58

Сколько на самом деле стоит GenAI в продакшене

Простой

8 мин

12K

Искусственный интеллектОблачные вычисления * Облачные сервисы *

Мнение

Когда обсуждают стоимость внедрения генеративного ИИ, разговор часто сводится к цене за токен или цене за арендуемый GPU. Это удобно — одно число. Но в реальном продакшене такая оценка почти всегда обманчива.

Стоимость GenAI-системы — это не только сколько стоит вызвать модель. Это инфраструктура, эксплуатация, безопасность, наблюдаемость, разработка, интеграции, поддержка пользователей и постоянные изменения вокруг моделей. Именно поэтому «мы поднимем open-source модель сами, будет дешевле» часто оказывается правдой только на первом слайде презентации.

Читать далее

+3

SLY_G 1 мая в 09:13

Центры обработки данных в космосе — это ужасная, кошмарная и совершенно бесполезная идея

Простой

9 мин

23K

Научно-популярноеКосмонавтикаИскусственный интеллектОблачные вычисления * Серверная оптимизация *

Перевод

Для ясности: я бывший инженер и учёный НАСА с докторской степенью в области космической электроники. Я также проработал в Google 10 лет в различных подразделениях компании, включая YouTube и тот отдел облачных технологий, который отвечал за развёртывание ИИ-ресурсов, поэтому я вполне компетентен высказать своё мнение по этому вопросу.

Краткая версия статьи: это абсолютно ужасная идея, которая действительно не имеет никакого смысла. Для этого есть множество причин, но все они сводятся к тому, что электроника, необходимая для работы центра обработки данных, особенно развёртывающего ИИ-ресурсы на основе графических процессоров (GPU) и тензорных процессоров (TPU), является полной противоположностью тому, что работает в космосе. Если вы раньше не работали конкретно в этой области, я бы предостёрег вас от поспешных выводов, потому что реальность обеспечения функционирования космического оборудования в космосе не всегда интуитивно очевидна.

Читать далее

+110

Ferraro 30 апр в 15:52

Хостинг сервера в Google Colab без ngrok и cloudflared

Простой

2 мин

7.1K

Облачные вычисления *

Туториал

Разбираемся, как использовать встроенный механизм Google Colab для хостинга сервера без ngrok и cloudflared — и как достучаться до него через requests с помощью токена аутентификации.

Читать далее

+1

Cloud4Y 22 апр в 14:38

Сравнение GPU NVIDIA: от V100 до B300

6 мин

8.6K

Блог компании Cloud4YВидеокартыIT-инфраструктура * Облачные сервисы * Облачные вычисления *

Перевод

Одна ошибка в выборе GPU может стоить двукратной переплаты за каждую задачу — каждый день, пока вы не смените карту. Десять моделей NVIDIA, пять архитектур, разброс памяти от 24 до 288 ГБ. Разбираем, какая карта для чего создана и где рубль работает эффективнее всего.

Читать далее

+3

max_el777 22 апр в 11:54

Теги и аллокация не работают: почему мы до сих пор не знаем, кто за что платит

Средний

6 мин

7.2K

Блог компании Практики FinOpsОблачные сервисы * IT-инфраструктура * Облачные вычисления * IT-стандарты *

Обзор

Мы десятилетиями строим IT-системы, но до сих пор не можем ответить на элементарный вопрос: кто за что платит? Теги есть, аллокация настроена, но в отчетах — хаос. Затраты разбросаны по разным системам (биллинг облака, CMDB, Excel-таблицы у финансистов), и все это приходится собирать вручную перед каждым советом директоров.

В этой статье мы разберем почему классические подходы к распределению затрат дают сбой, и предложим практическую дорожную карту перехода от «гаданий на кофейной гуще» к прозрачной системе учета.

Читать далее

+5

vazhendima 20 апр в 18:37

ELT против ETL в FinOps: Почему мы сначала кладем сырые данные, а потом думаем

Средний

5 мин

7.8K

Блог компании ИнферитОблачные вычисления * Облачные сервисы * DevOps * Анализ и проектирование систем *

Обзор

«Фарш невозможно прокрутить назад» — этой поговоркой инженеры данных могли бы объяснить, как работает классический ETL. Ошибка может случиться на любом этапе: не тот коэффициент применили, не ту валюту подставили, забыли про скидку. Но после того как исходные данные трансформированы и отчет сформирован, но иногда бывают такие ситуации, когда вернуться к первоисточнику по какой-то причину уже нельзя.

В FinOps эта ситуация — не метафора, а суровая реальность. Данные от облачных провайдеров доступны лишь в ограниченном окне (30–90 дней), а иногда и меньше. Если вы сначала обработали их, а потом поняли, что ошиблись, может так случиться, что перезапросить исходники уже не получится.

В этой статье мы разберем два подхода к построению процессов обработки и преобразования данных — ETL и ELT — и докажем, почему для FinOps выбор ELT — это не просто вопрос производительности, а вопрос выживания исторических данных.

Читать далее

+8

atomicra 17 апр в 21:04

Бенчмарк аналитикой SCAD++, Lira и ammonit3d. Тест на точность с одним конечным элементом

Средний

3 мин

7.3K

3D-графика * Инженерные системы * Научно-популярноеОблачные вычисления * Промышленное программирование *

Обзор

В предыдущей статье "Облако своими руками для расчета пространственных стержней методом конечных элементов на Node js, React js и Three js" представлен краткий обзор облачного SPA приложения ammonit3d по моделированию пространственных стержневых систем (ферм, балок, рамных и связевых конструкций, опор ЛЭП) методом конечных элементов с численно-аналитическим решением для каждого конечного элемента, в основе которого математическая модель Эйлера-Бернулли - механическая модель упругой балки или стержня длиной L с заданной изгибной жёсткостью EJ на которую действуют сосредоточенная сила F или момент M, а также распределённая сила q(x) или момент m(x) по длине стержня, продольная ось которого x1, вертикальная x2 проходит через начало стержня и x3 направлена на нас из точки пересечения x1, x2. Полагая сечения плоскими до и после изгиба при одноосном деформированном состоянии в рамках краевой задачи линейной теории упругости, уравнение упругой оси стержня можно представить в виде обыкновенного неоднородного дифференциального уравнения 4-го порядка:

Читать далее

0

Xronofag 17 апр в 18:33

Compute crunch пришёл: как считать экономику LLM в 2026

Средний

9 мин

8.7K

Анализ и проектирование систем * Бизнес-модели * Искусственный интеллектОблачные вычисления *

Кейс

Два крупнейших API-провайдера одновременно сменили риторику. Anthropic ввёл usage-based billing для агентных фреймворков — плата за токены вместо фиксированных подписок. Часть сторонних обёрток потеряла возможность работать через flat-rate тарифы. OpenAI параллельно ввёл гибкое корпоративное ценообразование для Enterprise, Business и EDU-планов — стоимость подписки теперь масштабируется с объёмом потребления, а не фиксируется на уровне seat.

Тренд последних двух лет («API дешевеет каждый квартал») не отменился, но получил важную оговорку. Цена за токен в прайсах действительно падала: за 2023–2025 годы стоимость миллиона токенов GPT-4-класса снижалась, но в 2026 году ключевой метрикой для бюджета становится не цена за токен, а стоимость решения задачи.

Читать далее

+7

runity 17 апр в 15:05

Дружим стратегически: как прошел Демо день Рег.облака

Простой

7 мин

5.5K

Блог компании РунитиОблачные вычисления * Облачные сервисы * Разработка публичных облаков * Искусственный интеллект

Репортаж

Привет, Хабр! На связи команда Рег.облака. 16 апреля мы провели свой Демо день — продуктовую конференцию для тех, кто строит IT-инфраструктуру и хочет делать это без лишних расходов. Два параллельных трека, панельная дискуссия про ИИ с «ВкусВиллом», банком «Синара», Raft и РБК, а вечером — нетворкинг с живой музыкой в Центре событий РБК. Для тех, кто пропустил, рассказываем, что обсуждали и к чему пришли.

Читать далее

+4

1

2 3 ...