Обновить
256K+
4,67
Оценка работодателя
2 313,84
Рейтинг
72 777
Подписчики
Сначала показывать

Китайцы ответили на H200 — обзор Zhenwu M890 от Alibaba

Время на прочтение5 мин
Охват и читатели8K

20 мая на ежегодном Alibaba Cloud Summit T-Head полупроводниковое подразделение Alibaba представила новое поколение GPU — Zhenwu M890. Это ускоритель с 144 ГБ памяти HBM на борту и возможностью интерконнекта между устройствами до 800 ГБ/с. На основе этого устройства также была представлен суперсервер Panjiu AL128 — стойка из 128 ускорителей M890, объединенных собственным коммутатором ICN Switch 1.0.

Предложение уже доступно китайским корпоративным клиентам и поддерживает Qwen, DeepSeek и Kimi. Но что там с характеристиками? Разбираемся под катом.

Читать далее

Космическая линза помогла Уэббу увидеть древнейшую галактику Вселенной

Время на прочтение5 мин
Охват и читатели7K

Астрономы уже много лет пытаются заглянуть в эпоху, когда после Большого взрыва во Вселенной начали появляться первые галактики. Эти системы были небольшими, содержали совсем мало тяжелых элементов и светили гораздо слабее современных звездных скоплений. За миллиарды лет их свет сильно ослаб и сместился в инфракрасную область спектра, поэтому обнаружить такие объекты долгое время было крайне сложно. Даже самые совершенные телескопы не позволяли рассмотреть их достаточно подробно, и важная информация терялась на фоне слабого космического излучения.

Космический телескоп Джеймса Уэбба кардинально изменил положение дел, открыв настоящее окно в ту далекую эпоху. Особенно когда сама природа подкидывает эффект гравитационного линзирования, который собирает и усиливает слабые лучи от объектов, расположенных далеко за массивными скоплениями. Благодаря такому природному увеличителю удалось разглядеть одну из самых примитивных галактик по имени LAP1-B, возникшую всего через 800 миллионов лет после рождения Вселенной, и получить уникальные данные.

Читать далее

Облачная LLM на 16 ГБ VRAM — часть 2: LangGraph Server, LangSmith и SDK

Уровень сложностиСредний
Время на прочтение42 мин
Охват и читатели11K

Друзья, привет! Возвращаюсь с продолжением.

В первой части мы разобрались, как поднять локальную LLM и пробросить к ней внешний доступ. Но до настоящей интеграции в продукт так и не добрались — модель работает, а что с ней делать дальше, непонятно. Сегодня исправляем это.

Поговорим про графовую инфраструктуру на базе локальных моделей — и не только локальных. Любых, поддерживающих OpenAI-совместимый протокол.

А теперь вопрос: что, если вам достаточно хорошо научиться писать граф — и вокруг него автоматически поднимется REST API, появится интерфейс для тестирования, трейсинг и мониторинг?

Читать далее

Как бизнесу оценить готовность к аттестации по новому Приказу ФСТЭК № 117

Время на прочтение8 мин
Охват и читатели9.1K

Привет, Хабр! На связи Алёна, аналитик по информационной безопасности в Selectel. Не так давно вступил в силу новый Приказ ФСТЭК № 117.

Тогда сообщество оказалось в неожиданной ситуации. Новые требования уже действуют, но конкретные меры еще не описаны. И вот, наконец, 12 апреля ФСТЭК выпустил методические рекомендации.

Месяц дискутировали с коллегами, разбирались, что конкретно поменялось и как работать теперь. Делимся первым опытом применения изменившихся норм на практике. Разбираемся: кому предназначен новый документ и как именно подготовиться к аттестации.

Читать далее →

Как работают выделенные ядра в облачном сервере: от планировщика Linux до тестов производительности

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели10K

Привет, Хабр! Меня зовут Витя, я проектирую интерфейсы в Selectel. Недавно мы запустили новую функциональность — выделенные ядра для облачных серверов. Чтобы понять, как спроектировать интерфейс управления новой фичей, я решил погрузиться в матчасть: от работы планировщика Linux до архитектуры NUMA-нод.

В тексте разберем, чем физические ядра отличаются от vCPU, как Hyper-Threading влияет на производительность и почему «шумные соседи» — измеряемая потеря денег.

Читать далее

LLM-инференс на фотонах? Препарируем передовые технологии, представленные в апреле

Время на прочтение9 мин
Охват и читатели12K

Majestic Labs Prometheus, Kingston DC3000ME на 30,72 ТБ, TPU восьмого поколения от Google и не только... Как всегда, вендоры не дремлют и участвует в AI-гонке. И должен признать, иногда это приводит к появлению крайне неординарных решений на рынке.

Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В новом дайджесте собрал самые актуальные и передовые новинки в мире железа. Читайте, делитесь своим мнением — в общем, добро пожаловать под кат!

Читать далее

Как развернуть Mistral 7B на GPU-сервере через vLLM

Время на прочтение6 мин
Охват и читатели9.8K

Если бюджет и ресурсы ограничены, а развернуть self-hosted LLM нужно, присмотритесь к такой связке: Mistral-7B-Instruct-v0.3 + виртуальная машина с RTX A5000 24GB в облаке + vLLM. Да, это далеко не энтерпрайз-уровень, но для некоторых базовых сценариев результат работы будет очень даже хорошим.

Собственно, в этой статье мы развернем сервер с GPU, подготовим Python-окружение, установим vLLM, запустим модель, отправим тестовый запрос через API и посмотрим на базовые метрики, которые помогут оценить выбранную конфигурацию.

Читать далее

Сколько весит интернет: считаем массу данных и их хранилищ

Время на прочтение10 мин
Охват и читатели13K

Интернет — распределенная система, размер которой нельзя увидеть в окне «Свойства». Более того, ответ на вопрос «что считать интернетом?» существенно влияет на результат вычислений. Точных данных не найти, но отдельные исследования и статистика крупных интернет-ресурсов позволяют произвести примерные расчеты.

В этой статье вас ждет доступная в интернете информация об интернете, простые расчеты и, конечно же, статистика.

Читать далее

Цены на SSD в Японии взлетели втрое. Разбираемся, что происходит

Время на прочтение4 мин
Охват и читатели10K

Рынок всего на свете твердотельных накопителей в последнее время переживает серьезные встряски. Стремительный спрос со стороны крупных дата-центров заставил производителей перекраивать планы. Ну и чипы NAND, которые раньше спокойно шли в потребительские SSD, теперь в первую очередь уходят на серверные нужды. Все это привело к росту цен.

Но если во всем мире стоимость накопителей возросла на десятки процентов, то в Японии — на сотни. За считанные месяцы некоторые модели в местных магазинах выросли в цене настолько, что покупатели начали всерьез задумываться, стоит ли вообще брать накопитель сейчас или подождать, пока ситуация хоть немного стабилизируется. При этом в США и Европе аналогичные модели стоят куда меньше, в долларовом, конечно, эквиваленте. Что стряслось-то? 

Читать далее

Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X

Время на прочтение5 мин
Охват и читатели15K

На майском HPC User Forum в Остине AMD рассказали о MI430X — ускорителе серии MI400, который позиционируется как инструмент для научных вычислений. Пока индустрия увлечена инференсом и считает токены в секунду на FP4, AMD напомнила, что CFD-код (Computational Fluid Dynamics) не интересует, насколько быстро чип умножает восьмибитные числа.

Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этой статье мы мысленно «разберем» MI430X и обсудим, насколько новинка подходит для «ядерных расчетов» и машинного обучения. Подробности под катом!

Узнать подробности

Черную дыру фотографировали восемь телескопов. Фото собрал алгоритм

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели26K

10 апреля 2019 года человечеству показали оранжевый бублик. Журналисты назвали его «первой фотографией черной дыры». Через час картинка была у всех — мемы про глаз Саурона, шутки про пончик, антропоморфизация,  заголовки «ученые сфотографировали невидимое».

Проблема в том, что это не совсем фотография.Точнее сказать, это очень странная фотография: если бы вы использовали телескоп горизонта событий (англ. EHT — далее по тексту) «как камеру» и нажали кнопку, вы бы получили черный квадрат и никакого бублика. Потому что он делает измерения, из которых алгоритм уже собирает изображение…  которого нет.

Вот про этот алгоритм и про то, как 3,5 петабайта данных летели в Бостон самолетом, и пойдет речь.

Читать далее

Ask.com закрылся. Что это был за сервис? Вспоминаем 90-е

Время на прочтение6 мин
Охват и читатели13K

На главной странице Ask.com недавно появилось короткое уведомление: сервис официально прекратил работу 1 мая 2026 года. Компания-владелец решила закрыть проект и сосредоточиться на других направлениях бизнеса. Жаль, конечно, ведь этот портал — один из столпов современной глобальной сети.

Он появился, когда интернет только начинал входить в повседневную жизнь. Медленный модем, характерный звук соединения, страницы, которые открывались по несколько минут. Информации в сети было гораздо меньше, и каждая удачная находка воспринималась почти как маленькое открытие. Среди первых поисковых систем Ask Jeeves занимал особое место: вместо обычного списка ссылок он предлагал задавать вопросы естественным языком и пытался отвечать так, словно пользователю помогает вежливый дворецкий. Что ж, давайте вспомним, как все начиналось.

Читать далее

5 современных цифровых печатных машинок для тех, кто не хочет отвлекаться

Время на прочтение5 мин
Охват и читатели12K

В этой подборке — несколько устройств, созданных специально для работы с текстом. Все они устроены по-разному: одни используют E Ink-экраны, другие построены на Raspberry Pi, третьи позволяют подключить собственную клавиатуру. Но идея у них одна и та же: после включения пользователь сразу попадает в текстовый редактор и может сосредоточиться на работе. Что предлагает рынок? Оказывается, подобных моделей немало.

Читать далее

Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMax

Время на прочтение13 мин
Охват и читатели14K

Итак, вы внедрили ИИ в свой сервис и решили ехать в продакшен, где у вас много пользователей. Закономерно возникает вопрос — а на чем запустить инференс, чтобы и пользователи были довольны скоростью работы, и бизнес не разорился.

Привет! На связи Никита, системный архитектор в Selectel. Сегодня я проведу для вас небольшой эксперимент: возьму HGX™ B300 и разверну на нем DeepSeek, Qwen и MiniMax. Зачем? Чтобы протестировать систему на разных задачах, посмотреть получившиеся бенчмарки и сделать выводы о почти топовом серверном GPU от NVIDIA. Заодно кратко вспомним, что получилось, когда мы пытались запустить бюджетный инференс LLM только на CPU. Прошу под кат.

Читать далее →

Каталог преднастроенных моделей, VDS и другие обновления: дайджест Selectel за апрель

Время на прочтение6 мин
Охват и читатели10K

Этот дайджест получился объемным! В апреле команда Selectel презентовала Foundation Models Catalog, запустила VDS и Enterprise-grade ЦОД. И это лишь малая часть обновлений. Все подробности — ниже.

Читать далее

Разбираемся в многообразии видов тестирования

Время на прочтение10 мин
Охват и читатели13K

Когда начинаешь погружаться в тестирование, создается ощущение, что видов этого самого тестирования десятки, если не сотни, и все они постоянно используются в реальной работе. Из-за этого у многих возникает ложное ощущение, что для работы тестировщиком нужно разбираться во всех этих подходах и уметь применять каждый из них. Но более чем за шесть лет работы в тестировании я понял одну вещь: теория этой работы сильно отличается от практики.

Чаще всего используется ограниченный набор видов тестирования, которые закрывают большую часть задач. Причем это не абстрактные академические термины, а конкретные подходы и практики, с которыми вы сталкиваетесь почти каждый день.

В этой статье рассмотрим пять видов тестирования, которые применяются чаще всего. Заодно разберем, как они выглядят в реальной работе, когда используются и какие ошибки чаще всего с ними связаны.

Читать далее

Как я создавал платформу для внутренних торгов мебелью и почему для этого выбрал PocketBase + Nuxt 3

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели12K

Привет, Я Ваня Демидов, разработчик Selectel.

Осенью наша компания решила запустить платформу, на которой сотрудники могли бы купить ненужную офисную мебель. Например, ту, что перестала подходить к обновленному дизайну переговорок, кофе-пойнтов или рабочего спейса. В этой статье я расскажу, как создавал такую платформу и поделюсь опытом использования Nuxt3 и Pocketbase.

Читать далее

Зачем AMD это сделали? Instinct MI350P на 144 ГБ

Время на прочтение4 мин
Охват и читатели13K

Актуальное на сегодняшний день поколение серверных ускорителей AMD — это MI350X и MI355X на архитектуре CDNA 4. Это уже серьезные машины для обучения и инференса больших моделей — с соответствующей ценой и требованиями к электроснабжению и охлаждению.

Несколько дней назад AMD анонсировали GPU Instinct MI350P — первую с 2022 года PCIe-карту серии Instinct, которая устанавливается в любой сервер с поддержкой двухслотовых GPU с воздушным охлаждением. Удобно и универсально, новинку точно стоит рассмотреть подробнее.

Читать далее

U-2: история легендарного самолета, который четыре года был недосягаем

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели25K

1 мая 1960 года, 05:20 по московскому времени. С авиабазы в Пешаваре на северо-западе Пакистана поднимается в воздух странный самолет. Черный, длинный, с крыльями размахом 24 метра, как у планера, только с реактивным двигателем. На борту один человек, 30-летний американец Фрэнсис Гэри Пауэрс. Курс — на север, через Афганистан, через советскую границу, дальше над Байконуром, над ядерным комбинатом в Челябинске-65, над Свердловском, и на выходе через Мурманск в Норвегию. 6 000 км над страной, в которую его никто не приглашал.

Через три с половиной часа одна зенитная ракета С-75 собьет самолет, Пауэрса возьмут живым, а в обломках найдут камеру с фотографиями советских ядерных объектов, пистолет с глушителем и отравленную иглу, которой он не воспользуется.

Чтобы понять, почему все это случилось, нужно вернуться на шесть лет назад. В 1954, когда один инженер из Калифорнии предложил построить самолет и получил первый чек на $1,5 миллиона по почте на домашний адрес.

ding!

Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели12K

Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных.

И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

Читать далее
1
23 ...

Информация

Сайт
slc.tl
Дата регистрации
Дата основания
Численность
1 001–5 000 человек
Местоположение
Россия
Представитель
Александр Шилов