Все потоки

Машинное обучение *

Основа искусственного интеллекта

1 208,96

Рейтинг

СтатьиПостыНовостиАвторыКомпании

skovalev 21 мая в 11:31

LLM-инференс на фотонах? Препарируем передовые технологии, представленные в апреле

9 мин

12K

Блог компании SelectelКомпьютерное железоВидеокартыПроцессорыМашинное обучение *

Дайджест

Majestic Labs Prometheus, Kingston DC3000ME на 30,72 ТБ, TPU восьмого поколения от Google и не только... Как всегда, вендоры не дремлют и участвует в AI-гонке. И должен признать, иногда это приводит к появлению крайне неординарных решений на рынке.

Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В новом дайджесте собрал самые актуальные и передовые новинки в мире железа. Читайте, делитесь своим мнением — в общем, добро пожаловать под кат!

Читать далее

+28

kmoseenk 21 мая в 11:22

Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать

Средний

5 мин

8.4K

Блог компании OTUSИскусственный интеллектМашинное обучение *

Туториал

Перевод

Ошибка CUDA out of memory при обучении LLM обычно превращается в бесконечный цикл случайных правок: уменьшили batch size, урезали sequence length, снизили LoRA rank — и всё равно где-то снова падает. Особенно весело становится в RL-сценариях с GRPO, vLLM и генерацией нескольких ответов на один промпт.

Поговорим о том, как перестать гадать и начать считать потребление GPU-памяти: от чтения самого текста ошибки до оценки вклада vLLM, активаций и параметров обучения. С формулами, реальными конфигами и объяснением, какие настройки действительно дают эффект, а какие только создают иллюзию оптимизации.

Оптимизировать LLM

+10

a_vasilych 21 мая в 11:19

Окей, Lamoda, что надеть на вечеринку? Как обучить LLM навыкам ИИ-стилиста

Средний

13 мин

7.6K

Блог компании Lamoda TechМашинное обучение * Искусственный интеллект

Кейс

Как объяснить алгоритму, что кожаная куртка и очки героя мемов Джейсона Стетхема — это не просто одежда, а часть стиля? Классические поисковые системы хорошо работают с запросами, в которых указаны категории и атрибуты товаров, но не «чувствуют» дополнительный fashion-контекст. А это ключевая способность эксперта по моде — понять каждого своего клиента и собрать ему подходящий лук даже для самого оригинального кейса.

Меня зовут Артем Нигоян, я дата-сайентист в Lamoda Tech и занимаюсь разработкой ИИ-стилиста. Этот продукт помогает подбирать товары и образы для наших пользователей. В его основе наша собственная LLM с навыками стилиста — предельно гибкая и контролируемая, покрывающая максимум разных запросов от пользователей.

В августе 2025 года ИИ-стилист появился в формате Telegram-бота, а в конце декабря был интегрирован в приложение Lamoda.

Расскажу, как мы обучали и внедряли нашу LLM, как она помогает подбирать образы на разные случаи жизни, в чем преимущество по сравнению с готовыми решениями, и как мы планируем развивать данный продукт дальше.

Читать далее

+3

gornman 21 мая в 10:05

Мне 15, и я собираю AI-стартап для недвижки: как я победил GPU, баги PyTorch и очередь в визовый центр

Средний

16 мин

16K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * Развитие стартапаIT-инфраструктура *

Кейс

На Авито полно квартир за 80, 100 и 180 тысяч в месяц, которые выглядят так, будто их специально фотографировали как можно хуже. Тёмные комнаты, кривые ракурсы, пересветы, ванная как из хоррора — и всё это в объявлениях, где вообще-то пытаются сдать или продать дорогой объект.

Я решил это исправить...

Читать далее

+55

Maverickrock 21 мая в 08:20

Google Fellow, студент Нанкина и создатель TikTok: кто сделал Seedream и Seedance. Досье SpeShu.AI

6 мин

5.5K

Блог компании ЦНИСИскусственный интеллектМашинное обучение * Карьера в IT-индустрии

Seedance 2.0 вышел 12 февраля 2026 года. За один день пользователи сгенерировали Тома Круза против Брэда Питта на крыше, несколько финалов «Очень странных дел» и лайтсейбер-битву Дарта Вейдера с Рей. Disney, Paramount, Warner Bros., Netflix и Sony выслали ByteDance письма с требованием прекратить. MPA назвала происходящее «системным нарушением авторских прав».

За несколько дней до этого западные эксперты называли Seedream лучшим в мире генератором изображений — обходящим Midjourney, Flux и Nano Banana по качеству. Тот же ByteDance, та же команда.

Это рубрика досье SpeShu.AI. Здесь мы составляем психологические портреты людей, которые ведут всех нас в будущее искусственного интеллекта и прямо сейчас меняют мир, как в своё время изменили Лейбниц, Эйнштейн и Курчатов.

Читать далее

-1

Ferraro 21 мая в 05:52

Как я обучил GPT с нуля на русском языке — и что из этого получилось

Сложный

7 мин

7.9K

Машинное обучение * Python * Искусственный интеллектNatural Language Processing *

Туториал

Всё началось с наивной мысли: зачем платить за API или тащить 7B-модель, если мне нужна маленькая модель для простых разговоров на одном языке? Логика казалась железной — большие модели умеют всё и на всех языках сразу, но это же избыточно. 0.7B, заточенная под один язык и один стиль общения, должна справляться не хуже.

Спойлер: это было наивно. Но путь оказался ценнее результата.

Читать далее

+9

ArthurEx 20 мая в 22:39

Реакционная лженаука. Как СССР осудил кибернетику — и чем это аукнулось для ИИ

4 мин

12K

Искусственный интеллектИстория ITНаучно-популярноеМашинное обучение *

Алексей Андреевич Ляпунов был математиком — специалистом по математической логике. В 1954 году, когда кибернетика официально называлась реакционной буржуазной лженаукой, он открыл в Московском университете семинар по кибернетике. Это было примерно как читать запрещенную литературу в читальном зале публичной библиотеки. Только публичной библиотекой был МГУ.

Он не был диссидентом. Он просто считал, что обратная связь существует независимо от того, что о ней думают, скажем так, философы нужной закалки.

Читать далее

+6

badcasedaily1 20 мая в 20:25

RAG для тех, кто разочаровался: почему retrieval ломается и как это починить

Средний

7 мин

12K

Блог компании OTUSПрограммирование * Python * Машинное обучение * Искусственный интеллект

Туториал

Вы собрали RAG-пайплайн: загрузили документы, нарезали на чанки, сгенерировали эмбеддинги, подключили векторную базу. Задаёте вопрос — модель отвечает уверенно и подробно. Показываете заказчику, тот в восторге. Потом начинается тестирование на реальных вопросах, и оказывается, что на половину из них система отвечает мимо: то находит не тот документ, то находит правильный, но не тот кусок, то вообще ничего релевантного не достаёт и модель уверенно галлюцинирует.

Каждый раз проблема не в модели (GPT-4 и Claude отвечают хорошо, если им дать правильный контекст), а в retrieval — в том, как мы ищем релевантные куски документов. Модель отвечает ровно настолько хорошо, насколько хорош контекст, который ей подсунули.

Рассмотрим три основные причины.

Разобрать RAG

+8

MaxRokatansky 20 мая в 12:15

SciGraph: как я учил ИИ читать научные статьи не только по словам, но и по связям

Средний

9 мин

8.5K

Блог компании OTUSМашинное обучение * Искусственный интеллект

Кейс

SciGraph показывает, почему GraphRAG для научных статей — это не только про графы и LLM, но и про честные метрики. В статье — разбор системы, которая связывает PDF, авторов, методы и цитирования, а заодно показывает, как красивая архитектура ломается на реальных вопросах исследователя.

Читать кейс

+1

natlysky 20 мая в 08:00

Как развернуть Mistral 7B на GPU-сервере через vLLM

6 мин

9.9K

Блог компании SelectelМашинное обучение * Системное администрирование * Облачные сервисы * Видеокарты

Туториал

Если бюджет и ресурсы ограничены, а развернуть self-hosted LLM нужно, присмотритесь к такой связке: Mistral-7B-Instruct-v0.3 + виртуальная машина с RTX A5000 24GB в облаке + vLLM. Да, это далеко не энтерпрайз-уровень, но для некоторых базовых сценариев результат работы будет очень даже хорошим.

Собственно, в этой статье мы развернем сервер с GPU, подготовим Python-окружение, установим vLLM, запустим модель, отправим тестовый запрос через API и посмотрим на базовые метрики, которые помогут оценить выбранную конфигурацию.

Читать далее

+31

EfimkinDM 20 мая в 07:49

Адаптивный СВЧ‑сенсор на базе 8-битного МК

Средний

11 мин

8.5K

Блог компании Специальный Технологический ЦентрПроизводство и разработка электроники * Программирование микроконтроллеров * Любительская радиосвязьМашинное обучение *

В области встроенных систем и СВЧ‑электроники применение «тяжёлых» нейросетевых решений (включая TinyML) часто ограничено вычислительными ресурсами и энергопотреблением.

В статье рассматривается альтернативный подход: частотная дискриминация с помощью двух амплитудных детекторов с разной нелинейностью отклика. Разница их выходных напряжений формирует уникальный «отпечаток» частоты. Для классификации используется однослойный перцептрон, реализованный на 8-битном микроконтроллере К1946ВМ014 (аналог ATmega8535) с целочисленной арифметикой.

Представлены схема устройства, алгоритм обучения и экспериментальные результаты распознавания частотных диапазонов. Код (95 строк) и основные технические решения.

Читать далее

+16

sansmaster 20 мая в 07:43

Разобрал фишинг MAX, собрал в нём своего AI-секретаря. Гайд: Claw Bot + MCP

20 мин

8.8K

Python * Информационная безопасность * Машинное обучение * Реверс-инжиниринг * Проектирование API *

Кейс

Месяц назад мне в личку прислали фишинговую ссылку под MAX. Разобрал её, попутно вынес устройство протокола: опкоды, формат фрейма, флаги push-подписки, антибот-эвристики. Через две недели применил это знание к мирной задаче: собрал в том же мессенджере своего AI-секретаря, который пишет первым коллегам, бронирует столики и ведёт переписки до результата.

Всё через User API без регистрации, MCP-сервер на семь тулов, рабочий репозиторий с граблями. Делюсь инструкцией.

Читать далее

+5

enamored_poc 20 мая в 07:09

Создаем ИИ‑модель для генерации музыки на базе Lakh MIDI Dataset

Простой

16 мин

7K

Машинное обучение * Искусственный интеллектPython * ЗвукПрограммирование *

Туториал

Генерация музыки алгоритмами — давно рабочий инструмент индустрии. Этот сегмент прошел путь от простых цепей Маркова, которые предсказывали вероятности перехода одной ноты в другую, до современных трансформеров, способных выдавать многоканальные аудиозаписи.

Для разработчика генерация музыки — это отличная практическая задача. Работать с сырым аудио (waveform) вычислительно тяжело и требует сложных архитектур, но при использовании формата MIDI задача сводится к обработке последовательностей. Это делает процесс похожим на работу с текстом в NLP: мы берем дискретные токены (ноты, аккорды, паузы), находим между ними связи и предсказываем следующие шаги. Главный плюс — результат обучения модели можно в буквальном смысле услышать.

Цель этой статьи — построить с нуля простую и понятную рекуррентную нейросеть на базе архитектуры LSTM. Мы разберем полный цикл: загрузим сырые данные, подготовим их для обучения, напишем нейросеть, которая научится улавливать закономерности в мелодиях, и заставим ее сгенерировать новую нотную последовательность.

Наш стек технологий:

Читать далее

+1

DmitryITMO 20 мая в 07:00

LLM без поиска — генератор галлюцинаций. Как мы с этим справились при создании поиска по интранету

22 мин

11K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureИскусственный интеллектПрограммирование * Машинное обучение *

Меня зовут Дима Кирпа, я разработчик из команды ML Laboratory в Yandex Infrastructure. Четыре года я делаю внутренний поиск по корпоративному интранету Яндекса. Сегодня предлагаю ненадолго отложить судорожный тюнинг промптов и температуры LLM и окинуть внутренние корпоративные знания более широким взглядом. На примере опыта Яндекса я разберу процесс LLM‑изации интранета компании с самых азов. На время мы вернёмся в ламповый мир старого доброго фича‑инжиниринга, неспешно пройдёмся от настроек ранжирования к настройкам поискового контекста для LLM и увидим, как фичи поиска плавно перетекают в фичи генеративки. Напоследок убедимся, что всё не зря и наши разработки реально приносят пользу компании.

Я расскажу, как устроен бэкенд и ранжирование внутреннего поиска Яндекса, как на базе внутреннего поиска мы построили генеративную Q&A‑систему AI Chat. Покажу обоснования разных внедрений в виде чисел из реальных A/B‑экспериментов. Никакого хайпа, только факты. Цель статьи — доказать, что поиск — это база для корпоративных процессов обмена знаниями, а модель роста от поиска к агенту — самая эффективная.

Читать далее

+28

Bogdan_m01 19 мая в 21:58

GLiNER Guard: один schema-driven энкодер вместо зоопарка LLM-гардрейлов

Средний

7 мин

12K

Блог компании RaftМашинное обучение * Искусственный интеллектNatural Language Processing * Open source *

Деплоите LLM? Значит, обвешиваете её гардами. Сначала safety, потом PII, потом prompt injection, потом toxic BERT - и в один прекрасный день обнаруживаете, что у вас 5 классификаторов на каждой ноде и 20 forward-ов на один пользовательский запрос.

GLiNER Guard - возможность схлопнуть этот стек в единый schema-driven энкодер. И да, его можно тоже промптить: через zero-shot + description.

Читать далее

+8

ysrgsyn 19 мая в 21:27

Разбираемся в ML без воды: от базы до Attention. Часть 2: Линейная регрессия

Простой

6 мин

12K

Математика * Машинное обучение *

Итак, в предыдущей части мы остановились на поиске решения задачи линейной регрессии. Сформулировали в общем виде задачу машинного обучения, поняли суть параметров, рассмотрели функции ошибок и начали копать в сторону линейной регрессии.
Ещё раз повторю, что этот цикл статей является лишь взглядом на ML с моей колокольни, так что он не обязательно является истиной ~~во всех редакциях~~ в последней инстанции. Так что буду рад всякому, кто исправит меня, коли сверну не туда.

Читать далее

+9

wearetyomsmnv 19 мая в 21:15

AI-пентестер: охотник или добыча

Средний

13 мин

13K

Искусственный интеллектИнформационная безопасность * Машинное обучение * Open source *

Обзор

К весне 2026 года картинка стала почти ритуальной. XBOW занял первое место на HackerOne, обогнав тысячи живых багхантеров, и в марте закрыл Series C на сто двадцать миллионов долларов с интеграцией в Microsoft Security Copilot. Anthropic Mythos Preview в системной карте отчитывается о тысячах найденных zero-day в основных операционках и браузерах. Все мерят возможности в атаках: ASR на CVE-Bench, скорость, место в лидерборде, выручка за квартал и то как он помогает защищать большие организации.

Никто почти не задаёт встречный вопрос. Простой. А насколько защищён сам пентестер?

Серьёзно. Вы выкатываете автономного агента, который ходит по чужой инфраструктуре, читает баннеры, парсит HTTP-ответы, исполняет команды по результатам сканеров. Все эти каналы являются приёмниками недоверенных данных, а значит, канал восприятия здесь же оказывается каналом захвата. Пентестер скептически смотрит на подозрительно открытый FTP с anonymous-входом и на файл passwords.txt посреди десктопа. AI-агент идёт по бумажке. И если бумажка перевёрнута, идёт по перевёрнутой бумажке.

Моя статья - попытка собрать в одном месте всё, что в открытом доступе известно про обратную сторону: про то, как этого AI-пентестера ловят и что с ним делают, когда поймают. Спойлер: содержательный фронтир составляют четыре академические работы последнего года и один фреймворк для реального использования. Всё остальное - академическая графомания.

А что было дальше ?

+6

nlaik 19 мая в 18:31

Google I/O 2026: разбираю все главные анонсы — что реально доступно сегодня, а что только обещано

Простой

9 мин

13K

Искусственный интеллектМашинное обучение * Google API *

Аналитика

Сегодня прошла главная ежегодная конференция Google — I/O 2026. Анонсов столько, что технические TG-каналы захлёбываются хайпом, но в каждом втором посте — преувеличение или путаница в деталях. Собрал трезвый разбор: что реально вышло сегодня, что только обещано к концу года, что доступно глобально, а что только в США за $200/мес. Плюс собственная оценка — где это меняет правила игры для индустрии, а где обычная I/O-помпезность

Читать далее

0

YH7H22 19 мая в 17:50

Иллюзия ширины и геометрия глубины: почему глубокие нейросети умнее, и в чем лжет теорема об аппроксимации

Средний

4 мин

10K

Машинное обучение *

Мнение

Базовая теорема машинного обучения гласит, что нейросеть с одним скрытым слоем может выучить любую функцию в мире, если сделать этот слой достаточно широким. Но на практике создатели SOTA моделей всегда выбирают глубину. В этой статье мы разберем геометрическую и физическую разницу между масштабированием ширины (d_model) и глубины (num_layers). Мы посмотрим, как нелинейности складывают латентное пространство словно оригами, почему логический вывод математически невозможно распараллелить, и почему широкие сети обречены на зубрежку, а глубокие способны к абстракции.

Читать далее

+7

Sergey_Slepukhin 19 мая в 12:27

Графы знаний в юридическом домене: эксперимент с LightRAG

Средний

29 мин

9.1K

Искусственный интеллектМашинное обучение * Семантические сети * Natural Language Processing *

Кейс

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний: связи между нормами, прецедентами и понятиями, рассеянными по тысячам документов, наконец-то перестают теряться.

Современные фреймворки обещают построить такой граф автоматически, в пару команд. Но между "запуском из коробки" и рабочей аналитической системой на практике лежит немалая дистанция.

Это первая часть практического эксперимента с LightRAG, одним из самых известных графовых фреймворков. На небольшом корпусе из Гражданского кодекса РФ и судебной практики разбираем, как фреймворк устроен, как его быстро развернуть, и почему граф из "коробки", без оптимизации и тонкой настройки, при всей внешней убедительности, еще не готов к полноценной работе в юридическом домене.

Читать далее

+5

2

3 4 ...