Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

@yaroslav_bespalov 26 ноя в 12:31

MAESTRO — новый фреймворк для построения мультиагентных систем и цифровых ассистентов на основе LLM

Сложный

19 мин

7.2K

Блог компании AIRIИскусственный интеллектМашинное обучение * Алгоритмы * Natural Language Processing *

Кейс

Привет, Хабр! За последний год стало ясно, что использование нескольких LLM в агентном режиме приносит существенно больше пользы, чем простая сумма их компьюта по отдельности. Гибкость, распределение ролей и активное взаимодействие моделей позволяет достичь значительных успехов в самых различных задачах, включая создание полезных цифровых ассистентов.

Построением таких систем заняты многие команды по всему миру. Чтобы ускорить прогресс в этом направлении и помочь коллегам, мы в группе «Мультимодальные архитектуры ИИ» AIRI создали новый фреймворк под названием MAESTRO — Multi‑Agent Ecosystem of Task Reasoning and Orchestration. Мы представили его на конференции AI Journey 2025, которая прошла в Москве на прошлой неделе.

В этой статье нам бы хотелось поподробнее рассказать о нашей разработке, описать устройство фреймворка и дать примеры его использования.

@dev_flex 26 ноя в 11:48

Как «Спортивный помощник» на NLU закрывает более 80% обращений в чате

4 мин

5.8K

Блог компании SM LabУправление продажами * Управление проектами * Машинное обучение * Разработка под e-commerce *

Кейс

Привет! Меня зовут Екатерина Морозова и я менеджер продукта «Спортивный помощник». В этой статье я расскажу, как работает наш чат-бот и как мы подняли процент закрытия чатов ботом до более, чем 80%.

Все говорят LLM, а я скажу NLU. А может ли бот без LLM обеспечить высокий процент автоматизации? Да, но…

Путь Спортивного помощника начался в далеком 2022 году. О генеративных моделях тогда было мало известно, и мы стояли перед выбором решения для автоматизации обработки вопросов клиентов в службу поддержки. Кнопочные боты показывали низкую эффективность, поэтому выбор был очевиден - использовать технологии распознавания естественного языка (NLU - Natural-language understanding) для определения намерения клиента.

@victor_shev89 26 ноя в 11:37

Антипаттерн LLM-приложений: Когда модель игнорирует контекст. Часть 1

Простой

10 мин

5.4K

Искусственный интеллектМашинное обучение * Программирование *

Аналитика

Всем привет! Бездумно соглашаться с любыми хотелками заказчика или начальства в технических вопросах — почти то же самое, что саботировать проект: всё это быстро превращается в тяжёлый технический долг. Да, жёсткие сроки, ограниченный бюджет и нехватка «свободных рук» — реальность, с которой приходится считаться. Но это не отменяет простой вещи: свои опасения и архитектурные риски нужно озвучивать, выносить на обсуждение и предлагать не только «работающие на сейчас», но и масштабируемые решения.

Как разработчикам нам обычно говорят: «давайте максимально быстро и топорно соберём proof‑of‑concept (PoC)». Мы собираем PoC на костылях, а дальше слышим: «отлично, теперь давайте из этого сделаем MVP». Времени на переорганизацию и реинжиниринг архитектуры никто не даёт. В итоге недели и месяцы работы превращают проект в тупиковую поделку — груду классов, методов и промптов, к которой страшно прикасаться.

С LLM эта история становится ещё болезненнее. В работе у меня было несколько показательных проектов с LLM в роли основного движка (RAG, Q&A‑системы), на которых я очень наглядно увидел, как делать не стоит. Эти «шишки» превратились в набор антипаттернов проектирования LLM‑приложений, о которых я хочу поговорить в серии статей.

В этой части — антипаттерн взаимодействия с LLM, когда модель игнорирует контекст: важные детали промпта, куски документов и даже прямые инструкции.

Представьте ситуацию: вы даёте модели текст, в котором прямо содержится ответ на вопрос, но она отвечает что‑то совсем не то. Вы прописываете инструкции, как именно нужно вести диалог и решать задачу, но они стабильно игнорируются. Вы добавляете новые чанки с данными, дописываете всё более подробные правила и уточнения — а качество ответов только падает.

@PatientZero 26 ноя в 11:08

Почему агенты НЕ пишут основную часть нашего кода

Простой

8 мин

6.5K

Тестирование IT-систем * Искусственный интеллектМашинное обучение * Программирование *

Перевод

Наша компания Octomind занимается созданием ИИ-агентов, но её кодовая база по-прежнему в основном пишется людьми. Мы любим LLM и используем их везде, где можем, от нашего продукта до внутренних рабочих процессов. Но, несмотря на весь хайп, ситуация далека от того, чтобы агенты писали большую часть нашего кода.

У нас есть веские причины на то, чтобы пока не присоединяться к таким компаниям, как Anthropic (генерируется 80%), Microsoft (30%) и Google (25%).

‍‍Пока нам недостаёт в них некоторых жизненно важных элементов. В статье мы расскажем, почему это важно, и что нужно, чтобы закрыть эту нехватку.‍‍

+10

@MVideohabr 26 ноя в 09:51

Сравнение LLM-кодеров: GPT-5.1, Grok, DeepSeek, «Алиса» и GigaChat

11 мин

11K

Блог компании М.Видео-ЭльдорадоМашинное обучение * Искусственный интеллектПрограммирование * Управление разработкой *

Привет, Хабр! Сегодня проверим, какая нейросеть лучше помогает в программировании. На дворе 2025 год у нас подоспел GPT-5.1, подтянулись конкуренты вроде Grok от xAI и DeepSeek из Поднебесной, а на отечественной сцене выступают обновлённая Алиса от Яндекса и сберовский GigaChat.

@AIgent_Smith 26 ноя в 09:17

Датасет VK-LSVD помогает тестировать алгоритмы рекомендаций: сейчас на его базе проходит VK RecSys Challenge

Средний

7 мин

6.3K

Блог компании VKМашинное обучение * Работа с видео * Big Data * Алгоритмы *

Обзор

Сейчас в открытом доступе мало крупных датасетов сервисов коротких видео, но это уникальный формат для рекомендательных алгоритмов. В отличие от музыки или длинных видео они не могут потребляться в фоновом режиме, а каждый показанный ролик получает от пользователя реакцию. Даже если он не оставит лайк, досмотр видео до конца или пропуск уже считаются обратной связью. Именно поэтому мы выложили в открытый доступ датасет VK-LSVD. С его помощью инженеры и ученые смогут развивать и совершенствовать рекомендательные алгоритмы.

Как работать с VK-LSVD

+24

@sokolovps 26 ноя в 09:11

OpenAI и ее патенты: кто стоит за разработками компании

Простой

5 мин

5.3K

Блог компании Online patentПатентование * Искусственный интеллектМашинное обучение * Монетизация IT-систем *

Обзор

Сезон ИИ в разработке

OpenAI — компания, являясь одним из лидеров в сфере создания искусственного интеллекта, владеет несколькими десятками патентов. Разбор некоторых из них представлен здесь. Однако наша сегодняшняя цель — рассказать о научных разработках рядовых сотрудников фирмы.

+11

@python_leader 26 ноя в 08:30

Почему LLM врут настолько убедительно?

Простой

10 мин

7.8K

Программирование * Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Перевод

Команда AI for Devs подготовила перевод статьи о том, как быстро растущие AI-ассистенты меняют саму природу разработки. Их код выглядит безупречно — но всё чаще решает не ту задачу, что стоит перед нами. Где проходит граница между ускорением и самообманом, и какую новую ответственность это накладывает на инженеров?

@KristMarrakesh02 26 ноя в 06:15

DCN-R: как объединить Deep & Cross-модель и ResNet-подход для улучшения рекомендаций

Сложный

18 мин

5.4K

IT-компанииPython * Искусственный интеллектМашинное обучение * Математика *

Из песочницы

Как мы построили DCN-R: новую гибридную модель рекомендаций на Cross Network и ResNet-блоках

Современные рекомендательные системы сталкиваются с парадоксом: модели умеют либо отлично «запоминать» закономерности, либо хорошо «обобщать» новые случаи — но почти никогда не делают это одновременно. В этой статье я показываю, как гибридная архитектура DCN-R, сочетающая Cross Network и Residual Blocks, смогла обойти это ограничение и превзойти классические подходы.

Мы провели серия экспериментов, автоматический подбор гиперпараметров, абляции и построили продакшн-готовый сервис, чтобы проверить, действительно ли DCN-R работает лучше, или это просто красивая идея.

@celen 25 ноя в 15:15

7 причин, почему ваш ИИ тупит (и как это исправить)

Простой

6 мин

11K

Искусственный интеллектМашинное обучение * Анализ и проектирование систем *

Туториал

Сезон ИИ в разработке

Работаете с ИИ-ассистентом и чувствуете, что он вас не понимает? Ломает архитектуру, пишет код мимо кассы, а на простые вопросы отвечает какой-то ерундой?

Спокойно. Скорее всего, дело не в нём. Давайте разберёмся, где кошка зарыта.

25 ноя в 12:28

Властелин алгоритмов: сезон «ИИ в разработке» на Хабре

3 мин

15K

Блог компании ХабрBig Data * Машинное обучение * Искусственный интеллект

Сезон ИИ в разработке

Он пришёл на пятый день с востока! Сезон «ИИ в разработке» на Хабре.

Искусственный интеллект становится соисполнителем в современной разработке, он берет на себя анализ кода, стратегическое планирование и другие задачи. И в этом сезоне мы предлагаем вам поделиться историями о том, как искусственный интеллект помогает решать реальные задачи, разгружать рутину и ускорять процессы в работе и жизни.

Под катом — условия, призы и детали участия.

+33

@All_Pri 25 ноя в 10:00

Борьба с дисбалансом классов. Oversampling

Средний

10 мин

5.4K

Блог компании KozhinDevМашинное обучение * Python *

Туториал

Привет, Хабр! На связи KozhinDev и ml-разработчик Приходько Александр. Это третья статья в цикле публикаций по теме борьбы с проблемой дисбаланса классов в машинном обучении. В первой статье мы обсудили актуальность данной проблемы в машинном обучении, а также сравнили методы борьбы с ним, без внесения изменений в сами данные: изменение весов классов и порога принятия решения моделью. Во второй статье мы сравнивали undersampling-методы, которые удаляли представителей частого класса.

В данной части мы протестируем методы балансировки данных методом oversampling из библиотеки imblearn. Суть данного метода заключается в том, что мы пытаемся бороться с дисбалансом классов генерируя данные для редкого класса. Мы рассмотрим разные способы генерации таких данных и протестируем их на синтетических данных.

@cognitronn 25 ноя в 09:44

За рекордными отчётами Nvidia скрывается афера на 2 триллиона долларов, и вот что от нас прячут…

Простой

7 мин

15K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеБудущее здесь

Мнение

Перевод

«Много говорят о пузыре ИИ, - отметил CEO Nvidia Дженсен Хуанг во время недавнего отчёта о прибылях за третий квартал. - Мы видим иную картину».

Легко понять, почему Хуанг так считает. В конце концов, этот отчёт был лакмусовой бумажкой для всей индустрии, и они с блеском прошли проверку. Их выручка взлетела на 62%, превзойдя прогнозы Уолл-стрит. Я уверен, что с вершины своей золотой горы Хуангу всё кажется прекрасным. И впрямь, похоже, мир согласился, что страхи о катастрофическом взрыве пузыря ИИ - не более чем паникёрство. Но я заявляю - это полная чушь, потому что это не гора золота, а карточный домик.

То, что все, кажется, упускают из виду, так это то, что спрос на кирки и лопаты вовсе не означает, что тюльпаномания или золотая лихорадка не готовы вот-вот лопнуть. Точно так же спрос на чипы ИИ, которые продаёт Nvidia, не означает, что нет пузыря, который вот-вот разрушительно схлопнется.

Вопрос закрыт. Но все также упускают из виду ужасающий контекст этого отчёта. Подобно тому, как, потянув за одну ниточку, можно распустить весь свитер, если проследить здесь за деньгами, то ужасающий масштаб пузыря ИИ предстанет во всей своей наготе.

Пристегните ремни - погружение будет глубоким!

+54

140

@Quvele 25 ноя в 08:00

ИИ-агенты на рынке недвижимости: эволюция

Средний

14 мин

6.2K

Блог компании ДомкликИскусственный интеллектМашинное обучение *

Кейс

Всем привет! Меня зовут Алина, и на связи снова компания Домклик. Сегодня я хочу рассказать про очень горячую тему этого года, а именно про разработку ИИ-агентов. Недавно выступила с докладом на конференции HighLoad++ 2025. Я думаю, что всем будет интересно узнать, как мы провели это лето, делая ИИ-агентов для рынка недвижимости. Несмотря на уже существовавшие Transformer-модели, массового ажиотажа вокруг агентов тогда не было, однако в этом году ситуация кардинально изменилась.

+22

@NagaevDen 24 ноя в 17:04

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

Средний

5 мин

9.2K

Искусственный интеллектМашинное обучение * Облачные сервисы * Облачные вычисления * IT-инфраструктура *

Из песочницы

В этой статье разберём, во сколько обходится LLM-сервис при нагрузке в 100 000 диалогов в день и где проходит граница окупаемости разных вариантов. Посмотрим на стоимость облачных API, аренды GPU и собственного железа, а заодно прикинем, какая инфраструктура нужна, чтобы всё это выдержало боевой трафик.

@Efrosim123 24 ноя в 13:39

Как я собрал Telegram-бота-консультанта по железу на бесплатном стеке (RAG + Groq + python telegram bot)

Средний

6 мин

8.9K

Машинное обучение * Python * Мессенджеры *

Кейс

Представьте консультанта в DNS/Ситилинке, который не навязывает «вот этот блок питания потому что остался на складе», а спокойно объясняет, чем один БП лучше другого под ваш билд, помнит, о чём вы спрашивали раньше и ещё просит вежливый фидбек.

В статье рассказываю, как собрал такого консультанта в виде Telegram‑бота «Кремний» — RAG‑бота по железу на бесплатных инструментах (Telegram Bot API, Groq с Llama 3.1 8B, sentence‑transformers) и что за «чуть‑чуть боли» произошло с NumPy и Pterodactyl при деплое.

Telegram‑бот‑консультант по железу

@Paradise151 24 ноя в 11:16

Гречневая нейронка. Попытка закрыть национальный гештальт

Простой

8 мин

9.9K

Машинное обучение * ГовнокодTensorFlow * Python * Управление продуктом *

Из песочницы

Детекция мусора в гречке с помощью нейросети YOLO8n + попытки в real-time детекцию (Docker + FastApi, Gradio, TensorFlow Lite) + предложение добавить такую фичу в приложения продуктовых магазинов. За результатами приглашаю в статью.

+26

@deniselykov 24 ноя в 10:15

Как мы учили кассу самообслуживания в столовой отличать борщ от свекольника

Простой

9 мин

8.6K

Искусственный интеллектИнтернет вещейМашинное обучение * Обработка изображений *

Из песочницы

Хочу рассказать о том, как мы разрабатывали и внедряли кассы самообслуживания для столовых и фудкортов. Под катом:

Почему распознавать еду сложно (но можно). Где мы ожидали получить проблемы, и где они были на самом деле. Почему не нужно помогать кассиру делать свою работу. Сколько котлет нужно сфоткать для уверенного распознавания. Бунт кассиров, бессмысленный и беспощадный. Какие проблемы создает товароведу касса самообслуживания.

+15

@Ekzarx 24 ноя в 07:15

Роевой интеллект: как 15 строк кода заменяют централизованное управление дронами

5 мин

10K

Python * ТранспортРобототехникаМашинное обучение * Искусственный интеллект

Из песочницы

Привет, Хабр! Сегодня мы погрузимся в увлекательный мир роевого интеллекта и децентрализованных систем. Я покажу, как простые правила, заложенные в каждый элемент системы, позволяют добиться сложного группового поведения без единого центра управления. В качестве полигона используем виртуальный рой автономных дронов.

*Код и симуляция: Python 3.8+, matplotlib, numpy

Проблема централизованного управления

Представьте, что вам нужно координировать движение 50 дронов. Первое, что приходит в голову — центральный контроллер с нейронной сетью, которая вычисляет оптимальные траектории для каждого аппарата. Но у этого подхода есть фундаментальные недостатки:

+22

@snakers4 24 ноя в 05:09

Мы опубликовали стабильный, быстрый, качественный и доступный синтез для 20 языков России

Простой

13 мин

18K

Машинное обучение * Open source * Natural Language Processing * Голосовые интерфейсы * Искусственный интеллект

Обзор

Сезон ИИ в разработке

Представляем наш синтез для языков России и СНГ. В этот раз получилось покрыть 20 языков, всего 95 голосов. От старой демки этот релиз отличается следующим:

Модель поддерживает SSML;

Модель стала быстрее ещё на 20-25% (она и так была супер быстрой);

С живыми дикторами были подписаны договоры на запись их голоса;

Запись велась в максимально высоком из практически доступного качестве;

Для ряда языков опубликованы модели простановки ударений и / или словари с ударениями в рамках silero-stress;

К модели синтеза применены все оптимизации, как к нашей прошлой публичной модели;

Для демки мы брали шумные публичные данные низкого качества. В этот раз всё хорошо - как следствие существенно выросло качество синтеза.

+77

115

1 2 3 4

6 7 ...

477 478

Машинное обучение *

MAESTRO — новый фреймворк для построения мультиагентных систем и цифровых ассистентов на основе LLM

Как «Спортивный помощник» на NLU закрывает более 80% обращений в чате

Антипаттерн LLM-приложений: Когда модель игнорирует контекст. Часть 1

Почему агенты НЕ пишут основную часть нашего кода

Сравнение LLM-кодеров: GPT-5.1, Grok, DeepSeek, «Алиса» и GigaChat

Датасет VK-LSVD помогает тестировать алгоритмы рекомендаций: сейчас на его базе проходит VK RecSys Challenge

OpenAI и ее патенты: кто стоит за разработками компании

Почему LLM врут настолько убедительно?

DCN-R: как объединить Deep & Cross-модель и ResNet-подход для улучшения рекомендаций

7 причин, почему ваш ИИ тупит (и как это исправить)

Властелин алгоритмов: сезон «ИИ в разработке» на Хабре

Борьба с дисбалансом классов. Oversampling

За рекордными отчётами Nvidia скрывается афера на 2 триллиона долларов, и вот что от нас прячут…

Ближайшие события

ИИ-агенты на рынке недвижимости: эволюция

Как выбрать между облаком, арендой GPU и своим железом для LLM-систем

Как я собрал Telegram-бота-консультанта по железу на бесплатном стеке (RAG + Groq + python telegram bot)

Гречневая нейронка. Попытка закрыть национальный гештальт

Как мы учили кассу самообслуживания в столовой отличать борщ от свекольника

Роевой интеллект: как 15 строк кода заменяют централизованное управление дронами

Мы опубликовали стабильный, быстрый, качественный и доступный синтез для 20 языков России

Вклад авторов