Машинное обучение *

Основа искусственного интеллекта

Qwen3Guard: следующий шаг в модерации и контроле контента

6 мин

Блог компании red_mad_robotИскусственный интеллектМашинное обучение * Информационная безопасность * Big Data *

Всем привет! Меня зовут Миша Мартьянов, я инженер по исследованиям и разработке в лаборатории AI R&D в red_mad_robot. В мои задачи входит проверка гипотез и развитие наших продуктов. Однако недостаточно просто улучшать продукты, необходимо также чтобы они работали устойчиво и безопасно.

Ранее я рассказывал разработку идеального контент-фильтра на базе Guardrails. Но время не стоит на месте: появляются новые модели и новые практики их применения. Этому и будет посвящён наш сегодняшний разговор.

@void0null 3 часа назад

Kandinsky 5.0: линейка open-source моделей генерации изображений и видео нового поколения

Сложный

9 мин

3.7K

Блог компании СберБлог компании SberDevicesМашинное обучение * Natural Language Processing * Обработка изображений *

Обзор

В сентябре мы открыли доступ к Kandinsky 5.0 Video Lite, лёгкой модели с 2 млрд параметров для создания видео по тексту или на основе изображения. Теперь мы выкладываем в open source и все остальные модели линейки Kandinsky 5.0: Video Pro и Image Lite!

+10

@konstantin_kozhin 3 часа назад

«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

Средний

6 мин

3.2K

Open source * Искусственный интеллектОткрытые данные * Машинное обучение *

Кейс

Я обучил небольшую языковую модель, которая отвечает на дореформенном русском как человек из XIX века.

Рассказываю, как подготовил данные, собрал синтетический корпус, обучил tiny-LLM и опубликовал её в виде чат-бота.

Читать далѣе

@kirillka18 3 часа назад

Как прошла международная конференция ISKE 2025 в области AI и ML

Простой

5 мин

3.2K

Машинное обучение * Искусственный интеллектOpen source * Исследования и прогнозы в IT * Карьера в IT-индустрии

Репортаж

Всем привет! С вами снова на связи Кирилл, и я только вернулся из своей недельной поездки в Китай на конференцию International Conference on Intelligent Systems and Knowledge Engineering (ISKE 2025), где я выступал с новой разработкой. Я бы хотел поделиться новыми открытиями, достижениями в области ML и ИИ. Немного раскрыть представление об AI и его применении в Китае, да и по миру в целом. Так что усаживайтесь по удобнее, заварите чаек, кофеек – и вперед читать новые инсайты!

@Astarostin 8 часов назад

ИИ-ассистент в M42: как мы в Авито ускорили построение графиков и увеличили аудиторию в Trisigma

Средний

16 мин

3.8K

Блог компании AvitoTechМашинное обучение * Управление продуктом *

Кейс

Привет! Меня зовут Андрей Старостин, я DS-инженер в аналитической платформе в Авито. В этой статье я расскажу об устройстве и внедрении сервиса-ассистента на основе искусственного интеллекта для упрощения работы с аналитическими данными в нашем продукте M42 внутри Trisigma.

@cognitronn 10 часов назад

DeepSeek-OCR + LLama4 + RAG = Революция в мире агентного OCR

Простой

10 мин

6.9K

Блог компании BotHubИскусственный интеллектМашинное обучение * Будущее здесьПрограммирование *

Туториал

Перевод

В выходные я просматривал Твиттер, чтобы узнать, что происходит в сфере ИИ. И снова DeepSeek привлек внимание всего мира.

Это не просто очередной инструмент для распознавания текста, а новая технология контекстного оптического сжатия, которая использует визуальные методы для решения проблемы обработки длинных текстов, предлагая новый подход к работе с огромными массивами информации.

Любой, кто пользовался большой языковой моделью (LLM), сталкивался с такой проблемой:

Когда вы просите модель обобщить десятки тысяч слов из конспектов конференций или научных статей, она начинает терять память.

Это происходит потому, что квадратичная сложность длины последовательности по своей сути ограничивает GPT, Gemini и Claude - чем длиннее входные данные, тем больше вычислительной мощности требуется.

@AI-SHA вчера в 09:55

Предопределённые векторы для обучения нейросетей с экономией памяти

Средний

4 мин

3.6K

Блог компании КриптонитМашинное обучение * Искусственный интеллект

Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.

Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил новую методологию, позволяющую добиться одного и того же размера нейросетевой модели независимо от числа классов. Это достигается за счёт использования предопределённых векторных систем в качестве целевой конфигурации скрытого пространства (Latent Space Configuration, LSC) во время обучения.

С проблемой раздувания классов сталкиваются во многих областях — от ритейла до научных исследований. Мы рассмотрим её на задаче распознавания лиц, где каждый человек (его ID) считается отдельным классом.

Существующий подход (SL) требует, чтобы размер последнего классификационного слоя был пропорционален количеству этих ID.

Когда число идентифицируемых лиц исчисляется миллионами, параметры этого слоя становятся просто астрономическими, а модель — непрактичной из-за непомерных требований к ресурсам (в частности — к видеопамяти). Это становится существенным барьером на пути к масштабированию.

В качестве решения этой проблемы эксперт «Криптонита» предложил радикально новый метод — LSC, который устраняет прямую зависимость между размером модели и числом классов. Вместо того, чтобы заставлять сеть запоминать каждый класс во всё увеличивающемся классификационном слое, LSC учит её проецировать входные данные — например, изображения лиц — в заранее заданную, фиксированную систему векторов в абстрактном скрытом пространстве.

@heckfy01 вчера в 08:14

AI-агенты в аналитике: как я разработал два production-проекта за неделю

Простой

12 мин

4.6K

Исследования и прогнозы в IT * Искусственный интеллектМашинное обучение * Python *

Из песочницы

За 18 часов вместо 120 создал production-ready ETL-инструмент с 30-кратным ускорением. За 6 часов вместо 40 — фреймворк статистического анализа. Экономия времени: 85-88%. Улучшение качества: +48%.

-3

@Wonderlove вчера в 08:05

Нейро-дайджест: ключевые события мира AI за 4-ю неделю ноября 2025

Средний

10 мин

5.4K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * IT-компанииБудущее здесь

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась плотной на релизы: Claude Opus 4.5 новый лидер в кодинге, открытые GigaChat 3, Kandinsky 5.0 и другие релизы от Сбера, FLUX.2 против Nano Banana Pro, параллельно обновились Cursor и Perplexity, а в США запускают мега-проект для ускорения науки.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

+13

@MishinAlex вчера в 07:14

Как я тестирую крупные системы, которые невозможно протестить на статичных данных

6 мин

4.3K

Блог компании Centicore GroupУправление проектами * Машинное обучение * Тестирование IT-систем * Анализ и проектирование систем *

Например, в управлении транспортом статичные данные (например, сет за «типичный вторник») не дают протестировать систему в условиях праздника, крупной аварии, сессии у студентов, скидки 99% на Лабубу в крупном супермаркете и так далее.

Что мы сделали:

• Стали брать реальные данные с прода, которые выбиваются за стандартные представления.

• Обезличивать их.

• Использовать ML-модель для генерации сценариев, где эти данные увязываются с остальными в системе. Это типа генерации новых данных с усилением трендов и их пересечением.

То есть фактически по модели швейцарского сыра — мы имеем один статичный срез, а затем начинаем ходить в прод и искать новые дырки. Потом соединяем несколько дырок в новом слое и накладываем слои друг на друга, чтобы посмотреть, не будет ли сквозного отверстия.

Цель — не просто нагрузить систему, а протестировать жизнеспособность архитектуры в похожих на реальные условиях.

Очень упрощая, наши наборы тестов учатся нестандартным ситуациям с прода и включают их и в тестовые выборки данных, и в юнит-тесты, и такие ситуации не только покрываются как частные случаи, но и включаются в сложные сценарии, где 3 малозначимых отказа могут привести к аварии.

Я думаю, что это будущее тестирования сложных систем, и мы с командой уже затащили это в автоматический пайплайн.

@mironov_vlad вчера в 07:00

+30% к скорости написания автотестов и сотни чек-листов в день: как мы внедряем LLM в QA

8 мин

6.7K

Блог компании ЯндексИскусственный интеллектТестирование веб-сервисов * Тестирование IT-систем * Машинное обучение *

Кейс

Привет! Меня зовут Владислав Миронов. Я отвечаю за внедрение LLM в процессы QA Яндекса и в этой статье расскажу, каких результатов мы достигли — от генерации тест‑кейсов и автотестов до помощи в ручном тестировании. Поделюсь не только успехами, но и тем, какие компромиссы и организационные решения понадобились, чтобы всё это заработало.

В статье покажу, как мы разрешаем противоречия между командами, уходим от «зоопарка» инструментов и строим централизованную экосистему, где качество остаётся под контролем: реальные схемы, примеры и цифры, без магии и маркетинга.

Спойлер: рассчитывать можно на многое, но и вложиться придётся основательно. Парой промптов тут, к сожалению, не обойтись.

+13

@artur-shamseiv вчера в 06:48

Долгая дорога к DiT (часть 3)

Средний

17 мин

3.7K

Машинное обучение * Python * Искусственный интеллект

Туториал

Заключительная (но ещё не последняя) статья из цикла про диффузные модели, где мы наконец отбросим примитивную модель из полносвязных слоёв и напишем работающий генератор изображений c архитектурой Diffusion Transformer (DiT). Разберёмся зачем нарезать изображения на квадратики и увидим, что произойдёт с вашей генерацией, если проигнорировать главную "слабость" трансформеров - неспособность понимать порядок.

@cognitronn вчера в 06:42

ChatGPT бесполезен? Я взломал мозг ИИ с помощью простого графа. Теперь он учится сам, и это пугает

Простой

9 мин

7.6K

Блог компании BotHubИскусственный интеллектМашинное обучение * Программирование * Научно-популярное

Туториал

Перевод

В этой статье я поделюсь сверхбыстрым руководством, которое покажет, как использовать графы для автоматизации знаний, заложенных в промпты, чтобы создать мощного чат-бота-агента для вашего бизнеса или личного пользования.

Сколько бы раз я ни спрашивал ChatGPT, я не могу получить хороший ответ - нужные мне предложения так и не появляются.

Кажется, что время просто уходит в никуда, и я знаю, что вы сталкивались с такой же проблемой. Дело не в том, что промпт плохо написан, а в том, что ИИ задают плохо структурированный вопрос.

@maxorik 26 ноя в 17:19

AI Routing Lab: машинное обучение для оптимизации сетевых маршрутов

Средний

13 мин

Децентрализованные сети * Инженерные системы * Искусственный интеллектМашинное обучение * Сетевые технологии *

Обзор

Каждый маршрут ведет себя по-разному в зависимости от времени суток, загрузки сети, погоды (да, это влияет на спутниковые каналы) и других факторов. Традиционная маршрутизация выбирает путь на основе метрик BGP (AS Path, MED), но эти метрики не учитывают реальную задержку и джиттер.

@arniksup 26 ноя в 15:47

DAT: новый способ гибридного поиска в RAG с динамической настройкой альфа-параметра

Средний

15 мин

Поисковые технологии * Машинное обучение * Искусственный интеллектData Engineering *

Из песочницы

Перевод

Привет, Хабр! Недавно у меня появилась задача - собрать RAG-систему для интернет-энциклопедии. В поисках решения я вышел на новый подход к гибридному RAG - “DAT: Dynamic Alpha Tuning for Hybrid Retrieval in Retrieval-Augmented Generation” (Динамическая настройка Альфа-параметра для гибридного поиска в RAG).

Поиск по Хабру и Рунету показал, про подход DAT на русском языке еще не рассказывали, поэтому спешу поделиться находкой с вами и обсудить преимущества и недостатки этого метода. Эта статья - упрощённый пересказ научной работы. Материал будет интересен как продвинутым, так и начинающим разработчикам RAG-систем.

+11

@cognitronn 26 ноя в 13:30

Топ-10 бесплатных нейросетей для создания и редактирования фото

Простой

6 мин

16K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеПрограммирование *

Обзор

Признайтесь, бывало так, что для поста или презентации нужна идеальная картинка, а в итоге вы тратите полвечера, перескакивая между стоками, редакторами и сомнительными PNG из Google? И всё равно выходит не то, что было в голове.

С появлением нейросетей этот круг ада можно смело вычеркивать. Теперь идея появляется сначала в голове, а через пару секунд уже на экране. Хотите бизона в короне, киберпанковскую библиотеку или фэнтези-кофемашину на паровом ходу? Никаких фотографов, художников и бесконечных правок, только текст и немного фантазии.

Кстати, видели обложку с Наполеоном, который скачет верхом на динозавре и размахивает саблей, пока флаг с черепом развивается у него за спиной? Да, это не отрывок из учебника альтернативной истории. Это пример того, как нейросети умеют превращать абсолютно безумные образы в настоящие картинки.

И раз уж мы начали с эпика, давайте не тормозить. Сегодня разберём, какие нейросети могут оживить нашего француза и как ими пользоваться, даже если вы никогда не открывали Photoshop.

Пристегивайтесь, будет интересно!

+16

@yaroslav_bespalov 26 ноя в 12:31

MAESTRO — новый фреймворк для построения мультиагентных систем и цифровых ассистентов на основе LLM

Сложный

19 мин

6.1K

Блог компании AIRIИскусственный интеллектМашинное обучение * Алгоритмы * Natural Language Processing *

Кейс

Привет, Хабр! За последний год стало ясно, что использование нескольких LLM в агентном режиме приносит существенно больше пользы, чем простая сумма их компьюта по отдельности. Гибкость, распределение ролей и активное взаимодействие моделей позволяет достичь значительных успехов в самых различных задачах, включая создание полезных цифровых ассистентов.

Построением таких систем заняты многие команды по всему миру. Чтобы ускорить прогресс в этом направлении и помочь коллегам, мы в группе «Мультимодальные архитектуры ИИ» AIRI создали новый фреймворк под названием MAESTRO — Multi‑Agent Ecosystem of Task Reasoning and Orchestration. Мы представили его на конференции AI Journey 2025, которая прошла в Москве на прошлой неделе.

В этой статье нам бы хотелось поподробнее рассказать о нашей разработке, описать устройство фреймворка и дать примеры его использования.

@dev_flex 26 ноя в 11:48

Как «Спортивный помощник» на NLU закрывает более 80% обращений в чате

4 мин

5.5K

Блог компании SM LabУправление продажами * Управление проектами * Машинное обучение * Разработка под e-commerce *

Кейс

Привет! Меня зовут Екатерина Морозова и я менеджер продукта «Спортивный помощник». В этой статье я расскажу, как работает наш чат-бот и как мы подняли процент закрытия чатов ботом до более, чем 80%.

Все говорят LLM, а я скажу NLU. А может ли бот без LLM обеспечить высокий процент автоматизации? Да, но…

Путь Спортивного помощника начался в далеком 2022 году. О генеративных моделях тогда было мало известно, и мы стояли перед выбором решения для автоматизации обработки вопросов клиентов в службу поддержки. Кнопочные боты показывали низкую эффективность, поэтому выбор был очевиден - использовать технологии распознавания естественного языка (NLU - Natural-language understanding) для определения намерения клиента.

+10

@victor_shev89 26 ноя в 11:37

Антипаттерн LLM-приложений: Когда модель игнорирует контекст. Часть 1

Простой

10 мин

4.9K

Искусственный интеллектМашинное обучение * Программирование *

Аналитика

Всем привет! Бездумно соглашаться с любыми хотелками заказчика или начальства в технических вопросах — почти то же самое, что саботировать проект: всё это быстро превращается в тяжёлый технический долг. Да, жёсткие сроки, ограниченный бюджет и нехватка «свободных рук» — реальность, с которой приходится считаться. Но это не отменяет простой вещи: свои опасения и архитектурные риски нужно озвучивать, выносить на обсуждение и предлагать не только «работающие на сейчас», но и масштабируемые решения.

Как разработчикам нам обычно говорят: «давайте максимально быстро и топорно соберём proof‑of‑concept (PoC)». Мы собираем PoC на костылях, а дальше слышим: «отлично, теперь давайте из этого сделаем MVP». Времени на переорганизацию и реинжиниринг архитектуры никто не даёт. В итоге недели и месяцы работы превращают проект в тупиковую поделку — груду классов, методов и промптов, к которой страшно прикасаться.

С LLM эта история становится ещё болезненнее. В работе у меня было несколько показательных проектов с LLM в роли основного движка (RAG, Q&A‑системы), на которых я очень наглядно увидел, как делать не стоит. Эти «шишки» превратились в набор антипаттернов проектирования LLM‑приложений, о которых я хочу поговорить в серии статей.

В этой части — антипаттерн взаимодействия с LLM, когда модель игнорирует контекст: важные детали промпта, куски документов и даже прямые инструкции.

Представьте ситуацию: вы даёте модели текст, в котором прямо содержится ответ на вопрос, но она отвечает что‑то совсем не то. Вы прописываете инструкции, как именно нужно вести диалог и решать задачу, но они стабильно игнорируются. Вы добавляете новые чанки с данными, дописываете всё более подробные правила и уточнения — а качество ответов только падает.

@PatientZero 26 ноя в 11:08

Почему агенты НЕ пишут основную часть нашего кода

Простой

8 мин

6.1K

Тестирование IT-систем * Искусственный интеллектМашинное обучение * Программирование *

Перевод

Наша компания Octomind занимается созданием ИИ-агентов, но её кодовая база по-прежнему в основном пишется людьми. Мы любим LLM и используем их везде, где можем, от нашего продукта до внутренних рабочих процессов. Но, несмотря на весь хайп, ситуация далека от того, чтобы агенты писали большую часть нашего кода.

У нас есть веские причины на то, чтобы пока не присоединяться к таким компаниям, как Anthropic (генерируется 80%), Microsoft (30%) и Google (25%).

‍‍Пока нам недостаёт в них некоторых жизненно важных элементов. В статье мы расскажем, почему это важно, и что нужно, чтобы закрыть эту нехватку.‍‍

2 3 ...

474 475

Машинное обучение *

Qwen3Guard: следующий шаг в модерации и контроле контента

Новости

Kandinsky 5.0: линейка open-source моделей генерации изображений и видео нового поколения

«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

Как прошла международная конференция ISKE 2025 в области AI и ML

ИИ-ассистент в M42: как мы в Авито ускорили построение графиков и увеличили аудиторию в Trisigma

DeepSeek-OCR + LLama4 + RAG = Революция в мире агентного OCR

Предопределённые векторы для обучения нейросетей с экономией памяти

AI-агенты в аналитике: как я разработал два production-проекта за неделю

Нейро-дайджест: ключевые события мира AI за 4-ю неделю ноября 2025

Как я тестирую крупные системы, которые невозможно протестить на статичных данных

+30% к скорости написания автотестов и сотни чек-листов в день: как мы внедряем LLM в QA

Долгая дорога к DiT (часть 3)

ChatGPT бесполезен? Я взломал мозг ИИ с помощью простого графа. Теперь он учится сам, и это пугает

Ближайшие события

AI Routing Lab: машинное обучение для оптимизации сетевых маршрутов

DAT: новый способ гибридного поиска в RAG с динамической настройкой альфа-параметра

Топ-10 бесплатных нейросетей для создания и редактирования фото

MAESTRO — новый фреймворк для построения мультиагентных систем и цифровых ассистентов на основе LLM

Как «Спортивный помощник» на NLU закрывает более 80% обращений в чате

Антипаттерн LLM-приложений: Когда модель игнорирует контекст. Часть 1

Почему агенты НЕ пишут основную часть нашего кода

Вклад авторов