Поговорим на темы, которые обычно не обсуждают на публике. Как ошибаются ИИ во время обучения и почему это может неожиданно повлиять на продукт. Например, узнаете о таких случаях:
🔴 Как переобучение модели для борьбы с нежелательным контентом неожиданно затронуло неправильные категории,
🔴 Как эволюционировала функция размытия на изображениях,
🔴 Что случилось, когда при запуске новой модели «исчез» ценный список контактов,
🔴 Как ИИ начала спокойно рассказывать пользователю о грамматике мата,
🔴 Почему противодействие недобросовестным пользователям — это работа с неопределённостью, серыми зонами и очень дорогими ошибками.
Если вы DS- или ML-продакт, приходите на встречу, чтобы послушать яркие истории от специалистов из Авито и Яндекса, а после пообщаться и отдохнуть.
Дорожная карта Agentic AI. Level 4. Мастер примеров — few-shot и structured output
Level 4. Мастер примеров — few-shot и structured output
Есть один приём, который считаю самым недооценённым в работе с моделями: учить её прямо в промпте. Никакого файнтюна, никакого дообучения, никаких отдельных датасетов. Просто показываете несколько примеров «вход → выход», и модель подхватывает паттерн. Это называется few-shot learning, и на практике работает куда лучше, чем ожидаешь.
Где это реально работает
Лучше всего на задачах, которые повторяются и где у вас есть эталонные примеры. Берёте классификацию обращений клиентов: показали модели пять размеченных примеров, и она начинает раскладывать новые обращения по тем же категориям. Извлечение реквизитов из писем, парсинг характеристик товаров, разметка отзывов по тональности — всё это ложится на few-shot.
Срабатывает это не само собой. Когда не выходит, виноваты обычно сами примеры: они противоречат друг другу, покрывают не те кейсы, которые реально встречаются в жизни, или их нет вовсе, и модель просто гадает.
Три уровня, которые нужно понимать
Чтобы не гадать самим, нужно понимать разницу между режимами. На одном конце zero-shot: только инструкция, без примеров; на мощных моделях для простых задач часто хватает и этого. One-shot добавляет один эталонный образец и полезен, когда важен точный формат ответа. Ну а few-shot это уже от двух до десяти примеров; на практике 3–5 штук оптимум, потому что меньше даёт мало сигнала, а больше добавляет шум и лишние токены. Хорошую базу по технике даёт Prompting Guide, а про подход Claude подробнее в документации: multishot-prompting.
Что класть в примеры
С количеством разобрались. Сложнее вопрос качества: что именно должно быть внутри каждого примера. Основа это пара «вход → выход» без лишнего контекста и специфики конкретного случая, которая только шумит. Если задача нетривиальная, хорошо добавлять hints — короткую подсказку с логикой решения, почему именно такой ответ. И почти всегда работают анти-примеры: «так делать не надо, вот почему» — они помогают модели понять, где проходит граница.
Почему без structured output это бесполезно в бизнесе
Но даже с хорошими примерами остаётся вопрос: куда девать результат. В продакшене нужен не текст, а JSON строго по схеме: category: "техподдержка", priority: "высокий", responsible: "техотдел". Чтобы результат сразу ушёл в CRM, в базу, в следующий сервис: не придётся разбирать свободный текст руками. Примеры для few-shot делайте сразу в этом формате: так модель быстрее схватывает нужную структуру. Документация: OpenAI Structured Outputs, Claude Structured Outputs.
Поддержка у облачных моделей хорошая. С локальными аккуратнее: реализации у разных провайдеров отличаются, проверяйте под свою модель заранее.
По опыту, хорошие примеры в паре со structured output закрывают без файнтюна и без ML-команды огромный пласт задач на извлечение, разметку и классификацию.
Разобрали продвинутый few-shot на реальном кейсе: смотрите видео.
🔔 Следующая тема: RAG и векторные базы — как передать агенту знания о вашем бизнесе.
Есть мнение, что редизайн интернет‑магазина — это история про «освежить главную и поменять шрифты». Второй вариант — зачем менять, если и так работает. Но за внешним обновлением или скрепами почти всегда скрыт вопрос, протянет ли бизнес со своей текущей архитектурой еще год без потери клиентов. Привет, я — Александр Кузьмин, менеджер проектов в Morizo, на примере В2В‑магазина с оборотом в 1,5 млрд руб. расскажу, почему дизайн и архитектура в опте не работают как в В2С, а даже наоборот — приносят убытки.
Anthropic запустила dreaming в Claude Managed Agents (инфраструктура для запуска агентов в облаке) — фоновую процедуру, в которой агент в простое перебирает свои прошлые разговоры и переписывает свою память. Каждая сессия агента оставляет журнал событий и записи в его памяти. Когда сессий накапливается много, между ними по расписанию запускается dreaming: процедура читает эти записи, ищет повторяющиеся закономерности и обновляет память — стирает неактуальное, добавляет работающие приемы, складывает разрозненные факты в более общие правила. Можно настроить полностью автоматическое обновление, а можно — с ручным подтверждением каждого изменения. Доступ к функции пока выдают по заявке, она в режиме раннего превью.
«Тест Тьюринга» — это сокращённое название мысленного эксперимента 1950 года, который великий математик, логик, пионер компьютерной науки и криптограф Алан Тьюринг (1912–1954) назвал «Игрой в подражание». Он предложил его как практический способ в будущем ответить на вопрос: «Могут ли машины думать?»
Будущее уже наступило. И некоторым людям это не по душе.
Современные комментаторы, как правило, игнорируют (второстепенные) детали оригинальной игры Тьюринга и перефразируют его идею так: если вы общаетесь с машиной на расстоянии и после тщательного и длительного допроса считаете, что это человек, то можете считать, что она обладает сознанием. Уточним это определение: чем дольше, тщательнее и глубже ваш допрос, тем сильнее должна быть ваша уверенность в том, что объект, прошедший тест, обладает сознанием.
По состоянию продукта это скорее ранняя бета, местами почти альфа. Поэтому я не ищу пользователей, которые ждут готовый polished-сервис. Мне нужны люди, которым интересно покопаться в сыром продукте, найти баги, сломанные сценарии и непонятные места.
Большинство разработчиков очень боятся каждой ошибки в консоли Python. Всё моментально заливается красным, а порой понять суть ошибки без переводчика очень сложно. Сегодня я покажу, как сделать свою мини‑библиотеку для перевода всех консольных ошибок и предупреждений в Python. Это позволит сразу же понимать причину исключения и быстро вносить исправления в код. Проект подходит как для начинающих разработчиков, так и для опытных разработчиков, работающих со сложными библиотека или базами данных.
Среди синхронных двигателей с постоянными магнитами существует конструктивное разделение, которое на первый взгляд кажется деталью производства, а на самом деле определяет всю физику машины и логику её управления. Речь идёт о расположении магнитов в роторе: снаружи или внутри.
Двигатель с постоянными магнитами на поверхности ротора (SPMSM) — прост и предсказуем. Магнитный зазор равномерен, индуктивности по обеим осям одинаковы, момент создаётся единственным способом. Управлять им несложно.
Двигатель с интерполированными постоянными магнитами IPMSM (Interior Permanent Magnet Synchronous Motor) — устроен принципиально иначе. Магниты утоплены в тело ротора, что нарушает симметрию магнитной цепи. Возникает анизотропия: магнитное сопротивление ротора различается по двум взаимно перпендикулярным направлениям. Следствие — дополнительный источник момента, реактивный, существующий исключительно за счёт разницы индуктивностей по осям d и q.
Именно эта анизотропия делает IPMSM привлекательным для тягового привода. Широкий диапазон ослабления поля, высокая удельная мощность, возможность использовать реактивный момент для снижения токовой нагрузки — всё это следствие одного конструктивного решения: магниты внутри, а не снаружи.
Реализовать потенциал IPMSM позволяет стратегия MTPA — Maximum Torque Per Ampere. Она находит оптимальное распределение вектора тока статора между осями d и q: такое, при котором заданный момент достигается при минимальной амплитуде тока. Меньший ток — меньше потерь в меди, меньше нагрев, меньше нагрузка на инвертор.
В настоящей статье рассматривается физика анизотропии IPMSM, математическая модель машины в системе координат d‑q и стратегия MTPA как задача оптимизации с аналитическим решением. Модель реализована в системе моделирования Engee и верифицирована сравнением режимов FOC и MTPA на параметрах макетного образца IPMSM.
Авиакомпания «Аэрофлот» обновила правила провоза пауэрбанков на своих рейсах. Теперь их нельзя сдать в багаж и заряжать на борту, а один пассажир может провезти только два аккумулятора.
Anthropic объявила на конференции Code with Claude об удвоении 5-часовых лимитов в Claude Code для платных тарифов — Pro, Max, Team и seat-based Enterprise — а также о существенном повышении API-лимитов для Claude Opus. Источник дополнительных мощностей — суперкомпьютер Colossus, принадлежащий xAI Илона Маска (после слияния xAI и SpaceX в феврале 2026 года инфраструктура формально находится под крылом ракетной компании). О партнерстве написала корреспондент WIRED Лорен Гуд непосредственно с площадки мероприятия.
Чтобы интегрировать ИИ в процессы, российскому бизнесу нужен провайдер API, который сможет заключить официальный договор и принять оплату рублями. Как такого найти и подключить и что это даёт бизнесу?
Пользователь Куинн Нельсон показал процесс обновления прошивки с версии 2.0.3 до версии 2.2.0 своего ультразвукового ножа Seattle Ultrasonics C-200. «Я просто обновляю прошивку на своём кухонном ноже…», — пояснил Нельсон. Стоимость C-200 составит $400.
Разработчики блокчейна Solana в сотрудничестве с Google Cloud представили Pay.sh — сервис, который позволяет оплачивать ИИ-услуги автономно с помощью ИИ-агентов.
ИИ приходит на помощь, чтобы врачи могли сосредоточиться на главном, а не на бесконечном заполнении справок и бумажек. Поговорим о применении ML в медицине с парой интересных кейсов.
Microsoft ответила на вопрос о том, сколько оперативной памяти на ПК достаточно для игр в 2026 году. Компания заявляет, что 16 ГБ по-прежнему считается базовым объёмом, но 32 ГБ — «беспроблемный» апгрейд, если геймер использует Discord, браузеры или стриминговые сервисы одновременно с играми.
Да, простите меня ребята, но ко мне пришел автор курса из прошлой статьи и сказал, что все понял, учел поправил и даже GUI навалил. Так как я ранее приобретал курс, обновление получил просто так. Учитывая, что прошлая статья для многих оказалась полезной, я решил дополнить обзор новой — полезных изменений достаточно много.
Список «хочу прочитать» давно перевалил за сотню. Когда наконец добираешься до книги — появляется другая проблема: хочется зафиксировать цитату или мысль, но непонятно куда. Заметки в телефоне, вкладка в браузере, стикер на полях — через месяц это всё теряется. Обычный подход «одна заметка на книгу» не работал: либо файл разрастался до неприличия, либо я просто забывал его открывать. Тогда я перестал искать «правильный» плагин и спроектировал систему с нуля в Obsidian. В этой статье я покажу архитектуру, реальные шаблоны и конфигурацию баз данных — так, чтобы это можно было повторить.
Серия о том, как создать радар для отслеживания дронов продолжается. Мы уже рассмотрели модулированные по частоте сигналы и увидели, как можно определить расстояние. Но на графиках было много помех. И из-за них сложно было выделить реальные цели. Поэтому нужно понять, что считать помехами, а что реальными целями.
В Японии игровые движки Unreal Engine и Unity начали использовать в различных сферах: от компаний по городскому развитию и агентств по планированию действий в чрезвычайных ситуациях и заканчивая работающими с потребителями, такими как знаменитый универмаг Daimaru Matsuzakaya.
TL;DR: Sentry дедуплицирует backend‑ошибки по хешу (error class + top stack frame + module). Для UI‑багов этот рецепт ломается — у expect(button).toBeVisible() нет stack frame в продуктовом смысле, есть локатор + assertion + URL. В webtest‑orch я собрал composite SHA-256 fingerprint из (normalized_selector | assertion type | error class | URL template | message[:80]) с тремя rules нормализации (:nth-child, UUID, /users/123 → /users/:id). Это даёт стабильный 8-hex BUG-id который выживает прогоны и даёт diff new / regression / persisting / fixed без БД и embedding«ов.»