Обновить
80.08
red_mad_robot
№1 в разработке цифровых решений для бизнеса
Сначала показывать

Контроль против гибкости: два подхода к созданию AI-агентов

Время на прочтение9 мин
Охват и читатели12K

Привет! Меня зовут Женя Орлов, я руковожу NLP-разработкой в red_mad_robot. Мы экспериментируем с мультиагентными системами и изучаем, как LLM ведут себя в разных архитектурах. В процессе накопилось много наблюдений и рабочих инсайтов — хочу поделиться тем, что помогает нам при проектировании AI-агентов. 

В последнее время внимание инженеров и исследователей привлекают агентные архитектуры — системы, где LLM координирует работу внутренних инструментов и других моделей. Разберём два основных подхода к построению агентных систем. 

Читать далее

Schema-Guided Reasoning: как научить языковые модели последовательно рассуждать

Время на прочтение10 мин
Охват и читатели10K

LLM умеют многое: генерировать тексты, анализировать документы, писать код. Но на практике их работа часто непредсказуема — сегодня модель даёт точный ответ, а завтра на тех же данных ошибается, пропускает ключевые шаги или придумывает факты.

Для AI-инженеров это системная проблема. Возьмём автоматизацию документооборота: нужно классифицировать договоры, извлекать реквизиты, проверять стандарты. Но модель работает как лотерея — результат не поддаётся логике или меняется при повторном запуске с одинаковыми данными. Как встроить такой результат в бизнес-процесс?

Для решения этой задачи появился подход Schema-Guided Reasoning (SGR). Его активно продвигает Ринат Абдуллин в материалах по работе с LLM. Идея проста и эффективна: заставить модель мыслить не хаотично, а внутри заданной схемы. Это не панацея, но SGR серьёзно снижает количество ошибок, делает процесс прозрачнее, а также позволяет тестировать отдельные компоненты рассуждений.

Читать далее

Когда одного агента мало: практический кейс применения мультиагентной системы

Время на прочтение9 мин
Охват и читатели7.6K

Привет! Меня зовут Егор Козлов, я работаю NLP-инженером в red_mad_robot. Мы активно внедряем в бизнес AI-агентов — автономных и полуавтономных программных сущностей, которые самостоятельно выполняют задачи и принимают решения в интересах бизнеса. 

В статье расскажу о принципах работы AI-агентов — с особым вниманием к workflow-агентам и мультиагентным системам (MAS). И поделюсь практическим кейсом внедрения мультиагентной среды для автоматического анализа и исправления уязвимостей в коде.

Читать далее

Baidu и AI Search Paradigm: мультиагентная структура для интеллектуального поиска информации

Время на прочтение14 мин
Охват и читатели6.9K

Аналитический центр red_mad_robot продолжает разбирать ключевые исследования в сфере интеллектуальных систем и генеративного поиска. На этот раз рассказываем про архитектуру AI Search Paradigm от Baidu — новой системы интеллектуального поиска, построенной на LLM и мультиагентных методах.

Читать далее

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

Время на прочтение7 мин
Охват и читатели8.1K

Всем привет! Меня зовут Ирина, я NLP-инженер в red_mad_robot, занимаюсь научными исследованиями интерпретируемости LLM и анализом механизмов внутренних вычислений моделей, чтобы применять полученные результаты на практике. Например, сегодня хочу рассказать, как мы подошли к решению задачи детекции галлюцинаций LLM в RAG системах со стороны исследования графов размышлений модели — с помощью интересного фреймворка от Anthropic.

В статье поговорим, как использовать cross-layer transcoders и атрибуционные графы для детекции галлюцинаций в RAG системах. Рассмотрим пример реализации детектора на графах для анализа модели Qwen2.5-7B и практические примеры использования. Спойлер: на простой реализации получили точность детекции 85% на тестовом датасете.

Читать далее

Рынок цифровых AI-Компаньонов: эволюция, метрики и инсайты

Время на прочтение30 мин
Охват и читатели7.1K

Привет! Это Лиза Скрыль, продакт-менеджер в NDT by red_mad_robot. Мы исследовали рынок AI-компаньонов и хотим поделиться инсайтами о том, как формируется эта новая потребительская категория.

Читать далее

Все LLM в одном окне: как мы сделали AI-сервис Daisy

Время на прочтение5 мин
Охват и читатели9.2K

Знакомьтесь, Daisy — наш сервис для быстрого доступа ко всем передовым LLM. Он вырос из инициативы друзей, которым хотелось разобраться, какие пользовательские сценарии работают в GenAI и как сделать удобный AI-based UX. Начав с внутреннего исследования, мы открыли доступ к сервису для внешнего мира и увидели, что им начали активно пользоваться.

За полгода у Daisy — 300 тыс. пользователей, 5 тыс. DAU и более 3,5 млн обращений к моделям. Рассказываем, как мы пошли дальше простого доступа к LLM через API — и сделали полноценный AI-сервис со своим подходом к архитектуре и взаимодействию с пользователями.

Читать далее

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум

Время на прочтение7 мин
Охват и читатели6K

Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз это была архитектура CTM, вдохновлённая внутренней динамикой человеческого мышления. Теперь — метод, который помогает языковым моделям мыслить точнее уже на этапе выполнения запроса.

В работе представлены два подхода: AB‑MCTS и его расширение Multi‑LLM AB‑MCTS. Первый объединяет два принципа — уточнение уже готовых ответов и генерацию альтернативных, второй добавляет работу нескольких языковых моделей. Всё это чтобы научить модели «думать» одновременно глубже и шире.

Читать далее

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения

Время на прочтение43 мин
Охват и читатели2.9K

Аналитический центр red_mad_robot разобрал объёмную научную статью «Advances and Challenges in Foundation Agents» от группы исследователей AI из передовых международных университетов и технологических компаний.

Работа предлагает новый взгляд на текущее состояние и развитие «интеллектуальных агентов», которые могут адаптироваться к множеству задач и контекстов. Рассказываем, какие идеи лежат в основе Foundation Agents, с какими проблемами предстоит столкнуться, и что ждёт нас в будущем.

Читать далее

Собственный контент-фильтр на базе LLM: от эксперимента до стабильной системы

Время на прочтение5 мин
Охват и читатели1.6K

Привет! Меня зовут Миша Мартьянов, я инженер по исследованиям и разработке в red_mad_robot. Моя работа — искать новые идеи, проверять гипотезы и улучшать продукты. На этом пути иногда приходится изобретать уникальные решения. Например, мы создали собственный фильтр, чтобы отсеивать нежелательный контент с помощью LLM. Рассказываю, как мы к этому пришли и с какими сложностями столкнулись.

Читать далее

Continuous Thought Machine: как Sakana AI научила модель думать тиками

Время на прочтение12 мин
Охват и читатели1.4K

Аналитический центр red_mad_robot продолжает следить за архитектурными прорывами в мире AI. В этот раз — экспериментальная модель от команды Sakana AI, которая предлагает мыслить не в терминах слоёв, а в терминах времени. Их Continuous Thought Machine (CTM) — попытка встроить в нейросеть внутреннюю динамику, вдохновлённую человеческим мозгом.

Разбираем, как устроена архитектура, что такое «внутренние тики» и зачем нейросети синхронизировать собственные мысли — на примерах из CV, сортировки, Q&A и RL.

Читать далее

Открываем Konfeature, нашу open-source библиотеку для удобной работы с Feature Flags

Время на прочтение8 мин
Охват и читатели1.7K

Привет! Это Саша Таболин — старший android-разработчик в red_mad_robot. Мы создали открытую библиотеку Konfeature для оптимизации работы с Feature Flags и хотим поделиться нашей разработкой.

Читать далее

Топовые работы на ICLR 2025

Время на прочтение6 мин
Охват и читатели1K

Аналитический центр red_mad_robot продолжает обозревать топовые технологические конференции. В этот раз подготовили для вас инсайты с прошедшей в Сингапуре International Conference on Learning Representations (ICLR), посвящённой искусственному интеллекту и машинному обучению. 

На ICLR 2025 из более 3 тыс. работ наивысшие оценки получили 36 статей, из которых три были отмечены как «outstanding papers». Разберём выдающиеся, достойные упоминания и получившие высокие оценки работы этого года. 

Читать далее

Как мы челленджим бизнес в GenAI: от простых Naive RAG до workflow-агентских систем

Время на прочтение13 мин
Охват и читатели2.7K

Привет! На связи Валера Ковальский — руководитель направления искусственного интеллекта в red_mad_robot. В работе с AI-инфраструктурой мы постоянно тестируем различные подходы, чтобы создавать решения с реальной бизнес-ценностью.

В этой статье расскажу, как мы решаем задачи при внедрении AI-агентских систем: от классического RAG до сложных мультиагентных решений. Также поделюсь, с какими проблемами сталкиваемся при работе с большими данными — и как находим эффективные пути их решения.

Читать далее

Ближайшие события

MCP своими руками

Время на прочтение9 мин
Охват и читатели6K

Привет! Это Влад Шевченко, технический директор направления искусственного интеллекта red_mad_robot. Сегодня я хочу рассказать, что из себя представляет протокол MCP от Anthropic — для этого лучше всего создать его аналог собственными руками.

Эта статья предназначена для разработчиков, которые хотят глубже понять, как работает MCP, и научиться создавать подобные механизмы самостоятельно.

Читать далее

От стратегий гигантов до смелых инноваций: ключевые AI-инициативы с Mobile World Congress

Время на прочтение5 мин
Охват и читатели387

Аналитический центр red_mad_robot внимательно следил за событиями крупнейшей мобильной конференции, и собрал для вас самую суть: как именно AI меняет мобильную индустрию прямо сейчас и какие тренды определят её ближайшее будущее.

Mobile World Congress (MWC) в Барселоне традиционно задает тон развитию мобильных технологий на год вперед. В 2025 году выставка прошла под знаком тотального доминирования искусственного интеллекта. AI перестал быть просто модной фичей, превратившись в ядро стратегий ведущих игроков рынка. 

Читать далее

AI 2027: будущее наступает

Время на прочтение17 мин
Охват и читатели6K

Команда стратегических аналитиков red_mad_robot перевела и адаптировала отчёт AI 2027 от группы американских аналитиков с амбициозным прогнозом развития ИИ.

Мы сохранили все ключевые моменты и акценты в отчёте, чтобы вам не пришлось разбираться в десятках англоязычных источников, и при этом получилось подумать о будущем ИИ, нашем месте в нём и о том, насколько мы готовы к миру, где интеллект больше не принадлежит только человеку.

Читать далее

Как AI-агенты ускоряют работу девелопера: автоматизация данных и управление знаниями

Время на прочтение8 мин
Охват и читатели5.5K

Привет! На связи команда NDT by red_mad_robot. Рассказываем, как создавали смарт-платформу с двумя AI-агентами для группы компаний ФСК — одного из крупнейших российских девелоперов. Система автоматизировала работу с данными и значительно снизила нагрузку на сотрудников технической поддержки и коммерческого департамента.

Читать далее

design_vesna by red_mad_robot

Время на прочтение2 мин
Охват и читатели441

3 апреля в офисе red_mad_robot соберутся лидеры индустрии дизайна, чтобы обсудить, как совместить креативность с эффективностью, использовать AI для ускорения рабочих процессов и сделать дизайн по-настоящему живым.

В программе — четыре доклада от дизайн-лидов и креативных директоров компаний red_mad_robot, ecom.tech, SberDevices и Иви.ру. После выступлений — живое общение и нетворкинг.

Читать далее

Как McKinsey предлагает банкам извлекать выгоду из AI

Время на прочтение6 мин
Охват и читатели2.3K

Аналитический центр red_mad_robot перевёл исследование McKinsey о применении GenAI для банковского сектора. Помимо нового уровня автоматизации, AI поможет сделать банки более интеллектуальными, эффективными и финансово устойчивыми. Собрали для вас основные принципы построения AI-First банка, в конце вас ждёт пара полезных артефактов — ставьте лайки, если материал пригодится.

Читать далее
1
23 ...

Информация

Сайт
redmadrobot.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия