Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 119,61
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6.6K

Привет, Хабр! На связи команда Just AI.

Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

Читать далее

Пишем прототип ИИ-агента для EdTech-саппорта без векторных баз и фреймворков: чистый Python, Gemini и JSON

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели7K

У любого EdTech продукта есть проблема поддержки студентов. Я и сам столкнулся с ней в мою бытность автором курсов на степик. Студенты сталкиваются с трудностями и пишут в чат / на форум в надежде, что им помогут (особенно, если они заплатили за обучение свои кровные).

Традиционный способ решения данной проблемы - куратор. Это человек, достаточно хорошо разбирающийся в предмете и структуре курса, задача которого отвечать на такие вопросы студентов. К сожалению, такой способ решения обладает радом недостатков, обусловленными человеческим фактором.

Однако, в эпоху развития технологий искусственного интеллекта появился новый способ решения проблемы поддержки студентов. Прототип такого решения я недавно собрал и хочу вам об этом рассказать.

Читать далее

Книга: «Эффективный разговорный ИИ. Создаем чат-ботов, которые действительно работают»

Время на прочтение3 мин
Охват и читатели7.8K

Привет, Хаброжители! Новые мощные фреймворки для разработки чат-ботов и модели генеративного ИИ практически сняли ограничения, связанные с некорректным распознаванием намерений пользователя и генерацией бессодержательных ответов. Освойте разработку чат-ботов на основе больших языковых моделей (LLM) и других современных инструментов, а также проектирование разговорных систем, ориентированных на реальный пользовательский опыт.

Читать далее

Федеративное обучение в условиях дефицита памяти на Edge-устройствах. Часть 2

Время на прочтение7 мин
Охват и читатели6.2K

Как обучить ML-модели на Edge-устройствах с памятью <256 МБ? Привет, Хабр! Я — Александр Лошкарев, инженер-программист, и это вторая часть материала о федеративном обучении. В первой мы рассматривали, зачем в принципе понадобилось добавлять устройствам интеллект, о преимуществах FL, архитектурных подходах и вызовах.

Сегодня поговорим об экспериментальной платформе, реализации и архитектуре, выборе моделей, результатах эксперимента, а в конце я поделюсь практическими рекомендациями.

Читать далее

Как найти работу в ИИ: самый быстрый гайд для новичков и профи от SpeShu.AI

Время на прочтение4 мин
Охват и читатели7K

В первом квартале 2026 года российские работодатели разместили больше 16,5 тыс. вакансий, где требовались навыки работы с ИИ или готовность осваивать нейросети. Это в 2,7 раза больше, чем годом ранее. 

При этом на рынке диджитал- и IT-профессий наблюдается кризис. Вакансии набирают по 100-200 откликов, но ни один кандидат не получает должность. Давайте разберёмся, какие способы найти работу остались. В конце — самый лучший из способов.

Читать далее

Методы обнаружения контуров в изображении: пространственные фильтры

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели8.8K

Большинство современных CV-алгоритмов невозможно представить без выделения границ объектов. В этой статье разбираем, как работают пространственные фильтры — от простейших масок 2×2 до полноценного детектора Канни.

Рассмотрим математическую базу: производные первого и второго порядка, градиент, дискретный Лапласиан. Как из аппроксимации производных получаются операторы — Робертса, Прюитта, Собеля, Лапласа. Разберем детектор Канни по шагам: сглаживание Гаусса, поиск градиентов, подавление не-максимумов, двойная пороговая фильтрация. Отдельно — адаптивный фильтр Уоллеса для автоматического подбора порога.

Читать далее

Open source-экосистемы — как Сбер развивает GigaChain

Время на прочтение9 мин
Охват и читатели8.4K

Мне удалось пообщаться с Константином Крестниковым @Rai220, управляющим директором и техлидом команды GigaChain, которая занимается агентными системами и разработкой SDK для GigaChat в Сбере. Константин глубоко погружен в развитие экосистемы вокруг GigaChat, поэтому разговор получился подробным, богатым на примеры и управленческие инсайты.

Читать далее

Почему Chrome весит 7 000 Марио или как сжать «Змейку» в 1 000 раз

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели13K

На вашем диске лежит семь одинаковых моделей птицы Додо. Не благодарите — это ARK заботливо положил их вам в каждое DLC.

Раньше Super Mario Bros весила 40 КБ. Сейчас одно обновление Chrome — это ~7 000 таких Марио. Как мы дошли до жизни такой, и почему все идет по кругу?

В статье пройдем путь от тайлов NES до Neural Texture Compression и рассмотрим змейку в трех версиях: по трем вехам сжатия. Одна из них в 1 120 раз меньше первой. И это не та, в которой ИИ.

Читать далее

Epic Fail: Как долго протянут ИИ-детекторы

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.9K

БЯМы настолько преисполнились в познании наших письменных паттернов, что отличить их от человеческой писанины уже фактически невозможно. Разбираемся как до такого дошло, чем грозит и что делать.

Читать далее

8 из 10 людей пишут промпты неправильно. Гайд от учёных, чтобы выжить в 2026 году

Время на прочтение5 мин
Охват и читатели9.9K

66% руководителей в США заявляют, что не наняли бы кандидата без навыков работы с ИИ, а 71% отдадут предпочтение менее опытному кандидату с навыками ИИ, чем более опытному без них. Такие выводы появились в отчётах Microsoft и LinkedIn ещё в 2024 году.

В то же время «большинство пользователей использует инструмент плохо», заявила OpenAI в исследовании «How people use ChatGPT». А 73% всех запросов сформулированы бытовым языком, который нейросеть понимает буквально и ведёт себя как глупая жестянка.

Мы проанализировали исследования учёных в сфере машинного обучения и составили инструкцию, как писать промпты правильно и легко получать работу, несмотря на конкуренцию с ИИ.

Проверить себя на ошибки

Мета-работа, память агентов и Product Graph: почему AI не спасёт продукт без структуры знаний

Время на прочтение10 мин
Охват и читатели7.5K

За годы работы в разнообразных командах я много раз видел одну и ту же ситуацию.


Компания растёт, продукт усложняется, и в какой-то момент возникает естественное желание разбить всё на отдельные продуктовые команды. Каждая отвечает за свой кусок функционала, свою часть пользовательского пути, свою метрику, свой backlog. На бумаге это выглядит правильно: меньше зависимостей, больше автономии, быстрее принятие решений.


Но у такого подхода есть побочный эффект, о котором обычно говорят слишком поздно.
Знание о продукте начинает фрагментироваться.


Одна команда знает, почему была изменена логика онбординга. Другая помнит, какие ограничения есть у биллинга. Третья когда-то проводила исследование, из которого следовало, что пользователи вообще не понимают текущую модель прав доступа. Где-то это лежит в презентации. Где-то в Notion. Где-то в Confluence. Где-то в почте. Чаще всего — в голове конкретного человека.


Пока этот человек рядом, система вроде бы работает. Можно написать ему в Slack, позвать на встречу, спросить: «А почему мы тогда сделали именно так?» Он вспомнит, расскажет, иногда даже найдёт старую ссылку. Но стоит человеку уйти, сменить роль или просто перестать быть доступным, как часть продуктовой памяти исчезает вместе с ним.


И это не исключение. Это нормальное состояние большинства организаций.


Однажды в большой корпорации у нас сменился Product Owner. На первой встрече с новым PO я спросил, что ему передал предыдущий. Ответ был примерно такой: «Мы встретились, он рассказал мне, что к чему».

Читать далее

Как мы научили нейросеть экономить газ в нашем сталепрокатном цехе

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели11K

На станах горячего проката металлургического комбината ЕВРАЗ НТМК прокатывают заготовки разных марок стали. В начале цикла их разогревают в печах до температуры, позволяющей придать нужный профиль. Печей несколько, они различаются конструкцией, состоянием, горелками и износом футеровки — это теплоизолирующий материал. Путь заготовки до первой клети стана тоже разный. Ещё на процесс влияют особенности серий заготовок, сортамента сталей, температуры перед посадом, текущее состояние агрегатов, время перевалки, плановые и внеплановые остановы.

Раньше операторы регулировали температуру, время нагрева, расход газа вручную, полагаясь на общую инструкцию, свой опыт и состояние печи (износ футеровки, работу горелок). В разных сменах был разный расход газа: где-то тратили меньше, где-то больше. А при смене сортамента (у нас 80+ видов заготовок) перерасход был почти гарантирован из-за затянутых переходных режимов. Мы стали смотреть, есть ли тут потенциал для экономии топлива.

Меня зовут Андрей Зотов, я начальник департамента инноваций ЕВРАЗа. В этой статье расскажу, как решили эту задачу с помощью обученной на наших данных рекомендательной системы с сердцем в виде математической модели. Заходите почитать, как это устроено.

Читать далее

Как я строю рекомендательную модель фильмов: cold start, вектор вкуса и GPT

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели11K

Выбрать фильм на вечер сложно даже для одного человека.
А если фильм нужно выбрать для пары, где вкусы просто разные, задача становится ещё менее предсказуемой.

Обычные подборки, жанровые фильтры и списки “что посмотреть вечером” помогают только до определённого момента.
Они работают как витрина, но плохо работают как персональная рекомендация, потому что почти не учитывают зрительский опыт, индивидуальные предпочтения и то, какие фильмы человек вообще уже видел.

Именно с этой задачи я и подошёл к своему проекту NextFilm: не как к каталогу фильмов, а как к рекомендательной системе.
Основной вопрос звучал так: как выдать полезную рекомендацию новому пользователю, если на старте о нём почти ничего не известно.

По сути, в моём контексте это и есть cold start.
Не абстрактная проблема “мало данных”, а вполне прикладная ситуация: пользователь уже хочет получить рекомендацию, а система пока не знает, что он смотрел, насколько у него большая зрительская база и какие паттерны вкуса у него вообще есть.

Читать далее

Ближайшие события

Как я добавил в браузерного AI-агента поддержку MCP за вечер

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели12K

"Эта статья о том, как я n0x из просто болталки сделал агента который научился открывать браузер, делать скриншоты и выполнять команды

Вы когда-нибудь разговаривали с AI, и он в ответ на просьбу «открой Яндекс» писал вам: «Вот ссылка: https://yandex.ru»?

Я — да. И каждый раз мне хотелось сказать: «Спасибо, капитан Очевидность, я и сам это знаю».

Проблема в том, что большинство LLM-приложений — это просто болталки. Они генерируют текст, но не могут сделать что то полезное. А что, если бы AI мог управлять браузером? Открывать страницы, делать скриншоты, выполнять JavaScript?

В этой статье я расскажу, как добавил в проект n0x поддержку MCP (Model Context Protocol) — и научил AI-агента открывать сайты по команде «открой …».

Читать далее

OpenAI выпустила GPT-5.5 с акцентом на улучшение возможностей в области программирования

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели12K

OpenAI выпустила GPT-5.5, и это обновление выглядит довольно значительным, особенно если вас интересуют программирование, агенты и использование компьютеров.

Она лучше пишет код, более уверенно использует компьютеры и может выполнять больше задач, требующих автономной работы, без необходимости постоянного контроля с вашей стороны.

Модель уже доступна для пользователей тарифных планов Plus, Pro, Business и Enterprise в ChatGPT и Codex. Существует также более мощная версия под названием GPT-5.5 Pro, которая будет доступна пользователям Pro, Business и Enterprise.

Для разработчиков доступ к API указан как «coming soon». Печальной частью является цена. Она в два раза превышает цену за токен GPT-5.4, что, вероятно, станет предметом споров для многих разработчиков на этой неделе.

GPT-5.5 — это первый за долгое время релиз, который кажется чем-то большим, чем просто очередной номер версии.

По словам OpenAI, это первая полностью переобученная базовая модель со времен GPT-4.5. Скачок в тестах по агентному программированию, похоже, подтверждает это.

Давайте углубимся в детали.

Читать далее

SpaceX покупает Cursor, а Claude Mythos слили, угадав URL

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели19K

Седьмой выпуск еженедельных IT-новостей от OpenIDE: Anthropic выносит Claude Code из плана за $20, Duolingo перестаёт следить за потреблением ИИ сотрудниками, а четыре человека из Discord получают доступ к засекреченной модели просто потому, что правильно угадали адрес эндпоинта.

Читать далее

Голосовое управление роботом-перевозчиком паллет: что показал первый тест

Время на прочтение5 мин
Охват и читатели8.9K

Голосовое управление роботами часто выглядит как простая идея: человек произносит команду, робот ее распознает и выполняет действие. В бытовых сценариях мы уже привыкли к голосовым ассистентам, поэтому кажется логичным перенести тот же подход на складскую технику.

Читать далее

DeepSeek V4 vs Claude Sonnet 4.6: кто дешевле, кто умнее

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели10K

DeepSeek V4 в 3-4 раза дешевле Sonnet 4.6 на одинаковых задачах. На английских бенчмарках они почти равны, и интернет советует переходить на DeepSeek. Но что если прогнать обе модели на 50 типовых задачах российского разработчика? Разбор с цифрами и примерами.

Читать далее

Проектор, дрон, нейросеть: как технологии меняют работу в дизайне и оформлении пространств

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.7K

За 3 500 проектов по оформлению интерьеров мы прошли путь от малярной сетки до цифрового рабочего процесса.

Рассказываю, что реально работает, что оказалось пустышкой — и какие технологии изменят эту индустрию в ближайшие 5 лет.

Читать далее

DataCopilot: строим мультиагентную архитектуру для работы с корпоративным хранилищем данных и документацией

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели9K

Привет, Хабр! Меня зовут Максим Шакуров, я ML-инженер в VK.

Сегодня индустрия активно внедряет LLM для оптимизации рабочих процессов. Наша команда решила идти не от самой технологии, а от реальных потребностей. Чтобы найти процессы с наибольшим потенциалом для автоматизации, мы начали с аудита текущей рутины: проанализировали, с какими запросами аналитики и менеджеры приходят в чаты поддержки к инженерам Data Office (специалистам, отвечающим за сбор, хранение и миграцию корпоративных данных) и к разработчикам нашей платформы данных (команде, которая поддерживает и дорабатывает DWH).

Затем сформировали образ нашей будущей системы: она помогает ориентироваться в каталоге витрин, может рассказать, что и где хранится, помогает заполнить заявку на доступы, отвечает на вопросы по специфической документации и пишет скрипты, которые люди могут сразу забрать к себе в ETL-процессы. Под катом рассказали о том, что из этого вышло.

Почему рой, а не RAG