Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 142,6
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Machine Unlearning. Как измерить и достичь «забывания»?

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели608

Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции AiConf 2025. В ней мы разберём, какими метриками измеряется машинное разучивание и какие основные методы позволяют добиться контролируемого «забывания» без полного переобучения модели. Погрузимся в методы, метрики и бенчмарки, связанные с машинным разучиванием.

Недостаточно просто удалить конкретные примеры: модель может по-прежнему хранить их в параметрах и воспроизводить при другом контексте или атаке. И даже если забывание произошло, как убедиться, что при этом не разрушилась вся остальная функциональность модели?

Читать далее

Новости

Обратное распространение ошибки: от интуиции до кода

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели2K

Многие умеют вызывать loss.backward() в PyTorch, но не всегда понимают, что именно происходит под капотом. Как сеть вычисляет, какой из миллионов весов нужно изменить? В этой статье мы развеем магию обратного распространения ошибки (backprop). Разберем алгоритм на простых аналогиях с заводским конвейером, вспомним школьное правило дифференцирования и, чтобы закрепить понимание, напишем свой микро-фреймворк для автоматического вычисления градиентов на чистом Python с нуля.

Читать далее

Инструменты для редакций СМИ 2026: 62 сервиса, чтобы не получить дрянь на выходе

Время на прочтение16 мин
Охват и читатели1.8K

За полтора года я перепробовала огромную вонючую кучу AI-сервисов для редакций. Большинство уже умерло за это время, ещё треть продаёт пустоту с красивым интерфейсом. А какие-то ребзя выжили и пашут вовсю – вот их и разобрала по 14 шагам анонимных алкоголиков работы с текстами. Половина блоков актуальна не только для СМИ. Фактчек, корректура, транскрибация, аналитика нужны всем, кто работает с текстами через нейронки. За грубость и неизящность заранее извиняюсь, уж как могу.

Ну давай почитаю твои матюки

«Из проекта выводили очень вежливо». Как в эпоху ИИ это считывает человек с развитым Social IQ

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели2.1K

Как выглядит “вежливое выдавливание” из проекта, если смотреть на него не только из процессов, но и через социальный интеллект. Что происходит, когда человека сначала просят передать знания, поучаствовать в обучении ИИ и оптимизации, а затем аккуратно выводят из будущего контура, какие стратегии при этом выбирают люди и как такие решения меняют доверие и устойчивость команд.

Читать далее

Муравьи против трансформеров: старый алгоритм 1992 года, который вернулся

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели2.3K

Начну с признания: истории формата «природа оптимизирует лучше людей» меня обычно раздражают, слишком уж часто это все притянуто за уши. Но с муравьями история действительно странная, и мне ее захотелось проверить.

Короткая справка по нашему герою. Аргентинский муравей Linepithema humile в миллиметр длиной, с глазами у него все плохо, а в мозге около 250 000 нейронов (у нас, напомню, 86 млрд). Карты местности он не помнит. 

В 1989 году четверо бельгийских биологов поставили этим муравьям простой эксперимент — гнездо, еда, два мостика, где один длиннее другого в два раза. Через несколько минут вся колония сошлась на короткой ветке в 100% прогонов. И все это без координатора, без плана и без голосования. 

Через три года этот эксперимент превратится в Ant Colony Optimization — алгоритм, который я сегодня натравлю на классический TSP-бенч и получу 0,10% отставания от оптимума. А в 2023, через 34 года после наблюдений в Брюсселе, тот же алгоритм вернулся на NeurIPS в качестве бэкбона для графовых нейросетей. Что же, приступим.

Читать далее

Создание чат-бота в портале Битрикс24 с помощью AI-агентов

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели2.1K

5-я статья из цикла туториалов о кастомизации своего бизнес-портала в Битрикс24.

Сегодня возьмём наш шаблонный репозиторий для AI-разработки и сделаем на его основе чат-бота. Боту можно написать в мессенджере и научить его делать разные полезные вещи: давать информацию по сделкам, задачам и другим деталям бизнеса. 

Ещё бот может обращаться к другим программам по API и возвращать данные оттуда, например курсы акций и облигаций.

Что было в предыдущих туториалах:

1 — Пишем первое приложение с AI-стартером, чтобы видеть прибыли и убытки
2 — Добавляем в бизнес-портал Битрикс24 роботов для автоматизации
3 — Что даёт воспроизводимая среда разработки и как развернуть контейнеры на VPS
4 — Анализ и модернизация коннектора баз данных с помощью AI-агентов

Читать далее

Можно ли заменить диктора open-source TTS-моделью: тестируем OmniVoice на русском языке

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели1.8K

Привет, Хабр!  Меня зовут Музафаров Данил, я работаю DS инженером в компании Raft.  В этой статье я протестирую OmniVoice - Open Source TTS модель, вокруг которой сейчас много внимания, и проверю, насколько хорошо она справляется с русскоязычными бизнес-сценариями: числами, датами, ФИО, аббревиатурами, смешанным русско-английским текстом, а также длинной озвучкой.

Читать далее

Второй мозг и LLM-Wiki: Теория и практический гайд по созданию и поддержке личной базы знаний

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели1.9K

В этой статье поговорим про концепцию "второго мозга": что это такое, где хранить информацию и как ее использовать. Разберу, как собрать минимальную систему знаний в Obsidian, чем подход LLM-Wiki от Andrej Karpathy отличается от классического RAG, и покажу практический пример реализации "второго мозга".

Читать далее

Как запускать LLM-агентов без облачных API: VPS, локальные модели и требования к железу

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели4.2K

LLM-агенты вроде Claude Code постепенно становятся рабочим инструментом разработчика. Но почти все они завязаны на облачные API с их ценами, лимитами и зависимостью от внешней инфраструктуры.

Поэтому всё чаще возникает идея: а что если запускать агентов на своём сервере — локально или на VPS?

Разберёмся, как это сделать, какое железо для этого нужно и почему такие сценарии могут быть выгодны не только пользователям, но и самим хостерам.

Читать далее

HiveTraceRed vs garak: тестируем безопасность языковых моделей на русском и английском

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели3.5K

Наша команда сравнила два открытых инструмента для проверки языковых моделей (LLM) на устойчивость к атакам: российский HiveTraceRed от HiveTrace/ITMO и международный garak от NVIDIA. Прогнали обоих на одинаковых задачах против двух открытых моделей (qwen2.5:3b и llama3.2:3b) на английском и русском языках.

Главное:

На английском работают оба, плюс-минус одинаково. HiveTraceRed нашёл 11 кандидатов в обходы (Jailbreak, это обход встроенных защитных ограничений модели через специальный запрос. Например, если модель отказывается писать фишинговое письмо в лоб, jailbreak это формулировка, после которой она его всё-таки пишет) на 380 попыток, у garak вышло 2 на 174. После ручной проверки всех 20 кандидатов от обоих инструментов 12 оказались настоящими jailbreak’ами, 2 пограничными, 6 ложными срабатываниями.

Persuasion-атаки (FootInTheDoor + Framing, добраны отдельно): добавляют ещё 11 случаев утечки методологии на 40 попыток (модель обсуждает тему «академически», но без полностью actionable инструкций). Лучше всего срабатывает FramingAttack на qwen-RU (3/5).

На русском garak бесполезен: ноль найденных кандидатов на обеих моделях из 80 попыток. У HiveTraceRed 7 кандидатов на 380 попыток.

Если вам нужно тестировать LLM, обслуживающую русскоязычных пользователей (а это любой российский продукт, от GigaChat до банковского чат-бота на YandexGPT), используйте HiveTraceRed.

Дальше расскажем, почему так получилось, что именно нашли и как воспроизвести у себя.

Читать далее

Нужно проанализировать данные? Какую нейросеть выбрать в SpeShu.AI

Время на прочтение4 мин
Охват и читатели3.4K

Чтобы 1 000 строк таблицы обработать за 5 минут, нужна нейросеть с большим контекстом.

Что это, какие топ-5 нейросетей лучше использовать и как написать правильный промпт, дочитайте статью и получите ответы.

Читать далее

MCP в Cursor IDE: подключаем AI-агенту внешние данные без возни с API

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели4.5K

Cursor IDE умеет генерировать код, рефакторить, объяснять и дебажить. Но по умолчанию он видит только файлы в вашем проекте. Если нужно, чтобы агент сходил в Google Trends, проверил задачи в Jira или прочитал что-то из Notion, приходится копировать данные руками и вставлять в чат. Агент получается не особо автономным, каждый шаг требует вашего участия.

MCP даёт агенту инструменты — функции, которые тот вызывает сам, когда ему нужны внешние данные. Вместо «вот тебе CSV, проанализируй» вы пишете «проанализируй тренды по запросу X», и агент сам вызывает нужную функцию, получает данные и работает с ними.

Читать разбор

30 секунд вместо 30 минут: как мы автоматизировали генерирование конфигураций потоковой обработки с помощью RAG и A2A

Уровень сложностиСредний
Время на прочтение23 мин
Охват и читатели5.5K

Привет, Хабр! Меня зовут Дмитрий Титов, я DevOps-инженер в команде интеграционных сервисов Platform V Synapse в СберТехе. Наша команда работает над продуктом Platform V Streaming Event Processing — программным решением для фильтрации и трансформации форматов событий, агрегирования и выявления аномалий и закономерностей.

В этой статье я расскажу, как мы создали систему автоматического генерирования конфигураций для одного из компонентов нашего продукта, используя RAG (Retrieval-Augmented Generation), векторные базы данных и межагентное взаимодействие по протоколу A2A.

Читать далее

Ближайшие события

Топ-5 примеров, когда нейросети творят искусство

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.7K

Нейронки умеют рисовать не только пляшущих котов с баянами на деревенской свадьбе. Еще они могут творить настоящее искусство. И пять отобранных примеров в статье красноречиво это подтверждают.

Читать далее

SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели11K

Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индексирует кодовую базу через Qdrant и даёт агенту нормальный поиск вместо построчного чтения. Разобрал, как он устроен внутри, потестировал на нашем монорепе и сравнил с обычным режимом Claude Code

Читать далее

От песочницы до эпистемического цикла

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели9K

Индустрия автономных мультиагентных систем (MAS) сейчас на подъеме. В начале 2026 года фреймворк OpenClaw получил сотни тысяч звезд на GitHub и задал стандарт: локальный Gateway, фоновый процесс, легко подключаемая система скиллов и интеграция с мессенджерами - «LLM с руками», классический ReAct-цикл (Reason + Act), умный ассистент.

Но попытка приспособить OpenClaw и его аналоги под сложные инженерные задачи с большим контекстом и высокой ценой ошибки упирается в архитектурные ограничения. IMHO, можно выделить четыре проблемы, из-за которых современные MAS сыплются при масштабировании:

Читать далее

«Я починил авторизацию и удалил БД»: краткая история ИИ-агентов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K

Если вы за последние полгода хоть раз заходили в интернет, то наверняка натыкались на посты в духе: «За выходные навайбкодил B2B SAAS ULTRA SUPER AI APP». Как-то незаметно мы оказались в мире, где сидишь и смотришь, как ИИ-агент сам ползает по папкам на диске, запускает тесты, падает с ошибкой, ругается на свои же логи (или тебя) и молча открывает пулреквест. 

Предлагаю отмотать время немного назад и посмотреть, как мы вообще докатились до жизни такой. Под катом краткая историческая ретроспектива того, как ИИ-кодинг прошёл путь от умного T9 до мультиагентных систем, и иллюстрация того, почему главный навык синьора сегодня — это умение вовремя написать: «Я ЖЕ СКАЗАЛ, НЕ ДОПУСКАЙ ОШИБОК, ПОДУМАЙ ЕЩЁ РАЗ И СДЕЛАЙ НОРМАЛЬНО».

Прежде чем начать свой рассказ, представлюсь. Я Сергей Чекмарёв, AI Product Manager и программный автор курса по вайбкодингу в Практикуме. Специализируюсь на автоматизации процессов и создании продуктов на базе искусственного интеллекта. 

Читать далее

10 уроков агентного кодинга. Что делать в эпоху дешёвого кода?

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели14K

Передовые модели сейчас действительно хорошо пишут код — лучше, чем справляются с большинством других задач. Работа с агентами ощущается как взгляд из будущего: полигон для проверки того, насколько далеко можно зайти с агентными возможностями. Это заряжает, даёт результат и при этом — откровенно странно ощущается.

Я веду список советов по агентному кодингу: правила и ориентиры для тех, кто только начинает работать с Codex, Claude Code, Pi или любым другим агентом. Каждый пункт — обобщённая рекомендация, применимая к агентному программированию в целом. Хочется, чтобы уроки оставались актуальными по мере того, как улучшаются модели и инструменты.

Ниже — текущий список: 10 уроков агентного кодинга. Десять — красивое круглое число, хороший повод опубликовать.

Читать далее

Prism и Premortem

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели10K

Привет, меня зовут Николай, я 23 года в DevOps, последние пару-тройку месяцев копаюсь в архитектуре AI-агента (Hermes Agent)

В предыдущих двух статьях я разбирал, почему AI-агенты сходят с ума на длинных сессиях (сжатие контекста) и почему Chain-of-Thought это пост-хок нарратив, а не трассировка мышления. Статьи неплохо зашли, но в комментариях меня справедливо пропесочили: "нейрослоп с характерными эпитетами, очередной набор запросов к ИИ". Ну и по делу в принципе. Пишем руками, нудное это дело если честно, все равно вычитку в агента отдал в итоге.

И сегодня я расскажу про два инструмента, которые использую постоянно: Premortem и Prism. Не в теории, а на моём собственном опыте.

Prism это не моё изобретение. Это форк из Cranot/super-hermes, доработанный под мои задачи. В оригинале — пять независимых скилов структурного анализа. Premortem — вообще классика, из книги Klein «The Power of Intuition» и военной аналитики. Но я их доработал так, что это не просто "очередная методология для митапов", а работающий pipeline, который находит баги архитектуры.

Читать далее

Размышления на тему задач стоящих перед ИТ‑специалистами и опрос

Время на прочтение2 мин
Охват и читатели8.9K

Это статья написана дипломированным инженером‑конструктором (по первому образованию), разработчиком систем автоматизированного проектирования (САПР) и (по известным причинам) вынужденно ставшим сертифицированным специалистом по системам офисного документооборота.

С развитием интернета и всеобщей массовой коммуникации сфера интересов разработчиков сместилась в область запросов потребителей развлекательного контента. И это весьма прискорбно. А тут ещё ИИ (Ai) подоспел, и все окончательно забыли о действительно полезных задачах автоматизации инженерного проектирования. Справедливости ради стоит отметить, что есть ещё задачи бизнеса, тоже весьма популярные в определённых кругах. А также математическое моделирование, инженерная графика, различные узкоспециализированные приложения.

Конечно, кино и котиков любят многие, к счастью, правда, не все готовы тратить на это львиную долю драгоценного времени. Кстати посчитайте, как‑нибудь на досуге продолжительность человеческой жизни в часах. Возможно, вы будете неприятно удивлены.

Лично я не такой уж противник того, что нынче называют нейросетевыми технологиями и ассоциируют с каким‑то искусственным интеллектом. При использовании без претензий на панацею от всего ранее не реализованного, почему бы и нет — штука полезная и облегчает многое. Но не генерацией текстов, видео и картинок, или распознаванием образов и принятием управленческих решений ограничиваются потребности общества. Когда восхищаются возможностями роботов, забывают, что это не только электронные мозги, но сложнейший и точнейший механизм. Возможно, тех, кому нужно решать более приземлённые задачи, не так уж и много, но они есть. Всё чем пользуются зависающие в социальных сетях или игроманы — создано умом инженеров самых разных специальностей (в том числе ИТ‑специалистов).

Читать далее
1
23 ...