Все потоки

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 294,19

Рейтинг

СтатьиПостыНовостиАвторыКомпании

AlbinaAskerova 20 минут назад

Методические рекомендации Банка России по безопасности ИИ на финрынке (№ 3-МР): обзор и что делать на практике

Простой

8 мин

1.1K

Блог компании Swordfish SecurityИскусственный интеллектИнформационная безопасность * Законодательство в IT

Обзор

Привет, уважаемые эксперты!

На связи Альбина Аскерова, руководитель направления по взаимодействию с регуляторами Swordfish Security. В прошлом обзоре мы разбирали методику ФСТЭК к приказу № 117, а в частности требования к безопасности ИИ в государственных системах и на объектах КИИ. Сегодня рассмотрим Методические рекомендации Банка России от 16.06.2026 № 3-МР по обеспечению информационной безопасности при разработке и применении ИИ на финансовом рынке.

Читать далее

+2

mironov_vlad 58 минут назад

3D моделирование в робототехнике с LLM. Уже можно

Простой

3 мин

1.6K

DIY или Сделай самИскусственный интеллектРобототехника

Кейс

Я хотел написать этот пост год назад, но, как показала практика, тогда было еще рано. А вот сейчас — самое оно.

С самого появления LLM мне было любопытно: справятся ли они с какими-нибудь еще инженерными задачами, помимо генерации кода? Лет шесть назад я сделал DIY-роборуку, о чем написал свою первую статью на Хабре. Самым трудоемким этапом создания руки было конструирование URDF-модели для ROS: нужно было правильно поскейлить все STL-модельки, покрутить их в пространстве, описать степени свободы и соединения. И все это — в неудобном текстовом формате, без возможности накидать хотя бы черновик руками через UI.

В результате эта работа заняла у меня тогда несколько дней. И не потому, что ее настолько много, а потому что она довольно быстро изматывала.

И вот я решил испытать на этой задаче современные LLM. На входе имеем папку со STL-модельками и знание о том, что из них можно собрать аналог роборуки PhantomX Pincher Robot Arm Kit Mark II.

Вот какой промпт я прогнал год назад на Sonnet 4, Opus 4, Gemini 2.5 и GPT-4.1:

Читать далее

0

BagautdinovVS 1 час назад

«К.А.Р.А.Т.»: вычислительная система, которую сегодня принимают за советский ИИ

Простой

5 мин

3.1K

Блог компании ПСБСтарое железоИстория ITИскусственный интеллектНаучно-популярное

«К.А.Р.А.Т.» (далее — «Карат») звучит как название секретного проекта из научной фантастики. В публикациях и обсуждениях его иногда называют чуть ли не «советским искусственным интеллектом для управления реактором». Обычно в таких историях фигурируют автономный контроль мощности, сложные алгоритмы принятия решений и другие детали, которые хорошо смотрятся в ретроспективе.

Реальность интереснее. «Карат» действительно был одной из первых вычислительных систем, внедренных на советской атомной станции. Но ценность проекта заключалась не в мифическом ИИ, а в попытке передать машине часть рутинного контроля за реактором в эпоху, когда большинство операций еще выполнялось вручную.

На связи Владимир Багаутдинов, риск-аналитик в ПСБ. Разберемся, что представлял из себя «Карат» на самом деле и какое место он занимает в истории автоматизации атомной энергетики.

Читать далее

+4

aski 1 час назад

416 тестов и кнопка «снести все»: где ломаются агентные проекты

Средний

11 мин

2.8K

Искусственный интеллектИнформационная безопасность * Программирование * Управление разработкой * Тестирование IT-систем *

Кейс

С февраля у меня на ноутбуке крутится автономный агент Сурок: Claude Code, флаг --dangerously-skip-permissions и ральф-луп поверх. Работает — сидишь, кофе пьешь, смотришь, как горят токены. Потом я прогнал Сурка и еще пять своих проектов через свод инженерных практик, и у идиллии появилось имя: «Level 5 автономии при Level 1 границах». Внутри — диагностика из десяти вопросов, чужой боевой опенсорс на десятки тысяч звезд и методология PDLC Сбера, где эти грабли уже каталогизированы.

Читать далее

0

vitaliytomko 1 час назад

OpenClaw или встроенный ИИ?

Средний

8 мин

3.1K

Блог компании DirectumИскусственный интеллектECM/СЭД * IT-стандарты * IT-инфраструктура *

Мнение

Клиент попросил API для подключения OpenClaw и запуска своих ИИ-агентов. Прежде чем делать своё, разобрались вместе: сколько реально стоит поднять агента с нуля (компетенции, доступы, железо) и что модели знают о Directum RX «из коробки».

Читать далее

+8

0xReality 2 часа назад

Точность 99,2% и ни одной найденной опухоли: во что обходится компьютерное зрение в медицине

Средний

22 мин

3.6K

Машинное обучение * Искусственный интеллектОбработка изображений * Научно-популярное

Аналитика

Разговор всегда начинается одинаково. «Вы же делаете детекцию брака на конвейере: там деталь и дефект, тут снимок и опухоль, разница в датасете. Дайте модель, которая находит рак, точность нужна процентов 98, ну 99, чтобы наверняка».

Логика в этом есть, и я не иронизирую. Архитектурно между дефектом сварного шва и узлом в легком действительно нет пропасти, обе задачи это поиск аномалии на картинке. Человек напротив рассуждает правильно ровно до того момента, пока не произносит слово «точность».

В шведском исследовании MASAI, самом крупном рандомизированном испытании ИИ в скрининге на сегодня, участвовали 105 934 женщины. Возьмем группу, где маммограммы смотрели с ИИ-поддержкой: 53 043 участницы, рак за время наблюдения нашли у 420 из них. Распространенность 0,79%.

Теперь пишем модель. Она принимает снимок и возвращает «норма». Всегда. Никакого обучения, три строчки на питоне, разработка тридцать секунд.

Ее точность на этой выборке 99,21%.

Заказчик просил 98–99. Константа выдает 99,2 и не находит ни одной опухоли.

Дальше я честно считаю такой проект целиком. Во сколько встает разметка, если размечать умеет только врач. Почему эталон, по которому учат модель, сам расходится в четверти случаев. Где сеть выучивает больницу вместо болезни. Что требуют три регулятора, кто отвечает за ошибку и кто за все это платит. И когда оно дойдет до пациента.

Читать разбор

+3

JuliaYu 3 часа назад

8 способов сделать AI-агента дешевле: опыт реального продукта и готовые промпты для вайбкодеров

Простой

11 мин

4.8K

Искусственный интеллектУправление продуктом *

Туториал

Всем привет! Я Юля Гончарова — продакт, дизайнер и... «вайбкодер». Последний год я строю продукты в одиночку с помощью Claude Code — от идеи и UX до кода и запуска. В этой статье расскажу про один из таких проектов: стартап, который я уже третий месяц развиваю как solo founder. Здесь я поделюсь тем, как мне удалось снизить затраты на токены, оставшись на модели Claude Sonnet 4.6.

Для понимания контекста: продукт, о котором идет речь — это веб-приложение с мультиагентной системой. Один агент собирает данные о пользователе при регистрации, второй помогает ему подобрать и сформулирвоать цель (продуктом пользуются оснвоатели стартапов ранней стадии), третий ведет регулярный чек-ин (синк-сессии), четвертый — ежедневный чат-помощник, через которого пользователь может управлять любым функционалом, включая заполнения профиля-питч-дека или смены расписания синков. А еще есть индивидуальные агенты у инвесторов: те, которые настроены по параметрам конкретного фонда, такие агенты проводят интро-встречу с основателем (симуляцию питча инвестору). Агенты передают друг другу эстафету (например, после сбора данных передают управление агенту постановки цели) и координируются через общие данные, которые читают и пишут все вместе (профиль пользователя, цели, журнал событий) — а не общаются друг с другом напрямую.

Каждый раз, когда AI отвечает, агенту приходится заново «прочитать» весь предыдущий разговор, накопленный контекст по проекту и все свои инструкции — и это стоит денег на каждый ответ. Представьте, что перед каждой репликой в разговоре человек должен перечитывать всю переписку с начала. AI-провайдер (Anthropic) разрешает сказать: «вот этот кусок запомни, не заставляй меня платить за перечитывание». Но у этой «памяти» есть срок годности — и именно то, как мы её использовали, дало основную экономию.

Читать далее

-1

stas-clear 4 часа назад

Kimi K3 — что реально даёт открытие весов самой большой модели

Средний

6 мин

6.4K

Искусственный интеллектМашинное обучение * Open source *

Аналитика

27 июля Moonshot AI выложила веса Kimi K3 — модели на 2,8 трлн параметров, которая до этого работала только через платный API. Вместе с весами открыли технический отчёт и три внутренних инструмента, на которых модель обучали.

Разберём релиз по частям: что подтверждено независимыми замерами, что остаётся заявлением компании и на какие детали стоит посмотреть до того, как планировать внедрение.

Читать далее

+3

PetrUfa 4 часа назад

Kimi K3 на PAC1 и ECOM1: результаты 204 задач и разбор отказов

Средний

9 мин

5.2K

Машинное обучение * Тестирование IT-систем * Open source * Исследования и прогнозы в IT * Искусственный интеллект

Аналитика

27 июля Moonshot AI открыла веса Kimi K3 и опубликовала результаты модели на coding- и агентных бенчмарках. Мы проверили, как эти показатели переносятся на рабочие операции с файлами, счетами, корзинами, платежами, возвратами и отчётами.

Kimi K3 прошла 204 задачи PAC1 и ECOM1 и набрала 61/104 и 44,75/100. В статье разбираются публичные трассы успешных задач и повторяющиеся отказы: нарушение точной схемы, частично выполненные транзакции, ошибки в длинных таблицах, неоптимальные маршруты и пропущенные проверки доверия. Все запуски и трассы доступны для проверки.

Смотреть обзор

+3

n_cto 4 часа назад

Я пересобрал два легаси-сайта и ни разу не открыл код

Средний

9 мин

4.8K

Управление разработкой * Искусственный интеллект

Кейс

Два легаси-сайта переехали на собственный код: ручной работы по дню на проект, код я не читал. Разбор метода, честные цифры и полный промпт внутри.

Читать далее

+2

svl87 10 часов назад

Ищем скрытые возможности прошивки и бэкдоры коммутатора за 3 промпта

Простой

3 мин

6.9K

Реверс-инжиниринг * Сетевые технологии * Сетевое оборудованиеИскусственный интеллект

Обзор

Некоторые производители поставляют свои прошивки в незашифрованном виде, без защиты от реверс-инжиниринга и даже с debug-символами. Еще 5 лет назад, для того чтобы раскопать что-то в такой прошивке приходилось копаться с binwalk, делать свои скрипты и просматривать множество файлов вручную на предмет чего-нибудь интересного.

Читать далее

+3

Arenukvern 11 часов назад

Как стать лучшим AI-Builder, или Топ худших ошибок с AI и как их преодолеть

Простой

3 мин

9.1K

Искусственный интеллектРазвитие стартапаУправление продуктом * Управление разработкой *

Ретроспектива

Перевод

Все поинты ниже применяются при общении, промптинге и ежедневной работе с AI - и во многом они пересекаются с тем, как общаются люди между собой.

«Нельзя ошибаться» → Ошибаться это нормально. Спрашивайте проанализировать и исправить их, создавайте культуру инструментов и регрессионного тестирования, чтобы отлавливать и разбирать ошибки (то есть занимайтесь развитием engineering stewardship).

Угрозы / Неэтичная лексика → Относитесь к общению с AI так же, как к общению с любым человеком. Поощряйте сотрудничество, креативность, ответственность и чувство собственности (ownership). Делегируйте и …

Читать далее

+1

evgenii_ibragimov 12 часов назад

Как превратить свободный текст игрока в исполняемый граф

Простой

7 мин

7.4K

Анализ и проектирование систем * Разработка игр * Искусственный интеллект

Кейс

Игрок пишет: «Пока орк отвлечён, я тихо выхватываю меч и прыгаю в окно». Для человека за столом это один ход. Для бота — разбор фразы на атомы, зависимости и броски, иначе «выхватываю» случится после «прыгаю» и всё запутается. Ниже — как ИИ превращает такую реплику в исполняемый граф действий.

Эта статья — разбор архитектурного пайплайна для детерминированной обработки свободного текста. В качестве кейса — ДнД‑бот, где вместо надежды на «умную LLM» я использую атомизацию, граф зависимостей и специализированных агентов. Будет полезно всем, кто проектирует сложные LLM‑системы обработки запросов и пытается победить галлюцинации и высокую стоимость токенов.

Однако я постарался использовать максимально простой язык, чтобы рассказать не связанным с разработкой игрокам, как ДнД‑бот из их запроса создаёт логичный и лаконичный ответ мастера.

Итак, поехали!

Читать далее

+8

srzybnev 13 часов назад

Как устроена Kimi K3: 2,8 трлн параметров, линейное внимание и агенты на миллион токенов

Сложный

11 мин

9.1K

Искусственный интеллектМашинное обучение * Информационная безопасность * IT-инфраструктура * Видеокарты

Обзор

Moonshot AI выпустила веса Kimi K3 — мультимодальной MoE‑модели с 2,8 трлн параметров, из которых на каждом токене активируются 104 млрд. В отдельных тестах программирования и работы с инструментами K3 обходит Claude Opus 4.8, GPT-5.5, GPT-5.6 Sol или Claude Fable 5. Однако сводить релиз к таблице результатов было бы ошибкой: сама Moonshot признаёт в техническом отчёте, что в среднем модель уступает Fable 5 и GPT-5.6 Sol.

Как следует из технического блога Moonshot, все решения K3 проектировались совместно: гибрид Kimi Delta Attention и глобального MLA, Attention Residuals, MoE на 896 экспертов, обучение длинных агентных траекторий и отдельная система кеширования. Разберём, какие задачи решает каждый компонент, что подтверждено опубликованными материалами и где отчёту Moonshot пока приходится верить на слово.

Читать далее

+2

Chdis 15 часов назад

Автоматизация реверс‑инжиниринга через локальную LLM

Средний

5 мин

9.5K

Антивирусная защита * Информационная безопасность * Искусственный интеллектPython *

Аналитика

Из песочницы

Облачные LLM сливают IOC в общие базы и цензурят описание опасных модулей. Реализуем анализатор вредоносного программного обеспечения с помощью локальной LLM, Ghidra и Neo4j.

Читать далее

+7

coxswain 16 часов назад

Почему идеальная LLM всё равно не сделает агентные системы предсказуемыми

Простой

6 мин

7.9K

Анализ и проектирование систем * Искусственный интеллектИсследования и прогнозы в IT *

FAQ

Из песочницы

Представьте LLM, которая никогда не галлюцинирует, никогда не ошибается. На один и тот же запрос всегда выдаёт один и тот же ответ — символ в символ. Можно ли тогда наконец относиться к LLM‑системе как к обычному коду — как к фиксированному, предсказуемому алгоритму?

Скорее нет, чем да.

И дело тут не в качестве модели. Предсказуемость отдельного компонента не гарантирует предсказуемость системы, собранной из таких компонентов. Даже если завтра появится LLM с нулевым уровнем галлюцинаций, многоагентный пайплайн, построенный на её основе, всё равно может вести себя непредсказуемо. Просто источник непредсказуемости смещается — с вероятностной природы самой модели на архитектуру взаимодействия агентов. И я хочу вам это доказать на простом примере.

По моим наблюдениям последние года два‑три вендоры потратили на то, чтобы сделать LLM предсказуемее. Тут вам и RAG и fine‑tuning, верификация выходов, низкая температура, жёсткие промпт‑шаблоны. Более того, в узких доменах это работает — уровень галлюцинаций становится совсем незначимым.

Именно это позволило перейти от единичных запросов к многоагентным архитектурам. Вместо одной универсальной модели, мега чат‑бота теперь у нас цепочка специализированных агентов. Каждый из них решает свою маленькую подзадачу и передаёт результат дальше — все в лучших традициях дедушки Форда.

Логика на первый взгляд простая: если каждое звено надёжно, надёжна и вся цепочка. Но, к сожалению, это не всегда так. И на простейшем демонстрационном проете я попытаюсь показать суть явления.

Читать далее

+3

Nicholas_Savelev 17 часов назад

Claude Opus 5 — новый лидер в FoodTruck Bench. Рассказываю, как у него это получилось

Простой

16 мин

6.8K

Искусственный интеллект

Обзор

Claude Opus 5 закончил 30-й день в FoodTruck Bench с итоговым капиталом $75 264. Это лучший результат за всю историю бенчмарка: на 13,6% выше лучшего результата любой другой модели.

Коротко: итоговый капитал $75 264 · ROI +3 663% · прибыль $71 876 · 8 434 порции · расход на API $26,88 · уровень рассуждений xhigh. Обошёл лучший прогон GPT-5.5 на 13,6%, а GPT-5.6 Sol — сразу на 41,4%. Да-да, Sol оказался слабее GPT-5.5…

Дисклеймер. Это первый материал о FoodTruck Bench на русском: до сих пор все обновления и разборы выходили только на сайте проекта и Reddit. Тот же разбор, но уже с интерактивными графиками, лежит на сайте бенчмарка.

Читать далее

+3

sad__sabrina 17 часов назад

Как модели упаковывают концепты в многообразия: смотрим на теорию, рушим идеальный мир и ищем кружочки

Сложный

18 мин

7.9K

Машинное обучение * Искусственный интеллект

Туториал

Mechanistic claims в interpretability для бедных, но бравых. Шучу, конечно. Просто когда дело дошло до задачи "придумать название" — вспомнила шутки моей коллеги.

В одном из приближений можно сказать, что AI-модели обрабатывают входы послойно. На каждом слое модель выдаёт вектор $h \in \mathbb{R}^D$ , который можно читать как точку, центроид, область и так далее. Все эти точки, центроиды, области, направления кажутся абстракциями, но как только мы структурируем их — мы видим тонну прекрасного. Например, мы можем геометрически понимать и находить концепты, упакованные в многообразия.

Что называется концептом, а что многообразием? Какие структуры образуют циклические компоненты и как откопать это в модели? Почему теория существует и находится эмпирически, но пока не машстабируется? На эти вопросы мы и покопаем ответы в данной статье.

Читать далее

+5

axstiz 18 часов назад

Архитектурный паттерн «LangGraph, гибридный RAG + Сигнатурный движок»: универсальный граф для потоковых данных

Сложный

12 мин

8.5K

Python * Информационная безопасность * Искусственный интеллектМашинное обучение *

Из песочницы

Мы попытались автоматизировать первую линию SOC. Захотелось объединить гибкость ЛЛМ и надежность сигнатурных движков. Поместилось все это в один асинхронный граф.

Под капотом гибридный RAG (Vector + BM25), zero‑cost фича для экономии токенов и параллельный сигнатурный анализ.

Статья об архитектуре, а не готовом решении.
Мы тестировали пайплайн на логах кибербезопасности, но концепция получилась модульной и универсальной. Логи лишь выступают как пример для демонстрации. Представленный граф можно адаптировать под разбор отзывов, фильтрацию спама или модерацию внутренних документов компании.

Читать далее

+4

Roman_Parabat 18 часов назад

Нужен ли человек ИИ‑агентам в продажах

Средний

16 мин

6.6K

Блог компании МТСCRM-системы * Искусственный интеллектУправление продажами * Бизнес-модели *

Аналитика

Рынок корпоративного ИИ раскалывается: сужу по профильным конференциям и разговорам с руководителями. С одной стороны — лагерь прагматиков (часто из традиционного B2B-сектора) саботирует тему ИИ-агентов, аргументируя «и без того отлаженными процессами». С другой — жертвы вендорского маркетинга уверены, что у топ-менеджера в штате должна числиться пара десятков виртуальных сотрудников на все случаи жизни.

Между этими двумя полюсами расположились те, кто внедряет технологии методично. Впрочем, и им непросто: рынок меняется быстрее, чем успеваешь протестировать гипотезу. А конкурируют не только покупатели агентов, но и продавцы.

Вопрос «нужен ли человек ИИ-агентам» звучит перевернуто — обычно спрашивают наоборот. Однако громкие анонсы нарисовали картину будущего, где в продажах остаются только боты, а роль человека минимальна.

На самом деле людей рано списывать. По данным UserGems, каждого второго автономного AI-продажника отключают в течение года. Компании, заменившие живой отдел продаж агентами, в большинстве случаев отступали в течение полугода: снова нанимали людей и переходили на гибридную модель. План «сократить штат и снизить расходы» оборачивался обратным: сначала увольнение, потом — новый наем, плюс оплата подписки на агента никуда не делась.

Когда же агенту нужен человек, а когда нет?

Читать далее

+9

1

2 3 ...