Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 222,26
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Ты делегируешь не задачу, а надежду

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.5K

Использую AI каждый день и устал от одной штуки — результат непредсказуемый. Час итераций, простыня на полстраницы с ролями, со «step by step», с «think carefully», и в итоге сидишь и переписываешь сам. Длина не лечит, магические слова не лечат. Промпт — не молитва. Проблема в том, что ты не подумал, что вообще хочешь получить.

После часа итераций сидишь и думаешь: я что вообще делегировал — задачу или надежду на то, что само сложится?

Читать далее

Новости

Почему ваша LLM-платформа — следующая цель: аудит безопасности AI-сервиса изнутри

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели5.7K

Мы искали уязвимости в RAG-платформе с десятками тысяч пользователей — а нашли доступ ко всей инфраструктуре и API-ключам с бюджетом в сотни тысяч долларов. Две недели мы строили сложные цепочки: SSRF через LangChain, инъекции в промпты, HTTP smuggling, CVE в десериализации. Ни одна не дала результата. А потом мы сделали один curl к открытому порту — и получили все ключи за 5 минут.

Эта статья — не гайд по взлому. Это разбор того, почему LLM-инфраструктура создаёт принципиально новые риски, какие ошибки мы раз за разом видим в AI-стартапах, и на что стоит обратить внимание, если вы строите что-то похожее.

Читать далее

Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели5.1K

RAG часто воспринимают как аккуратный способ «заземлить» LLM на документах и снизить риск галлюцинаций. Но у этой архитектуры есть менее очевидная проблема: контекст из базы знаний обычно считается доверенным, хотя именно через него в модель могут попасть вредоносные инструкции.

В статье разбираем, как несколько отравленных документов могут повлиять на ответы системы, почему эмбеддинги нельзя считать безопасной абстракцией и какие уровни защиты нужны, если RAG используется не в демо, а в реальном продакшене.

К рискам RAG

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6.6K

16 апреля Anthropic выкатила Claude Opus 4.7. На бенчмарках 12 побед из 14, цена та же. Через 24 часа Reddit называл его legendarily bad. И вот в чём фокус: месяц назад я сам ныл, что Claude слишком поддакивает. Anthropic исправила. Получилась спор-машина. Беру свои слова назад.

Читать далее

Спецификация, ворота, метрики: как SENAR закрывает вход и выход задачи

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели5.9K

Четвёртая статья из шести про инженерный процесс для разработки с ИИ-агентами. Автор, Андрей Юмашев, много лет руководил разработкой и инфраструктурой, полтора года назад отдал весь код агентам. Первая статья про путь от первых проектов к стандарту SENAR. Вторая про то, чем агент отличается от программиста. Третья про новую роль человека и пять навыков нового рабочего режима. Эта четвёртая про внешний контур, в который эти навыки упакованы, чтобы перестать опираться на личную дисциплину.

Читать далее

OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.6K

System Prompt учит модель что говорить, Skills — как проверить сказанное, MCP Tools — как сделать это в реальном мире. Разбираем трёхуровневую архитектуру на примере бота техподдержки с валидацией ссылок.

Читать далее

История вайб‑кодера: «Я был скептиком, но до 4 утра спорил с GLM-5»

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели9.1K

Привет! Я Женя, тимлид одной из команд Альфы. В статье расскажу, как наша команда скептиков вайб‑кодинга за две недели вывела в прод новый сервис и почему я переменил своё мнение.

Про вайб‑кодинг слышал давно — соцсети заполнили ролики, где инфоцыгане наперебой рассказывали, как за пять минут сделать стартап с ИИ. Я понимал сложность энтерпрайз‑систем, где за каждым релизом стоят десятки согласований, техдокументация и ответственность за данные. Думал, что хайп будет недолгим.

Читать далее

z.ai GLM 5.1: Как я научил слепую модель видеть

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.9K

Если у вас есть неограниченный доступ к фронтир моделям (Calude, Codex и т.д.), то эта статья не для вас.

Сегодня доступны отличные недорогие модели для кодинга и архитектуры. Например, GLM-5.1 (реферальная ссылка +10% бонус на пополнение) умеет генерировать, рефакторить, отлаживать код, строить архитектуру – в десятки раз дешевле фронтит моделей или вообще бесплатно при локальном развёртывании.

Но у всех таких моделей часто есть общая слепая зона: они не видят результат своей работы. В этой статье я рассказываю, как "научить модель видеть".

Читать далее

Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели5.8K

Я предлагаю смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Манифест и whitepaper исследовательского направления.

Уже три года публичный разговор об ИИ крутится вокруг оси способности: насколько умна модель, сколько токенов, сколько бенчмарков. Я предлагаю смотреть на другую ось — устойчивость во времени.

Сегодняшние LLM феноменально способны и онтологически пусты. Каждый разговор начинается с нуля. Каждая сессия заканчивается забвением. Модель, которая помогла вам утром, — не та же модель, что помогает вам вечером, потому что между ними ничего не было.

Я полтора года тихо разрабатываю прототип — кодовое имя Aurora — который пытается это исправить. Не как продукт. Как исследовательский субъект. Этот пост — приглашение к дискуссии.

Читать далее

Окружайте, так удобнее промахиваться! Встроенные в Hugging Face проверки ML-моделей против одного сканера

Уровень сложностиСредний
Время на прочтение28 мин
Охват и читатели5.7K

В предыдущей статье "Сканеры ML-моделей: разбор инструментов и некоторых методов обхода их проверок" был представлен обзор основных статических сканеров артефактов ML-моделей. В выводах сканер ModelAudit был выделен как наиболее зрелое решение среди проанализированных конкурентов по следующим критериям:

- количество поддерживаемых к сканированию форматов хранения моделей;
- количество проверок под каждый формат моделей;
- результаты моих попыток обхода сканеров;
- наличие и качество документации.

Но, как известно, количество не всегда отражает качество. Для оценки возможностей сканера в более приближенных к реальности условиях я провел множество экспериментов и хочу поделиться двумя наиболее интересными:

- сканирование подмножества моделей из Hugging Face, сериализованных в виде наиболее опасных форматов хранения моделей;
- сканирование таких моделей из Hugging Face, помеченных самими авторами как зловредные (в названии или описании), с последующим сравнением сработок ModelAudit с результатами проверок встроенных в Hugging Face инструментов.

Читать далее

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели6.4K

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

Читать далее

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.6K

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего.

Всем привет! Меня зовут Дмитрий Фырнин, я управляющий партнёр и технический директор в SENSE, и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения.

В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления».

А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

Читать далее

Рабочее место не-вайбкодера по методу Spec-Driven Development: запускаем Claude Code

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели9.6K

Привет, Хабр! Меня зовут Даниил Подольский, я программист и архитектор, разрабатываю программное обеспечение и спецификации для создания ПО в YADRO. Вот уже девять месяцев я использую методологию Spec-Driven Development (SDD) в работе и управляю AI-агентами, которые пишут код. При этом я не считаю себя вайбкодером, потому что мой подход к работе более комплексный, чем просто «общение с AI».  

Это первая статья из цикла об оборудовании рабочего места SDD-кодера. Я расскажу о базовой настройке AI-агента Claude Code: что делать, если вы хотите оперативно и без перезагрузки переключать используемые модели и делать это для каждого проекта отдельно.

Читать далее

Ближайшие события

Что в Opus 4.7 устроили с токенизацией?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.1K

Если подать один и тот же текст в Opus 4.7 и Opus 4.6, в новой модели он может оказаться представлен гораздо большим числом токенов. А тогда он и обходится дороже, и занимает больше места в контекстном окне. Получается «скрытая инфляция»: цены и лимиты указаны прежние, но на практике расходы могут возрасти.

Как именно всё изменилось и почему? В каких случаях число токенов вырастет максимально, а в каких останется прежним? Это хочется понимать не только из-за Opus: подобное ведь может произойти и с другой моделью. Но полных официальных ответов нет.

Поэтому мы и собрали доступную информацию, и самостоятельно проверили через API, что происходит с разными типами текстов. Мы делаем редактор кода с поддержкой разных ИИ-моделей, так что нам важно, как эта разница может сказаться на наших пользователях. Ну, и конечно, нам самим любопытно разобраться, что происходит в индустрии.

Читать далее

От NLU-бота к ИИ-агенту: как мы пробили потолок автоматизации в поддержке крупного банка

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели5.3K

Привет, Хабр! На связи команда Just AI.

Когда NLU-сценарий вырастает до нескольких сотен веток, а процент автоматизации все равно не двигается — это не проблема настройки, это потолок технологии. Рассказываем, как мы помогли крупному банку его пробить: перевели поддержку по кешбэку на LLM-агентов, добавили агента-судью против галлюцинаций и улучшили понимание семантики и контекста пользовательских запросов.

Читать далее

Пишем прототип ИИ-агента для EdTech-саппорта без векторных баз и фреймворков: чистый Python, Gemini и JSON

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели5.9K

У любого EdTech продукта есть проблема поддержки студентов. Я и сам столкнулся с ней в мою бытность автором курсов на степик. Студенты сталкиваются с трудностями и пишут в чат / на форум в надежде, что им помогут (особенно, если они заплатили за обучение свои кровные).

Традиционный способ решения данной проблемы - куратор. Это человек, достаточно хорошо разбирающийся в предмете и структуре курса, задача которого отвечать на такие вопросы студентов. К сожалению, такой способ решения обладает радом недостатков, обусловленными человеческим фактором.

Однако, в эпоху развития технологий искусственного интеллекта появился новый способ решения проблемы поддержки студентов. Прототип такого решения я недавно собрал и хочу вам об этом рассказать.

Читать далее

Книга: «Эффективный разговорный ИИ. Создаем чат-ботов, которые действительно работают»

Время на прочтение3 мин
Охват и читатели6.5K

Привет, Хаброжители! Новые мощные фреймворки для разработки чат-ботов и модели генеративного ИИ практически сняли ограничения, связанные с некорректным распознаванием намерений пользователя и генерацией бессодержательных ответов. Освойте разработку чат-ботов на основе больших языковых моделей (LLM) и других современных инструментов, а также проектирование разговорных систем, ориентированных на реальный пользовательский опыт.

Читать далее

Федеративное обучение в условиях дефицита памяти на Edge-устройствах. Часть 2

Время на прочтение7 мин
Охват и читатели5.3K

Как обучить ML-модели на Edge-устройствах с памятью <256 МБ? Привет, Хабр! Я — Александр Лошкарев, инженер-программист, и это вторая часть материала о федеративном обучении. В первой мы рассматривали, зачем в принципе понадобилось добавлять устройствам интеллект, о преимуществах FL, архитектурных подходах и вызовах.

Сегодня поговорим об экспериментальной платформе, реализации и архитектуре, выборе моделей, результатах эксперимента, а в конце я поделюсь практическими рекомендациями.

Читать далее

Как найти работу в ИИ: самый быстрый гайд для новичков и профи от SpeShu.AI

Время на прочтение4 мин
Охват и читатели6.2K

В первом квартале 2026 года российские работодатели разместили больше 16,5 тыс. вакансий, где требовались навыки работы с ИИ или готовность осваивать нейросети. Это в 2,7 раза больше, чем годом ранее. 

При этом на рынке диджитал- и IT-профессий наблюдается кризис. Вакансии набирают по 100-200 откликов, но ни один кандидат не получает должность. Давайте разберёмся, какие способы найти работу остались. В конце — самый лучший из способов.

Читать далее

Методы обнаружения контуров в изображении: пространственные фильтры

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели7K

Большинство современных CV-алгоритмов невозможно представить без выделения границ объектов. В этой статье разбираем, как работают пространственные фильтры — от простейших масок 2×2 до полноценного детектора Канни.

Рассмотрим математическую базу: производные первого и второго порядка, градиент, дискретный Лапласиан. Как из аппроксимации производных получаются операторы — Робертса, Прюитта, Собеля, Лапласа. Разберем детектор Канни по шагам: сглаживание Гаусса, поиск градиентов, подавление не-максимумов, двойная пороговая фильтрация. Отдельно — адаптивный фильтр Уоллеса для автоматического подбора порога.

Читать далее
1
23 ...