Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 156,32
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели237

Представьте: три топ-менеджера из крупных компаний садятся писать код. Не ставить задачи команде, не согласовывать архитектуру — а сами, руками, за восемь часов собрать работающую систему. И не просто систему, а ИИ-директора, который не сломается под давлением CEO. Спойлер: получилось

Рассказываем, почему обычный LLM в этой задаче «плывёт», как устроена архитектура устойчивости и что даёт single-shot reasoning там, где хочется городить мультиагентный пайплайн.

Читать далее

Новости

AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели1.4K

Сеньорам срезали зарплату на 10%. Рост зарплат в IT - минимум за 15 лет. При этом вакансий стало на 11% больше. Собрал американские и российские данные, посмотрел на Klarna, Block, IBM, BCG - и увидел паттерн, который назвал AI-дефляцией. Разбираю, что это значит для джунов, мидлов и сеньоров.

Читать далее

Мы отдали управление роботами OpenClaw. Что из этого вышло

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели1.1K

Началась новая эра – эра автономных агентов. Пользователь пишет запрос на естественном языке, и агент сразу решает поставленную задачу. Или не сразу. Но в таком случае он самостоятельно ищет способ получить недостающие навыки для выполнения запроса.

Привет, Хабр! Меня зовут Сергей, я занимаюсь исследованиями в MWS и руковожу небольшой, но классной командой инженеров-исследователей. Пока одни с помощью ИИ-агентов ищут способы разгрузить рутину, мы в MWS смотрим дальше и видим больше. А что, если дать ИИ-агенту не только «руки», чтобы бродить по сети и нажимать кнопки в интерфейсе, но и «тело»?  

OpenClaw может физически взаимодействовать с реальным миром даже с помощью устройств «без мозгов». В этом материале разберём, как максимально просто развернуть такую систему самостоятельно. За помощь в подготовке спасибо Артёму @Artem_Lykov из центра R&D TechGov, который отвечает за направление Physical AI в MWS, и стажёру Дмитрию Ярчуку.

Читать далее

LLM-агент для поиска свободных доменов: автоматизируем подбор

Время на прочтение12 мин
Охват и читатели2.3K

Каждый день регистрируются сотни тысяч новых доменов, поэтому найти среди оставшихся что-то короткое, понятное и незанятое становится сложнее. Хороший домен — это узнаваемость и доверие пользователя. 

Привет, Хабр! Меня зовут Сергей. Я работаю инженером в Selectel, а в свободное время пишу пет-проекты для души. Недавно я прикинул: а что, если прямо сейчас мне понадобится запустить свой бренд или продукт? Первое, во что упираешься в таких раздумьях — это выбор домена. В этой статье я покажу небольшой проект, благодаря которому можно подбирать доменные имена не вручную, а автоматически с применением ИИ-агентов. Удобно или нет, решайте сами, подробности под катом.

Читать далее

Когда, зачем и как правильно начинать новую сессию в Claude Code?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели2.4K

Контекстное окно в 1М токенов — это палка о двух концах. Оно позволяет решать более сложные задачи, но при плохом управлении сессией быстрее накапливает мусор в контексте.

То, как вы управляете сессиями, контекстом и компактизацией в Claude Code, влияет на результат сильнее, чем кажется.

Мы выпустили /usage — новую slash-команду, которая помогает отслеживать использование Claude Code. Эта функция появилась после серии разговоров с пользователями.

В этих разговорах раз за разом всплывала одна тема: огромный разброс в том, как люди управляют сессиями — особенно после увеличения контекстного окна до 1 миллиона токенов.

Держать одну или две долгосрочные сессии в терминале? Начинать новую с каждым промптом? Когда использовать compact, rewind или subagents? Что приводит к плохой компактизации или плохой сессии?

Всё это неожиданно сильно влияет на опыт работы с Claude Code, и почти всё сводится к управлению контекстным окном.

Читать далее

Автономность как точка невозврата: кто будет субъектом в цифровом будущем

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели1.9K

Мы привыкли считать, что цифровая зрелость - это скорость, стабильность и автономность. Чем меньше человек вмешивается в работу системы, тем лучше она устроена. Но что, если за этим технологическим прогрессом скрывается менее очевидный процесс - постепенное вытеснение человека из ядра мышления?

В последние годы в корпоративных ИТ произошло изменение, которое на первый взгляд выглядит как естественное продолжение цифровой эволюции, но по сути затрагивает фундаментальные основания управления. Мы научились строить инфраструктуры, способные к самовосстановлению, системы, которые предсказывают сбои до их проявления, модели, оптимизирующие ресурсы быстрее и точнее любого человека. Однако за этой технологической зрелостью скрывается менее очевидный процесс - постепенное вытеснение человека из ядра рассуждения. Если раньше автоматизация снимала нагрузку с рук, то сегодня она снимает нагрузку с мышления. И это уже не вопрос удобства, это вопрос субъектности.

На протяжении десятилетий инженерная культура строилась на причинно-следственной прозрачности. Архитектор понимал, почему определённый паттерн масштабирования устойчив, администратор знал, где проходит граница отказоустойчивости, технический директор держал в голове карту зависимостей и рисков. Это знание не было декоративным, оно обеспечивало контроль. Контроль не в административном смысле, а в когнитивном: способность объяснить, почему система работает именно так, а не иначе. Сегодня эта прозрачность постепенно растворяется. Алгоритмы не объясняют, они вычисляют, они не строят аргументацию, они минимизируют отклонение от метрики. И пока система демонстрирует результат, у бизнеса нет причин сомневаться в корректности этой логики.

Читать далее

Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели2.2K

Часто полезные данные для обучения ИИ — побочный продукт от действий пользователя в игре, навигаторе или фитнес-приложении. Пользователь делает то, ради чего пришел: ловит виртуальных шушпанчиков, катается на велосипеде, объезжает пробки, вводит капчу — а где-то фоново формируется датасет. Это уже много обсуждали в комментариях к истории использования данных Pokémon Go для обучения пространственного ИИ (spatial AI). 

В этом материале я расскажу о кейсе Pokémon Go и о том, как работает использование данных из приложений.

Читать далее

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели3K

Привет, Хабр! 

Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способности языковых моделей в контексте задач кибербезопасности. Думал, что это займет вечер, — увы! Все оказалось куда хаотичнее, чем предполагалось. Поэтому делюсь тем, что собрал сам.

Первое, что бросилось в глаза, — полный бардак и отсутствие системы. Бенчи, про которые все пишут в 2024-м, могут вообще не упоминаться в свежих статьях 2025-го. А некоторые широко цитируемые датасеты при ближайшем рассмотрении оказываются сделанными очень небрежно, из-за чего непонятно, что они вообще измеряют. Поэтому, прежде чем лезть в конкретные примеры, давайте определимся, какими они бывают.

Читать далее

Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели3.3K

Привет Хабр! В нашем блоге кейс-пополнение. Дисклеймер: По причине соглашений о неразглашении (NDA) мы не всегда можем указать на конкретного заказчика, но стараемся описывать задачу проекта и ее решение максимально подробно. Сегодня рассказ про применение ИИ в российской металлургии. Итак, после предисловия перейдем к теме статьи.

Читать далее

Обновлённый токенизатор видео K-VAE 2.0 от Сбера

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели2.5K

Несколько месяцев назад мы выпустили токенизаторы для видео и изображений — KVAE-1.0. Сегодня представляем следующее поколение: KVAE-2.0 — два новых видео-токенизатора, которые превосходят Wan 2.2 и HunyuanVideo 1.5 по объективным метрикам и качеству генерации. То есть представляем лучшие на сегодняшний день открытые видео-токенизаторы.

Напомним контекст: видео-версия KVAE-1.0 сжимала по трём осям — в 8 раз по ширине, в 8 по высоте, в 4 раза по количеству кадров (формат 4x8x8). Одна из новых моделей поддерживает тот же формат 4x8x8, вторая работает в более агрессивном режиме 4x16x16 — в тексте они так и именуются. Мы рассмотрели актуальные тренды в токенизации, описали архитектурные изменения в KVAE-2.0 и сравнили с альтернативами.

Читать далее

Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели3.1K

Сегодня LLM — модный инструмент, завтра — обязательный компонент инфраструктуры. Мы разберём, какие уязвимости у языковых моделей есть уже сейчас, почему вокруг guardrails формируется целый стек технологий и как разработчикам влиться в эту волну, пока она только набирает высоту

Читать далее

Умный город начинается с точного взгляда: как Фалькон Тех меняет пространство к лучшему

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели2.3K

"Умный город" звучит как абстрактная концепция – с ИИ, камерами и "единым цифровым контуром". Но что это на практике и как работает?

В этой статье рассказываем, как создали систему видеомониторинга для городской среды: от первых задач по контролю парковок до масштабируемого обеспечения, который используется в Москве и обрабатывает данные с тысяч программно-аппаратных комплексов.

Разберем реальные кейсы: как машинное зрение помогает фиксировать нарушения, анализировать загрузку городской инфраструктуры и снижать зависимость от ручного контроля. Покажем, с какими инженерными ограничениями приходится работать — от погодных условий и ночной съёмки до распознавания объектов в сложных сценариях.

Читать далее

Убийцы OpenAI, Google и Anthropic уже здесь

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели4.3K

У крупнейших имён в мире ИИ есть проблема старения — и они пытаются решить её, наращивая вычислительную мощь. Грубая ошибка.

OpenAI, Google, Anthropic и прочие последние два года масштабируют вычисления на этапе инференса: цепочки рассуждений, деревья поиска, петли верификации, больше токенов во время работы модели. Как я уже писал ранее, этот подход устранил большинство поверхностных галлюцинаций — тех, что компрометируют вас на демонстрации, — зато породил более глубокие структурные ошибки: куда труднее обнаруживаемые и куда более опасные.

И вот что большинство упускает из виду: новые языковые модели звучат умнее. Но умнее они не стали. Они просто научились галлюцинировать с более изощрённой грамматикой. Данные это подтверждают: с каждым новым релизом глубинный уровень галлюцинаций растёт, а не снижается.

Одна из последних крупных моделей OpenAI показала почти невероятные 50% галлюцинаций на их собственном бенчмарке SimpleQA. Каждый второй ответ — выдуман. Связность речи — это маска. То, что под ней, становится всё хуже.

Читать далее

Ближайшие события

Искусственный архитектор: как нейросети справляются с проектированием ПО

Время на прочтение18 мин
Охват и читатели3.5K

Не так давно в нашем блоге была статья о том, как искусственный интеллект помогает разбирать логи 1C. В этой — поговорим о задачах архитекторов ПО. LLM и диффузионные модели уже способны генерировать варианты архитектур, оценивать компромиссы и предлагать решения быстрее, чем это возможно вручную. Пора разобраться, насколько глубоко ИИ может встроиться в рабочие процессы архитектора ПО — и стоит ли ему там оставаться.

Привет, Хабр! Меня зовут Александр Брейман, я доцент департамента программной инженерии факультета компьютерных наук НИУ ВШЭ и по совместительству старший преподаватель Учебного центра IBS. В этой статье расскажу про большие языковые модели в приложении к работе архитектора ПО. Вместе мы посмотрим, насколько хорошо GPT понимает ИТ-архитектуру и сможет ли уже сегодня заменить архитектора.

Читать далее

Full-stack верификация: как Playwright-агент тестирует UI, затем проверяет базу данных без единой строки SQL

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.9K

Ваш тест на оформление заказа нажимает «Оформить заказ» и видит зелёный тост. Хорошо. Но вот чего он не проверяет: реально ли записалась строка? Правильно ли записались позиции заказа? Уменьшился ли инвентарь? UI написал «подтверждено», но UI иногда врёт — проглоченная ошибка, откаченная транзакция, очередь, которая молча дропнула сообщение.

Классическое решение некрасиво: нужно подключить ORM или низкоуровневый драйвер базы данных внутри тестового харнеса, управлять отдельными учётными данными, писать SQL-ассерты вручную и надеяться, что схема не изменится. Работает. Но это накладные расходы на поддержку, которые вы платите за каждый тест.

Сейчас есть паттерн лучше. И в нём ноль SQL с вашей стороны.

Что если один AI-агент сможет делать обе половины — управлять браузером при оформлении заказа и затем переключиться в базу данных для проверки записи — используя два MCP-сервера?

Именно это разбирается в статье:

Читать далее

Как я заставил ИИ писать код по книжке: Clean Architecture + TDD на автопилоте

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели7.5K

Продолжение первой статьи про взрослый вайб-код для тех разработчиков, которые уже перешли на тёмную сторону. Рассказ про фреймворк, который насильно заставляет писать ИИ хороший код с хорошими тестами.

Читать далее

Часть 6: Безопасность и приватность в голосовом управлении — как защитить умный дом от утечек и взломов

Уровень сложностиСложный
Время на прочтение14 мин
Охват и читатели5K

От диплома до продакшена. Часть 1: Что я хотел … Часть 2: Техническая реализация … Часть 3: Архитектура нейросети … Часть 4: Обучение и валидация … Часть 5: Интеграция с устройствами …

И ВОТ ТЕПЕРЬ

Если вы используете умный дом: Настройки… Проверьте разрешения приложений Сеть… Включите WPA3 на Wi-Fi Приватность… Регулярно очищайте историю команд Физическая безопасность…

Там много интересного

Навайбкодил приложение для анализа графов

Время на прочтение11 мин
Охват и читатели5.8K

Попробовал создать небольшое приложение с помощью Claude Code. Изначально я был очень скептически настроен, потому что до этого использовал GPT в Copilot, который меня больше бесил, чем делал что‑то полезное. Поэтому я ожидал, что, ну, наверное Claude что‑то сгенерирует, но потом ещё неделю нужно будет вручную допиливать.

Я ошибался, вполне работающее приложение он сгенерировал за час, ещё день ушёл на тестирование и накидывание промптов по доработке. Можно было бы на этом остановиться, но в итоге я потратил ещё три недели на приведение документации, кода и в целом процесса разработки в порядок. Поделюсь этим опытом в статье.

Читать далее

Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели8.9K

Все началось пару месяцев назад, когда я всерьез увлекся темой автономных агентов. Если вы следите за индустрией, то наверняка слышали про ruflo — это мощнейший движок для оркестрации Claude Code. Он позволяет создавать настоящие «ульи» из агентов, которые сами пишут код, сами его проверяют и сами деплоят.

Но когда я попытался внедрить это в реальный проект, я столкнулся с суровой реальностью.

Читать далее

OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели12K

Что ж, теперь образ действия Сэма Альтмана очевиден, и мы уже можем предсказать, что будет дальше.

То, что он делает, — это разновидность многоуровневого маркетинга (MLM). Схема, в которой доход генерируется не от продажи продукта, а от привлечения новых участников, вкладывающих свои деньги в систему.

Формально это нельзя назвать незаконным, и Альтман, скорее всего, не понесёт юридической ответственности, когда эта схема рухнет. Но его репутация, вероятно, окажется погребена под обломками конструкции, стоимость которой составит десятки, если не сотни миллиардов долларов.

Кроме того, множество компаний — включая весьма известные, — на мой взгляд, понесут колоссальный репутационный ущерб. И мне страшно представить количество и суммы судебных исков, которые последуют за этой грандиозной мистификацией.

Читать далее
1
23 ...