Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 179,78
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели15

И вот тут довольно сложно в двух словах объяснить, в чем, собственно, преимущество MJ над другими генераторами изображений. И есть ли оно вообще. А все потому, что если оценка какой-то определенной части сущности креатива уходит от измеряемых метрик в сторону вкусовщины - то это уже необъективная метрика. Вкусы у всех разные. А еще о них не спорят.

Поэтому если руководство ниже поможет хоть кому-то из вас, дорогие и уважаемые читатели, протестировать данную модель и сформировать о ней свое объективное мнение - я буду очень рад. Потому что MJ - очень стильная.

Итак, большинство людей начинают с запросов к, скажем, условной Nano Banana PRO, вида "beautiful girl portrait 8k cinematic", получают что-то сносное - думают, что разобрались и в MJ все сработает так же. Не разобрались и не сработает.

В данном случае мы имеем как аналогию - съемку профессиональной камерой, но в дефолтном авторежиме. Да, красиво. Но красиво можно было и на телефон снять. Так, а зачем нам камера?

Читать далее

Новости

Управление агентом с телефона через Telegram теперь в KodaCode

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели1.6K

Все популярные агенты движутся в одну сторону: управление ими должно быть максимально удобным и естественным. Голосовой ввод появился в ведущих зарубежных решениях, как и remote control, который несколько недель назад стал доступен в Codex и Claude Code. В этом релизе мы добавили обе возможности в KodaCode. Разберём по порядку.

Читать далее

Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили

Время на прочтение8 мин
Охват и читатели2.9K

В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по реакции на Reddit, идею приняли с интересом.

Но что, если пойти более прямым путём? Дать агенту «руки», чтобы он отлаживался так же, как это делает разработчик: ставил брейкпоинты, ходил по ним, выполнял evaluate expression? Этим вопросом недавно задались исследователи из Microsoft Research и сделали экспериментальный фреймворк Debug2Fix. Субагент, оснащённый инструментами для взаимодействия с отладчиком, разбирался с багами из датасетов GitBug-Java и SWE-Bench-Live на 20% лучше, чем обычный агент без таких инструментов.

Если агент уже интегрирован с IDE, естественно дать ему доступ к полноценному дебаггеру, когда он так близко. Тем более что этим занимаются даже в Microsoft. Поэтому в недавнем релизе своего ассистента для IntelliJ мы добавили Debug Agent, позволяющий агенту взаимодействовать с дебаггером в среде разработки.

Сегодня попробуем починить реальный баг с помощью агента с инструментами дебаггера в IDE и Cursor в Debug Mode и проверим, действительно ли ИИ нужен полный доступ к отладчику или достаточно и хорошего логгирования.

Читать далее

Описание данных: от Rare до Well-Done с помощью ИИ

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели1.9K

Привет! Я — Игорь Дмитриев, Data Business Partner в Wildberries & Russ. В своей статье на Хабре я рассказываю о том, как мы в компании автоматизируем сопровождение данных, чтобы не делать работу руками. Если вы хотите, чтобы модные ИИ-агенты и LLM выдавали бизнесу реальные инсайты, а не «красивую чушь», данные нужно правильно описать = «прожарить». В этой статье я покажу, на каком уровне зрелости («прожарки») описания данных можно уже подключать LLM, и ИИ-агенты будут меньше галлюцинировать, какой уровень целевой и какой уровень точности между ними. Просим под кат за деталями.

Читать далее

GoCloud 2026: ИИ-агенты, четыре трека и как я стал ведущим конференции

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели2.1K

Всем привет! Это Рома Путилов — вообще-то я в прошлом инженер, а сейчас руковожу направлением продвижения решений в Cloud.ru. Но 9 апреля что-то пошло не так, и вот я уже стою на сцене кинотеатра «Каро 11 Октябрь» под прицелами камер, перед залом на 1 700+ человек, и открываю нашу главную ИТ-конференцию про ИИ и облака.

Как я дошел до жизни такой, что мы анонсировали на конфе, о чем говорили эксперты и что по циферкам? Сейчас все расскажу и покажу. Если пропустили или просто хотите узнать побольше об организаторской изнанке — читать обязательно.

Читать далее

AI-ready ITSM: платформа или коробка – и почему это главный вопрос 2026 года

Время на прочтение8 мин
Охват и читатели2.8K

Ещё три года назад ИИ в ITSM представлялся как просто чат-бот на входе, который пытается угадать категорию тикета. Сегодня уже другой разговор: ведущие платформы встраивают AI не как надстройку над тикет-системой, а как архитектурный слой, который участвует в маршрутизации, предсказывает инциденты до их возникновения, автономно закрывает типовые обращения и генерирует постмортемы. Рынок уже видит пользу — по данным Forrester, компании, внедрившие предиктивные ITSM-практики, восстанавливаются после инцидентов вдвое быстрее тех, кто полагается на ручную обработку.

Рынок ITSM на это отреагировал по-разному — теперь при выборе инструментов фокус может быть не на том, какие ИИ-фичи есть у вендора, а насколько эта AI-инфраструктура управляема. В этом материале обозреваем мировых ITSM вендоров и их подходов к реализации ИИ.

Читать далее

Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.8K

Представьте: три топ-менеджера из крупных компаний садятся писать код. Не ставить задачи команде, не согласовывать архитектуру — а сами, руками, за восемь часов собрать работающую систему. И не просто систему, а ИИ-директора, который не сломается под давлением CEO. Спойлер: получилось

Рассказываем, почему обычный LLM в этой задаче «плывёт», как устроена архитектура устойчивости и что даёт single-shot reasoning там, где хочется городить мультиагентный пайплайн.

Читать далее

AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели4.3K

Сеньорам срезали зарплату на 10%. Рост зарплат в IT - минимум за 15 лет. При этом вакансий стало на 11% больше. Собрал американские и российские данные, посмотрел на Klarna, Block, IBM, BCG - и увидел паттерн, который назвал AI-дефляцией. Разбираю, что это значит для джунов, мидлов и сеньоров.

Читать далее

Мы отдали управление роботами OpenClaw. Что из этого вышло

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели4.2K

Началась новая эра – эра автономных агентов. Пользователь пишет запрос на естественном языке, и агент сразу решает поставленную задачу. Или не сразу. Но в таком случае он самостоятельно ищет способ получить недостающие навыки для выполнения запроса.

Привет, Хабр! Меня зовут Сергей, я занимаюсь исследованиями в MWS и руковожу небольшой, но классной командой инженеров-исследователей. Пока одни с помощью ИИ-агентов ищут способы разгрузить рутину, мы в MWS смотрим дальше и видим больше. А что, если дать ИИ-агенту не только «руки», чтобы бродить по сети и нажимать кнопки в интерфейсе, но и «тело»?  

OpenClaw может физически взаимодействовать с реальным миром даже с помощью устройств «без мозгов». В этом материале разберём, как максимально просто развернуть такую систему самостоятельно. За помощь в подготовке спасибо Артёму @Artem_Lykov из центра R&D TechGov, который отвечает за направление Physical AI в MWS, и стажёру Дмитрию Ярчуку.

Читать далее

LLM-агент для поиска свободных доменов: автоматизируем подбор

Время на прочтение12 мин
Охват и читатели6K

Каждый день регистрируются сотни тысяч новых доменов, поэтому найти среди оставшихся что-то короткое, понятное и незанятое становится сложнее. Хороший домен — это узнаваемость и доверие пользователя. 

Привет, Хабр! Меня зовут Сергей. Я работаю инженером в Selectel, а в свободное время пишу пет-проекты для души. Недавно я прикинул: а что, если прямо сейчас мне понадобится запустить свой бренд или продукт? Первое, во что упираешься в таких раздумьях — это выбор домена. В этой статье я покажу небольшой проект, благодаря которому можно подбирать доменные имена не вручную, а автоматически с применением ИИ-агентов. Удобно или нет, решайте сами, подробности под катом.

Читать далее

Когда, зачем и как правильно начинать новую сессию в Claude Code?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.6K

В последних разговорах с пользователями Claude Code постоянно всплывает одна тема: контекстное окно в 1М токенов — палка о двух концах.

С одной стороны, Claude Code дольше работает автономно и надёжнее справляется со сложными задачами. С другой — если не следить за сессиями, контекст быстро засоряется.

Управление сессиями сейчас важнее, чем когда-либо, и вопросов вокруг него много. Держать одну или две долгосрочные сессии в терминале? Начинать новую с каждым промптом? Когда использовать compact, rewind или subagents? Что приводит к плохой компактизации или плохой сессии?

Всё это неожиданно сильно влияет на опыт работы с Claude Code, и почти всё сводится к управлению контекстным окном.

Читать далее

Автономность как точка невозврата: кто будет субъектом в цифровом будущем

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели3.1K

Мы привыкли считать, что цифровая зрелость - это скорость, стабильность и автономность. Чем меньше человек вмешивается в работу системы, тем лучше она устроена. Но что, если за этим технологическим прогрессом скрывается менее очевидный процесс - постепенное вытеснение человека из ядра мышления?

В последние годы в корпоративных ИТ произошло изменение, которое на первый взгляд выглядит как естественное продолжение цифровой эволюции, но по сути затрагивает фундаментальные основания управления. Мы научились строить инфраструктуры, способные к самовосстановлению, системы, которые предсказывают сбои до их проявления, модели, оптимизирующие ресурсы быстрее и точнее любого человека. Однако за этой технологической зрелостью скрывается менее очевидный процесс - постепенное вытеснение человека из ядра рассуждения. Если раньше автоматизация снимала нагрузку с рук, то сегодня она снимает нагрузку с мышления. И это уже не вопрос удобства, это вопрос субъектности.

На протяжении десятилетий инженерная культура строилась на причинно-следственной прозрачности. Архитектор понимал, почему определённый паттерн масштабирования устойчив, администратор знал, где проходит граница отказоустойчивости, технический директор держал в голове карту зависимостей и рисков. Это знание не было декоративным, оно обеспечивало контроль. Контроль не в административном смысле, а в когнитивном: способность объяснить, почему система работает именно так, а не иначе. Сегодня эта прозрачность постепенно растворяется. Алгоритмы не объясняют, они вычисляют, они не строят аргументацию, они минимизируют отклонение от метрики. И пока система демонстрирует результат, у бизнеса нет причин сомневаться в корректности этой логики.

Читать далее

Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели3.7K

Часто полезные данные для обучения ИИ — побочный продукт от действий пользователя в игре, навигаторе или фитнес-приложении. Пользователь делает то, ради чего пришел: ловит виртуальных шушпанчиков, катается на велосипеде, объезжает пробки, вводит капчу — а где-то фоново формируется датасет. Это уже много обсуждали в комментариях к истории использования данных Pokémon Go для обучения пространственного ИИ (spatial AI). 

В этом материале я расскажу о кейсе Pokémon Go и о том, как работает использование данных из приложений.

Читать далее

Ближайшие события

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели4.9K

Привет, Хабр! 

Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способности языковых моделей в контексте задач кибербезопасности. Думал, что это займет вечер, — увы! Все оказалось куда хаотичнее, чем предполагалось. Поэтому делюсь тем, что собрал сам.

Первое, что бросилось в глаза, — полный бардак и отсутствие системы. Бенчи, про которые все пишут в 2024-м, могут вообще не упоминаться в свежих статьях 2025-го. А некоторые широко цитируемые датасеты при ближайшем рассмотрении оказываются сделанными очень небрежно, из-за чего непонятно, что они вообще измеряют. Поэтому, прежде чем лезть в конкретные примеры, давайте определимся, какими они бывают.

Читать далее

Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели5.3K

Привет Хабр! В нашем блоге кейс-пополнение. Дисклеймер: По причине соглашений о неразглашении (NDA) мы не всегда можем указать на конкретного заказчика, но стараемся описывать задачу проекта и ее решение максимально подробно. Сегодня рассказ про применение ИИ в российской металлургии. Итак, после предисловия перейдем к теме статьи.

Читать далее

Обновлённый токенизатор видео K-VAE 2.0 от Сбера

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели3.7K

Несколько месяцев назад мы выпустили токенизаторы для видео и изображений — KVAE-1.0. Сегодня представляем следующее поколение: KVAE-2.0 — два новых видео-токенизатора, которые превосходят Wan 2.2 и HunyuanVideo 1.5 по объективным метрикам и качеству генерации. То есть представляем лучшие на сегодняшний день открытые видео-токенизаторы.

Напомним контекст: видео-версия KVAE-1.0 сжимала по трём осям — в 8 раз по ширине, в 8 по высоте, в 4 раза по количеству кадров (формат 4x8x8). Одна из новых моделей поддерживает тот же формат 4x8x8, вторая работает в более агрессивном режиме 4x16x16 — в тексте они так и именуются. Мы рассмотрели актуальные тренды в токенизации, описали архитектурные изменения в KVAE-2.0 и сравнили с альтернативами.

Читать далее

Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели4.1K

Сегодня LLM — модный инструмент, завтра — обязательный компонент инфраструктуры. Мы разберём, какие уязвимости у языковых моделей есть уже сейчас, почему вокруг guardrails формируется целый стек технологий и как разработчикам влиться в эту волну, пока она только набирает высоту

Читать далее

Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели3K

"Умный город" звучит как абстрактная концепция – с ИИ, камерами и "единым цифровым контуром". Но что это на практике и как работает?

В этой статье рассказываем, как создали систему видеомониторинга для городской среды: от первых задач по контролю парковок до масштабируемого обеспечения, который используется в Москве и обрабатывает данные с тысяч программно-аппаратных комплексов.

Разберем реальные кейсы: как машинное зрение помогает фиксировать нарушения, анализировать загрузку городской инфраструктуры и снижать зависимость от ручного контроля. Покажем, с какими инженерными ограничениями приходится работать — от погодных условий и ночной съёмки до распознавания объектов в сложных сценариях.

Читать далее

Убийцы OpenAI, Google и Anthropic уже здесь

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели7K

У крупнейших имён в мире ИИ есть проблема старения — и они пытаются решить её, наращивая вычислительную мощь. Грубая ошибка.

OpenAI, Google, Anthropic и прочие последние два года масштабируют вычисления на этапе инференса: цепочки рассуждений, деревья поиска, петли верификации, больше токенов во время работы модели. Как я уже писал ранее, этот подход устранил большинство поверхностных галлюцинаций — тех, что компрометируют вас на демонстрации, — зато породил более глубокие структурные ошибки: куда труднее обнаруживаемые и куда более опасные.

И вот что большинство упускает из виду: новые языковые модели звучат умнее. Но умнее они не стали. Они просто научились галлюцинировать с более изощрённой грамматикой. Данные это подтверждают: с каждым новым релизом глубинный уровень галлюцинаций растёт, а не снижается.

Одна из последних крупных моделей OpenAI показала почти невероятные 50% галлюцинаций на их собственном бенчмарке SimpleQA. Каждый второй ответ — выдуман. Связность речи — это маска. То, что под ней, становится всё хуже.

Читать далее

Искусственный архитектор: как нейросети справляются с проектированием ПО

Время на прочтение18 мин
Охват и читатели4.4K

Не так давно в нашем блоге была статья о том, как искусственный интеллект помогает разбирать логи 1C. В этой — поговорим о задачах архитекторов ПО. LLM и диффузионные модели уже способны генерировать варианты архитектур, оценивать компромиссы и предлагать решения быстрее, чем это возможно вручную. Пора разобраться, насколько глубоко ИИ может встроиться в рабочие процессы архитектора ПО — и стоит ли ему там оставаться.

Привет, Хабр! Меня зовут Александр Брейман, я доцент департамента программной инженерии факультета компьютерных наук НИУ ВШЭ и по совместительству старший преподаватель Учебного центра IBS. В этой статье расскажу про большие языковые модели в приложении к работе архитектора ПО. Вместе мы посмотрим, насколько хорошо GPT понимает ИТ-архитектуру и сможет ли уже сегодня заменить архитектора.

Читать далее
1
23 ...