Как стать автором
Поиск
Написать публикацию
Обновить
1001.53

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Не рейтинг, а настроение: как HRM сделал эмпатию доступной

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров27

Автор: Денис Аветисян

От автора: Прежде чем мы окунемся в мир патологических лжецов и эмпатичных машин, позвольте мне в двух словах рассказать, о чем эта история. Это хроника одного амбициозного эксперимента: мы решили научить машину понимать не слова, а эмоции. Для этого мы создали сложную систему с целой «коллегией» AI‑экспертов, которая умела читать уникальные «эмоциональные отпечатки» пользователей. Она работала... и была чудовищно дорогой, как Bugatti, требующая ракетного топлива.

И эта статья — история о том, как прорывная архитектура ИИ (HRM), вдохновленная работой мозга, позволила нам решить эту проблему. О том, как мы нашли новый, сверхэффективный «двигатель» и превратили дорогую игрушку в технологию, способную по‑настоящему читать между строк. А теперь — к делу.

Читать далее

Новости

Deep Think with Confidence (DeepConf): уверенные рассуждения с ранней остановкой

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров236

На этой неделе разбираем методику Deep Think with Confidence (DeepConf) — подход к рассуждениям LLM, который измеряет локальную уверенность модели по ходу генерации и использует её для ранней остановки низкокачественных трасс, а также для взвешенной агрегации ответов офлайн. DeepConf не требует дообучения модели и легко встраивается в существующие inference‑стеки, при этом одновременно:

- Повышает точность на сложных бенчмарках (до 99.9% на AIME 2025 с GPT‑OSS‑120B),

- Существенно сокращает вычисления за счёт раннего отсечения «плохих» цепочек (до −84.7% токенов).

Читать далее

Почему бокс — это мультиагентная система

Время на прочтение10 мин
Количество просмотров246

Привет! ИИ-агенты — главная горячая тема этого года, но все наверняка видели как их ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл.

В этой статье я расскажу о действительно полезном применении концепции агентов и попробую доказать, почему любой боксерский поединок является мультиагентной системой. И да, сходу со старта: это, конечно же, легкая и ироничная статья, к которой не нужно относиться серьезно — это чистый сарказм и попытка натянуть мультиагентную сову на мультиагентный боксерский глобус, а все приведенные аналогии между боксом и агентами — лишь художественный вымысел. ツ

Итак, поговорим про system design бокса, про reinforcement learning, адаптивные алгоритмы, всевозможный вызов tools типа джебов или клинча, очереди сообщений и гарантию их доставки, graceful degradation агентов и многое другое.

Читать далее

Анализ системного промпта tool-deep-research

Время на прочтение10 мин
Количество просмотров345

Вот и дошли мои руки покопаться во внутренностях системного промпта tool-deep-research (ссылка)

 Сразу скажу, что возможностями Deep Research я пользовался редко, но в тех моментах, где оно действительно требовалось, он не раз меня выручал. Особенно это касается всяких финансовых вопросов: кредиты, вклады, инвестиции (решения принимаю все еще сам, но понимая конкретную конечную сумму и понятно расписанные условия, принимать решения стало значительно легче) и когда надо быстро погрузиться в новую для себя тему.

Читать далее

Как LLM экономит на интеллекте, и как с этим бороться

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров1.1K

Вы достаточно умны, чтобы сформулировать задачу, способную, как вам кажется, изменить мир. Лучший инструмент — топовые LLM: они помогают формализовать проблему, выбрать подходы, нагенерировать гипотезы, проверить их и собрать итог. И вот у вас — внутренне логичная, красивая, последовательная… и абсолютно неверная конструкция: компиляция известных фактов, галлюцинаций модели и ваших скрытых ожиданий. Проверить это на практике нельзя, поставить чистый эксперимент — тоже, и внезапно всё это начинает выглядеть как бред.

Что произошло по дороге?

Читать далее

Научный «дипфейк»? Как галлюцинации нейросетей — и другие проблемы — просачиваются в академические статьи

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.6K

Нейронки периодически оказывают пользователям медвежью услугу и уверенно (инфа сотка!) выдают в ответ на запрос правдоподобные фейки. Если речь идет о журнальных статьях на тему «что почитать этим летом», получается веселый конфуз.

Совсем другое дело — если «срезать углы» с помощью нейросети хочет юрист, ученый или эксперт, пишущий книгу в жанре технической литературы.

Мы в Beeline Cloud решили посмотреть, какие прецеденты с галлюцинациями (и другие сложности) уже зафиксированы и что на этот счет думают ученые.

Читать далее

Агенты без скриптов: что происходит, когда ИИ сталкивается с реальностью

Время на прочтение4 мин
Количество просмотров1.3K

Звучит просто: подключил суперсовременную LLM к десятку инструментов — и пусть решает любые задачи в реальном времени. Только вот на практике всё выходит куда прозаичнее. Даже самые мощные модели уверенно работают в лабораторных условиях, где всё строго по шаблону. А стоит им оказаться в живой, шумной среде — появляются ошибки, неожиданные сбои и довольно неожиданные выводы о том, где у современных ИИ-агентов на самом деле слабые места. Новое исследование показывает, что, когда у модели есть сотня способов решить задачу, успех — далеко не гарантирован. Почему даже мощные LLM так часто спотыкаются на пустом месте и что им мешает делать работу, как человек — разберёмся на ярких примерах из нового бенчмарка LiveMCP-101.

Читать далее

Один пост, чтобы обрести силу… или разбираемся в промптах, чтобы научиться их писать раз и навсегда

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3K

В последнее время расплодилось каналов с псевдоэкспертами по промпт-инжинирингу. Но цель у них одна — зарабатывать на вашем внимании, втюхивая вам сгенерированные в тех же LLM промпты как нечто волшебное и уникальное. Здесь мы такое не одобряем!

Давайте-ка один раз хорошенько разберём, как работают промпты и как их писать. Я намеренно не буду грузить вас заумными терминами, так как именно их используют как завесу из магической пыли вокрут этой темы. Моя же цель — рассказать все максимально просто.

Читать далее

Трактат о природе формального доказательства

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров520

Мы пытались закрыть пробелы в доказательстве в Lean 4. Но вместо решений получили 120 000 токенов объяснений и одно слово: sorry. Из этого вырос философский трактат о природе формальных доказательств.

Читать трактат

Промт: как получать лучшие результаты в Midjourney

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров861

Доброго времени суток, «Хабр»!

Не так давно я рассказывал про промты для нейросетей, которые способны генерировать фотографии и видео. Да и можно вспомнить, что у меня выходили статьи про Krea AI и Playground AI, которые тоже являются инструментами для работы с изображениями. В этой статье мной было принято решение немного углубиться в части генерации фотографий и рассмотреть одну из более популярных моделей, предназначенных для этого, — Midjourney. Точнее как, сегодня мы поговорим о некой конкретике и изюминке в промтах для этой нейросети, а также узнаем (а некоторые вспомнят), как их грамотно составлять.

Итак, присаживаемся поудобнее, достаем свои кисточки, кхм, точнее достаем вкусняшки, ну а я перехожу к своему повествованию.

Читать далее

Как работает память: что происходит в мозге, когда мы забываем пароль от Wi-Fi

Уровень сложностиСложный
Время на прочтение4 мин
Количество просмотров6.1K

Когда мозг отказывается вспомнить пароль от Wi-Fi, это не просто досадная мелочь. За этой банальной ситуацией стоят сложнейшие механизмы памяти, работы нейронных сетей и биохимических процессов. В статье я попробую объяснить, почему мы забываем такие вещи, что реально происходит в мозге и как это можно смоделировать в коде.

Читать далее

С помощью ИИ этот парень запустил конкурента Google прямо у себя в кладовке

Время на прочтение8 мин
Количество просмотров4.5K

Почти тридцать лет назад, когда Google только выходил на свою победную тропу, у её основателей почти не было железа.

Компания, сначала известная как Backrub и работающая на кампусе Стэнфорда, держала свой первый экспериментальный сервер в коробе из кубиков Duplo. Сервер вмещал 40 гигабайт данных. Позже удалось перейти на скромную серверную стойку. А в 2025 году весь поиск Google уже невозможно уместить даже в одном дата‑центре — и так давно.

И всё же, если включить смекалку и вложить немало труда, можно собрать нечто почти сравнимое с современным Google — на машине, по размеру близкой к тому самому первому серверу. И даже разместить её… в собственной прачечной.

Читать далее

Рынок цифровых AI-Компаньонов: эволюция, метрики и инсайты

Время на прочтение30 мин
Количество просмотров1K

Привет! Это Лиза Скрыль, продакт-менеджер в NDT by red_mad_robot. Мы исследовали рынок AI-компаньонов и хотим поделиться инсайтами о том, как формируется эта новая потребительская категория.

Читать далее

Ближайшие события

Модернизация древнего драйвера Linux с помощью Claude Code

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров6.6K

В качестве одного из своих увлечений я помогаю людям восстанавливать данные со старых ленточных кассет, например QIC-80, которые в 90-е годы часто применялись для резервного копирования. Ими пользовались отдельные люди, компании, операторы досок объявлений и не только. К ленточным кассетам я испытываю очень тёплые чувства. Есть нечто особое в том тактильном ощущении, которое возникает, когда держишь эту кассету в руках. Нечто такое, что делает сам процесс её использования приятным несмотря на все огрехи дизайна, которыми славилась технология QIC. Причём, если вникнуть в процесс и воссоздать все необходимые условия, то данные на этих лентах, даже спустя столько времени, вполне можно восстановить.

Читать далее

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

Время на прочтение42 мин
Количество просмотров669

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области.

Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

Читать далее

Секреты LLM по API: динамическая анонимизация данных для российского бизнеса

Время на прочтение12 мин
Количество просмотров1.1K

Привет, Хабр! На связи Мария Старцева и Катерина Пославская из команды R&D в Just AI.

Один из наиболее востребованных запросов бизнеса сегодня — LLM должна крутиться локально (on-premise). При этом именно проприетарные LLM модели чаще всего демонстрируют SOTA качество для большинства задач. И вот заказчик сталкивается с дилеммой: либо внедрять топовые инструменты, либо рисковать безопасностью, выпуская информацию из контура организации.

Как обеспечить сотрудникам доступ к мощным внешним LLM-сервисам и при этом не допустить утечки конфиденциальной информации? В этой статье мы расскажем про Jay Guard – шлюз безопасности для работы с LLM: как работает это решение, и что находится под капотом.

Читать далее

Продающий бот. Часть 4. Можно ли обмануть бота

Время на прочтение2 мин
Количество просмотров265

Предыдущая часть Продающий бот. Часть 3. Сколько это стоит

А теперь выясним: можно ли обмануть продающего бота

Читать далее

Умный аналитик для ритейла: ИИ на службе бизнеса

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров718

Данные для ритейла жизненно необходимы: продажи, промо, возвраты, остатки, оборачиваемость. Классическая схема работы такова: бизнес-подразделение формулирует вопрос → аналитики превращают его в задачу → инженеры делают выгрузки → кто-то собирает отчет → отчет попадает на стол к ответственному лицу → через время появляется ответ.

Проблема в том, что скорость бизнеса и скорость проведения анализа не совпадают.

Руководителю дивизиона, директору магазина или маркетологу часто нужен ответ в моменте, а не через неделю. Но BI-процессы инерционны. Поэтому сегодня нужны другие инструменты, позволяющие получить свежие данные, проанализировать, задать вопрос – и получить не просто диаграмму, но выводы, рекомендации или даже конкретное выполненное действие.

Конструкторы отчетов устарели. В век GPT пользователь хочет общаться с данными. 

Что с этим делать?

Читать статью

Рецензия на книгу: If Anyone Builds It, Everyone Dies

Уровень сложностиПростой
Время на прочтение20 мин
Количество просмотров990

Основной аргумент об опасности ИИ прост. Мы не очень умеем задавать ИИ конкретные цели; пока мы по ходу добавляли поверхностные склонности к послушанию, надеясь, что он ещё достаточно глуп и ошибки не критичны. Но ИИ быстро умнеет. В какой‑то момент он, возможно, окажется умнее людей. Наше преимущество интеллекта позволило нам вытеснить шимпанзе и других животных глупее нас; возможно, ИИ в итоге вытеснит нас.

Читать далее

Осваиваем LLM: подробное знакомство с книгой Себастьяна Рашки «Строим LLM с нуля»

Время на прочтение5 мин
Количество просмотров3K

Недавно у меня появилась возможность прочитать книгу Себастьяна Рашки «Строим LLM с нуля», и, начав читать, я просто не мог её отложить.

Эта книга увлекательно сочетает исчерпывающую теорию, практическую реализацию кода и прекрасно и доходчиво объясняет одну из самых актуальных тем в области современного искусственного интеллекта: большие языковые модели (LLM). Как человек, который любит разбираться в тонкостях моделей ИИ, я считаю эту книгу настоящей жемчужиной. Ее обязательно нужно прочитать всем, кто серьезно интересуется LLM. Хочу отметить, что я никак не связан с автором или издателем; эта рецензия является исключительно отражением моего восхищения содержанием книги.

Читать далее
1
23 ...