Обновить
29
68
Датаист @andre_dataist

ИИ-исследователь

Отправить сообщение

Как ИИ-агенты управляют операционной системой и оживляют героев романов: топ-10 исследований ИИ за апрель 2025

Время на прочтение20 мин
Количество просмотров3.4K

Привет, Хабр! В апреле вышли несколько интересных исследований: один ИИ-агент без участия человека автоматически готовит научную статью, другой научился управлять любыми Windows-приложениями. Появились методы, позволяющие сотням симулированных пользователей выявлять слабые места в интерфейсе; платформа, где герои знакомых романов превращаются в ИИ-агентов и создают новые сюжеты; а также симуляция соцсетей, в которой сотни ИИ-юзеров читают посты, лайкают, репостят и проверяют фейки. Узнайте все подробности об этих и других исследованиях в этой статье.

Читать далее

Тест на прочность: LLM против сложных задач

Время на прочтение4 мин
Количество просмотров1.6K

В мире, где условия задач постоянно меняются, способность языковой модели учиться на ходу без перестройки своих параметров становится настоящим вызовом. Недавнее исследование показывает, как простые техники рефлексии, эволюционных эвристик и планирования превращают LLM в гибких агентов, способных адаптироваться к новым ситуациям. От классической игры «камень-ножницы-бумага» до сложных головоломок Ханойской башни — узнайте, какие стратегии работают лучше всего и какие перспективы откроются перед LLM в динамических средах.

Читать далее

Как ИИ научился думать картинками

Время на прочтение4 мин
Количество просмотров2K

Современные ИИ-модели достигли впечатляющих успехов в понимании текстов и изображений, однако все еще не идеальны в задачах, где важна визуальная интуиция, таких как навигация и планирование действий. Сегодня большинство моделей конвертируют визуальную информацию в текстовую и только затем принимают решения, что приводит к потере важных деталей и делает решение задач менее интуитивным.

Когнитивная наука подтверждает, что человеческий мозг использует два канала мышления — текстовый (вербальный) и визуальный (невербальный). Но современные мультимодальные модели (MLLM) чаще всего полагаются на текстовые объяснения даже там, где визуальное мышление было бы намного эффективнее. До мая 2025 года не было серьезных исследований, которые бы ответили на вопрос: могут ли современные модели решать задачи исключительно с помощью визуальной информации без использования слов?

Читать далее

Действительно ли у ИИ-агента есть внутренняя картина мира и представление о себе?

Время на прочтение5 мин
Количество просмотров2.6K

Представьте ИИ-агента в виртуальном мире: он не знает ни прошлого, ни будущего, ему доступен лишь крошечный фрагмент окружения. И все же, шаг за шагом, этот агент начинает «чувствовать» свое положение, выстраивать внутренние карты и даже формировать зачатки собственного «я». В этой статье вы узнаете, почему за кулисами обучения RL-агента скрывается удивительный процесс создания его внутренней картины мира.

Читать далее

Может ли ИИ обладать сознанием?

Время на прочтение5 мин
Количество просмотров7K

В то время как ИИ уверенно осваивает все новые сферы - от перевода текстов до разработки лекарств - мы все чаще сталкиваемся с фундаментальным вопросом: имеет ли право такой ИИ называться «сознательным»? Модель OpenAI-o1, построенная на архитектуре трансформеров и обученная с помощью RLHF, является отличным полигоном для исследования этого вопроса. Но можем ли мы всерьез говорить о зачатках сознания у машин - или это лишь очередная иллюзия, созданная алгоритмами?

Читать далее

Добро пожаловать в эру опыта: почему обучение с подкреплением изменит мир

Время на прочтение4 мин
Количество просмотров6.7K

ИИ подходит к новой стадии развития, которая обещает радикальные изменения во многих аспектах жизни и науки. В статье ниже мы рассмотрим ключевые изменения и технологии, которые сделают возможным наступление новой эры - эры опыта. Вы узнаете, почему нынешние подходы, основанные на человеческих данных, уже исчерпали себя, и как обучение на собственном опыте агентов откроет совершенно новые горизонты в развитии ИИ.

Читать далее

Может ли ИИ заменить вас на работе? Ученые проверили на 175 задачах

Время на прочтение4 мин
Количество просмотров13K

ИИ уже пишет код, управляет проектами и общается с коллегами. Но можно ли прямо сейчас доверить ему всю офисную работу? Исследователи протестировали 7 самых мощных нейросетей на 175 реальных задачах. Спойлер: полностью заменить сотрудников нейросети пока не могут. Но давайте разберемся, что именно у них получается лучше всего, какие задачи еще вызывают трудности и стоит ли уже сегодня нанимать себе цифрового помощника в штат.

Читать далее

VideoGameBench: 20 рандомных ретро-игр против нейросети — кто кого?

Время на прочтение4 мин
Количество просмотров1.1K

Языковые модели уже решают олимпиады и пишут код «на лету», так что пора бы им рулить и в Dark Souls… но (спойлер): первые же пиксели экшена вгоняют нейросеть в ступор. Почему ИИ пасует там, где нужен мгновенный инстинкт геймера? Разбираемся в статье.

Читать далее

Обучаем ИИ-агентов играть в видеоигры: новый подход с LLM и рефлексией

Время на прочтение4 мин
Количество просмотров1.2K

Современные ИИ-системы для видеоигр часто упираются в ограничения классических методов, таких как обучение с подкреплением (RL): они требуют больших вычислительных ресурсов, длительного обучения и тонкой настройки под каждую игру. В ответ на эти сложности исследователи из Tencent предложили новый подход к созданию ИИ-агентов для 3D-игр — с опорой на большие языковые модели (LLM) и специализированный язык описания поведения. Такой метод позволяет быстро генерировать эффективные стратегии без переобучения, и, как показывают эксперименты, демонстрирует впечатляющие результаты. Разбираемся, как это работает.

Читать далее

WorkTeam: новый мультиагентный фреймворк для автоматизации сложных бизнес-процессов

Время на прочтение3 мин
Количество просмотров2.8K

В стремительно меняющемся мире бизнеса автоматизация процессов перестала быть роскошью - сегодня это жизненная необходимость. Представьте, что вы можете переводить даже самые сложные инструкции на привычном человеческом языке напрямую в готовый бизнес-процесс, обходясь без десятков часов ручной разработки и без узкоспециализированных экспертов. Звучит как фантастика? Новая мультиагентная платформа WorkTeam претендует на то, чтобы воплотить это в реальность.

Читать далее

Как ИИ помогает исследовать мозг, а роботы научились понимать трехмерный мир: топ-10 исследований ИИ за март 2025

Время на прочтение14 мин
Количество просмотров1.4K

Привет, Хабр! Предлагаю взглянуть на десять исследований в области искусственного интеллекта (ИИ), которые особенно запомнились мне в прошлом месяце: мультимодальная Qwen2.5-Omni, автоматизированные ИИ-лаборатории, новые подходы к медицинской симуляции и нейровизуализации мозга. Постарался изложить обо всем кратко и простыми словами.

Читать далее

Open Deep Search: как сделать открытый аналог Perplexity своими руками

Время на прочтение4 мин
Количество просмотров3.9K

Искусственный интеллект (ИИ) - ключевой компонент современных поисковых систем. Однако большинство популярных решений, таких как Google, Perplexity и ChatGPT остаются проприетарными, что затрудняет научные исследования и развитие таких технологий. В то же время, открытые решения для интеллектуального поиска часто оказываются менее качественными. Это создает разрыв между закрытыми коммерческими системами и доступными для разработчиков инструментами, которые не обладают такой же производительностью и качеством. Для устранения этого разрыва исследователи представили открытый фреймворк Open Deep Search (ODS), который позволяет интегрировать мощные инструменты для веб-поиска с любыми большими языковыми моделями (LLM), обеспечивая конкуренцию с коммерческими системами.

Читать далее

API против GUI: Сравниваем новое поколение LLM-агентов

Время на прочтение6 мин
Количество просмотров3.6K

Большие языковые модели (LLM) научились не только генерировать текст, но и выполнять реальные задачи, используя команды на естественном языке. Это открыло новую эру в автоматизации, породив так называемых LLM-агентов. Исследование "API Agents vs. GUI Agents: Divergence and Convergence" от Microsoft разбирает два ключевых подхода к созданию таких агентов. Давайте посмотрим, в чем их суть, различия и перспективы.

Читать далее

ИИ читает мысли во время просмотра «Теории Большого Взрыва» с помощью фМРТ и ЭЭГ

Время на прочтение6 мин
Количество просмотров1K

Привет, Хабр! Сегодня разберем интересную научную работу, которая находится на стыке нейронаук и искусственного интеллекта. Исследователи создали уникальный датасет и модель для декодирования активности мозга человека во время просмотра видео. Давайте посмотрим, как это работает.

Читать далее

Как ИИ научился читать мысли и чем опасны суперинтеллектуальные агенты: топ-10 исследований ИИ за февраль 2025

Уровень сложностиСредний
Время на прочтение23 мин
Количество просмотров8.2K

Привет, Хабр! Я — Андрей, технологический предприниматель и консультант по ИИ. Февраль продолжает радовать нас выдающимися исследованиями в области искусственного интеллекта.

В этой статье я собрал для вас десять захватывающих работ, которые показывают, как большие языковые модели заранее планируют свои ответы, почему иногда приходится заставлять ИИ забывать приобретенные знания. Мы обсудим, как ИИ-ученые делают открытия и как декодировать мысли в текст напрямую из мозга без специальных чипов. А также узнаем как с помощью нейросетей симулировать финансовые рынки, может ли ИИ заработать миллион на фрилансе, и поговорим о рисках, которые несут суперинтеллектуальные агенты.

Поехали!

Как большие языковые модели планируют свои ответы еще до их генерации

Время на прочтение3 мин
Количество просмотров3.1K

Привет, Хабр! Что, если я скажу, что большие языковые модели не просто предсказывают следующий токен в ответ на запрос, а уже на ранних этапах формирования ответа «заранее планируют» его характеристики?

Читать далее

Информация

В рейтинге
104-й
Зарегистрирован
Активность