Articles / Profile of andre_dataist / Habr

Датаист@andre_dataist

🤖 Дневник ИИ-исследователя

ProfileArticles104Posts2News12Comments21

andre_dataist Aug 26 at 10:03

Как дообучать LLM на лету с помощью памяти вместо файнтюнинга

4 min

8.5K

Artificial Intelligence

Review

Реальные агентные задачи требуют множества шагов, вызова инструментов и гибкой памяти. Исследователи нашли возможность улучшать агента без файнтюнинга весов языковой модели: предлагается хранить удачные и неудачные кейсы и опираться на них при планировании. В итоге получились шикарные метрики на бенчмарках GAIA, SimpleQA и Human Last Exam. Разбираемся, как это работает.

Читать далее

+9

andre_dataist Aug 25 at 06:00

Нажал — и мир двинулся: как Matrix-Game 2.0 делает видео интерактивным в реальном времени

4 min

5K

Artificial IntelligenceMachine learning *

Review

Что, если видеомодель не просто генерирует кадры, а откликается на нажатия? Matrix‑Game 2.0 приближает ИИ к «осязанию» мира: авторегрессия в 25 FPS, точный контроль мышью и клавиатурой, длинные сцены без забывания. За кулисами — датасеты из Unreal Engine и GTA 5. Результат — интерактивные видео, подчинённые законам физики, и прочный фундамент для симуляторов, планирования и обучения агентов.

Читать далее

+1

andre_dataist Aug 24 at 06:00

OmniTry: виртуальная примерка одежды и аксессуаров без масок — система сама найдёт, куда «надеть»

4 min

5.2K

Artificial IntelligenceMachine learning *

Review

Онлайн‑примерка одежды без масок и ручной разметки сегодня становится реальностью. OmniTry — диффузионный трансформер, который сам локализует объект на фото и сохраняет идентичность конкретного товара — от очков и серёжек до сумок и галстуков. В статье — разбираемся с двухэтапным обучением, «стиранием без следов» и собственным бенчмарком на 12 категорий предметов.

Читать далее

0

andre_dataist Aug 23 at 17:14

Секрет уверенного робота — в умении указывать

4 min

5.8K

Artificial IntelligenceMachine learning *

Review

Почему роботы так часто зависают между пониманием и действием? Они видят чашку, но не знают, как обойти тарелку рядом и куда эту чашку поставить. Этот разрыв между зрением и действием — главный барьер на пути к по-настоящему автономным системам. Команда Embodied-R1 предлагает неожиданно простой и мощный выход: научить робота языку «указаний» — точкам и следам на картинке. Такой язык одинаково понятен и человеку, и машине, он напрямую связывает восприятие с действием, делая поведение робота предсказуемым, устойчивым и уверенным даже в незнакомых условиях.

Читать далее

0

andre_dataist Jul 29 at 06:49

ИИ поддерживает Запад в геополитике и сам учится играть в Minecraft: топ-10 исследований июня

16 min

1.9K

Machine learning * Artificial Intelligence

Review

ИИ-агенты учатся выживать в мире Minecraft, спорят о геополитике, берут на себя все больше работы и… начинают вести себя как настоящие личности. Как современные модели учатся планировать, сотрудничать, хитрить и даже формировать собственные взгляды? В этом обзоре — свежие прорывы в создании универсальных агентов, исследования предвзятости и то, как поведенческая наука помогает понять настоящую «психологию» ИИ.

Читать далее

+4

andre_dataist Jul 28 at 13:30

Роботы учатся видеть мир нашими глазами, сами пишут код и создают игры: топ-10 ИИ-исследований за май

15 min

1.9K

Artificial IntelligenceMachine learning *

Review

Каждый месяц появляются тысячи статей об ИИ, но по-настоящему интересных не так много. В майском топе собрал для вас 10 исследований, которые уже меняют наш мир: от нейросетей, которые учатся мыслить сами и создавать видеоигры, до децентрализованного обучения ИИ, робопомощников, обученных с помощью умных очков и новых подходов к разработке и тестированию ПО.

Читать далее

+3

andre_dataist Jul 4 at 12:54

Три письма из мультивселенной: какое будущее с ИИ мы выберем?

6 min

660

Machine learning * Artificial Intelligence

Представьте, что в будущем научились передавать информацию сквозь время. Вы получили три послания из разных параллельных реальностей: одно из них пугает, второе соблазняет, а третье описывает ту реальность, в которой мы, скорее всего, окажемся уже скоро. На каждом пометка: «Темное», «Светлое» и ~~«Нефильтрованное»~~ «Нормальное». Давайте откроем их по порядку.

Читать далее

+5

andre_dataist Jun 25 at 09:14

ИИ-суперагенты: приближают ли они нас к AGI?

12 min

1.9K

Artificial IntelligenceMachine learning *

Review

На протяжении веков идея машины, способной мыслить наравне с человеком, воспринималась скорее как сюжет научной фантастики, чем как практическая инженерная задача. Но сегодня появление ИИ-суперагентов, автономных систем, способных самостоятельно планировать и достигать сложных целей, заставило даже самых закоренелых скептиков задаться вопросом: мы наблюдаем за созданием очередного умного инструмента или присутствуем при строительстве фундамента, на котором будет создан настоящий AGI? Давайте разберемся, что на самом деле представляют собой эти системы и куда они нас ведут.

Читать далее

0

andre_dataist Jun 23 at 15:42

ChatGPT делает нас глупее? Что показало новое исследование MIT и Кембриджа

3 min

3.1K

Artificial IntelligenceMachine learning *

Review

Представьте: дедлайн близко, пальцы судорожно стучат по клавишам — и тут на сцену выходит ChatGPT. За пару минут он выкатывает идеальную работу: факты, цитаты, чёткая структура… А через полчаса вы уже не помните, о чём вообще писали.

Что, если эта забывчивость — лишь вершина айсберга? Учёные из MIT выяснили: каждая помощь от ChatGPT работает как микрозайм у собственного мозга. Проценты капают незаметно, но счёт выставят позже — в виде слабой памяти и тусклой креативности. Хотите узнать, как не влезть в когнитивную ипотеку? Читайте обзор нашумевшей статьи.

Читать далее

+4

andre_dataist Jun 2 at 17:44

Как ИИ-агенты управляют операционной системой и оживляют героев романов: топ-10 исследований ИИ за апрель 2025

20 min

2.3K

Machine learning * Artificial Intelligence

Review

Привет, Хабр! В апреле вышли несколько интересных исследований: один ИИ-агент без участия человека автоматически готовит научную статью, другой научился управлять любыми Windows-приложениями. Появились методы, позволяющие сотням симулированных пользователей выявлять слабые места в интерфейсе; платформа, где герои знакомых романов превращаются в ИИ-агентов и создают новые сюжеты; а также симуляция соцсетей, в которой сотни ИИ-юзеров читают посты, лайкают, репостят и проверяют фейки. Узнайте все подробности об этих и других исследованиях в этой статье.

Читать далее

+12

andre_dataist May 29 at 18:38

Тест на прочность: LLM против сложных задач

4 min

1K

Artificial IntelligenceMachine learning *

Review

В мире, где условия задач постоянно меняются, способность языковой модели учиться на ходу без перестройки своих параметров становится настоящим вызовом. Недавнее исследование показывает, как простые техники рефлексии, эволюционных эвристик и планирования превращают LLM в гибких агентов, способных адаптироваться к новым ситуациям. От классической игры «камень-ножницы-бумага» до сложных головоломок Ханойской башни — узнайте, какие стратегии работают лучше всего и какие перспективы откроются перед LLM в динамических средах.

Читать далее

0

andre_dataist May 28 at 17:20

Как ИИ научился думать картинками

4 min

1.4K

Artificial IntelligenceMachine learning *

Review

Современные ИИ-модели достигли впечатляющих успехов в понимании текстов и изображений, однако все еще не идеальны в задачах, где важна визуальная интуиция, таких как навигация и планирование действий. Сегодня большинство моделей конвертируют визуальную информацию в текстовую и только затем принимают решения, что приводит к потере важных деталей и делает решение задач менее интуитивным.

Когнитивная наука подтверждает, что человеческий мозг использует два канала мышления — текстовый (вербальный) и визуальный (невербальный). Но современные мультимодальные модели (MLLM) чаще всего полагаются на текстовые объяснения даже там, где визуальное мышление было бы намного эффективнее. До мая 2025 года не было серьезных исследований, которые бы ответили на вопрос: могут ли современные модели решать задачи исключительно с помощью визуальной информации без использования слов?

Читать далее

+6

andre_dataist May 12 at 12:55

Действительно ли у ИИ-агента есть внутренняя картина мира и представление о себе?

5 min

1.8K

Artificial IntelligenceMachine learning *

Review

Представьте ИИ-агента в виртуальном мире: он не знает ни прошлого, ни будущего, ему доступен лишь крошечный фрагмент окружения. И все же, шаг за шагом, этот агент начинает «чувствовать» свое положение, выстраивать внутренние карты и даже формировать зачатки собственного «я». В этой статье вы узнаете, почему за кулисами обучения RL-агента скрывается удивительный процесс создания его внутренней картины мира.

Читать далее

+2

andre_dataist May 9 at 14:12

Может ли ИИ обладать сознанием?

5 min

5.2K

Artificial Intelligence

Review

В то время как ИИ уверенно осваивает все новые сферы - от перевода текстов до разработки лекарств - мы все чаще сталкиваемся с фундаментальным вопросом: имеет ли право такой ИИ называться «сознательным»? Модель OpenAI-o1, построенная на архитектуре трансформеров и обученная с помощью RLHF, является отличным полигоном для исследования этого вопроса. Но можем ли мы всерьез говорить о зачатках сознания у машин - или это лишь очередная иллюзия, созданная алгоритмами?

Читать далее

+5

andre_dataist May 7 at 10:40

Добро пожаловать в эру опыта: почему обучение с подкреплением изменит мир

4 min

4.8K

Machine learning * Artificial Intelligence

Review

ИИ подходит к новой стадии развития, которая обещает радикальные изменения во многих аспектах жизни и науки. В статье ниже мы рассмотрим ключевые изменения и технологии, которые сделают возможным наступление новой эры - эры опыта. Вы узнаете, почему нынешние подходы, основанные на человеческих данных, уже исчерпали себя, и как обучение на собственном опыте агентов откроет совершенно новые горизонты в развитии ИИ.

Читать далее

+3

andre_dataist May 6 at 10:20

Может ли ИИ заменить вас на работе? Ученые проверили на 175 задачах

4 min

10K

Artificial IntelligenceMachine learning *

Review

ИИ уже пишет код, управляет проектами и общается с коллегами. Но можно ли прямо сейчас доверить ему всю офисную работу? Исследователи протестировали 7 самых мощных нейросетей на 175 реальных задачах. Спойлер: полностью заменить сотрудников нейросети пока не могут. Но давайте разберемся, что именно у них получается лучше всего, какие задачи еще вызывают трудности и стоит ли уже сегодня нанимать себе цифрового помощника в штат.

Читать далее

+5

andre_dataist Apr 30 at 13:33

VideoGameBench: 20 рандомных ретро-игр против нейросети — кто кого?

4 min

636

Artificial IntelligenceMachine learning *

Review

Языковые модели уже решают олимпиады и пишут код «на лету», так что пора бы им рулить и в Dark Souls… но (спойлер): первые же пиксели экшена вгоняют нейросеть в ступор. Почему ИИ пасует там, где нужен мгновенный инстинкт геймера? Разбираемся в статье.

Читать далее

+1

andre_dataist Apr 29 at 07:06

Обучаем ИИ-агентов играть в видеоигры: новый подход с LLM и рефлексией

4 min

865

Machine learning * Artificial Intelligence

Review

Современные ИИ-системы для видеоигр часто упираются в ограничения классических методов, таких как обучение с подкреплением (RL): они требуют больших вычислительных ресурсов, длительного обучения и тонкой настройки под каждую игру. В ответ на эти сложности исследователи из Tencent предложили новый подход к созданию ИИ-агентов для 3D-игр — с опорой на большие языковые модели (LLM) и специализированный язык описания поведения. Такой метод позволяет быстро генерировать эффективные стратегии без переобучения, и, как показывают эксперименты, демонстрирует впечатляющие результаты. Разбираемся, как это работает.

Читать далее

+1

andre_dataist Apr 23 at 13:47

WorkTeam: новый мультиагентный фреймворк для автоматизации сложных бизнес-процессов

3 min

2K

Machine learning * Artificial Intelligence

Review

В стремительно меняющемся мире бизнеса автоматизация процессов перестала быть роскошью - сегодня это жизненная необходимость. Представьте, что вы можете переводить даже самые сложные инструкции на привычном человеческом языке напрямую в готовый бизнес-процесс, обходясь без десятков часов ручной разработки и без узкоспециализированных экспертов. Звучит как фантастика? Новая мультиагентная платформа WorkTeam претендует на то, чтобы воплотить это в реальность.

Читать далее

0

andre_dataist Apr 16 at 10:46

Как ИИ помогает исследовать мозг, а роботы научились понимать трехмерный мир: топ-10 исследований ИИ за март 2025

14 min

901

Artificial IntelligenceMachine learning *

Review

Привет, Хабр! Предлагаю взглянуть на десять исследований в области искусственного интеллекта (ИИ), которые особенно запомнились мне в прошлом месяце: мультимодальная Qwen2.5-Omni, автоматизированные ИИ-лаборатории, новые подходы к медицинской симуляции и нейровизуализации мозга. Постарался изложить обо всем кратко и простыми словами.

Читать далее

+3

5