Обновить
33
17
Датаист@andre_dataist

🤖 Дневник ИИ-исследователя

Отправить сообщение

Open-Sora 2.0: Видеогенерация коммерческого уровня за $200k — миф или реальность?

Время на прочтение5 мин
Охват и читатели3.2K

Генерация видео с помощью ИИ переживает настоящий бум. Модели становятся умнее, а видео все реалистичнее. Но у этого прогресса есть обратная сторона: затраты растут экспоненциально. Нужны все более крупные модели, гигантские объемы данных и колоссальные вычислительные мощности для обучения. Это создает высокий порог входа для исследователей и компаний, тормозит демократизацию технологии и концентрирует инновации в руках гигантов с почти безграничными бюджетами. Исследование "Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k" бросает вызов этой проблеме, утверждая, что высокое качество генерации видео достижимо при значительно меньших затратах.

Читать далее

Интеллект как результат эволюции или игра на выживание с ИИ

Время на прочтение3 мин
Охват и читатели1.3K

Современные исследования искусственного интеллекта зачастую фокусируются на оценке его способностей через субъективные или узкоспециализированные тесты. Однако недавно китайские ученые предложили принципиально новый подход: рассматривать интеллект как эволюционную способность находить решения с минимальным числом неудачных попыток. Такой подход позволяет объективно измерять интеллект как живых организмов, так и искусственных систем.

Читать далее

ИИ смеется последним: новое исследование подтверждает, что LLM в среднем создают мемы лучше людей

Время на прочтение3 мин
Охват и читатели984

ИИ стремительно внедряется в самые разные сферы жизни, и творческий процесс не является исключением. Особенно любопытно, как большие языковые модели (LLM) могут влиять на совместное творчество с людьми в области интернет-мемов. Мемы стали универсальным языком интернет-культуры, где юмор и культурные нюансы переплетаются в визуально-текстовом формате. Недавнее исследование выяснило насколько полезным может быть сотрудничество людей и ИИ для генерации мемов. Сможет ли ИИ повысить продуктивность и сохранить оригинальность, или полностью заменит человеческое творчество?

Читать далее

Википедия в эпоху LLM: когда ИИ начинает влиять на коллективный разум

Время на прочтение4 мин
Охват и читатели2.9K

Большие языковые модели (LLM), которые буквально за последние пару лет научились писать тексты почти как человек, теперь начинают активно взаимодействовать с крупнейшей онлайн-энциклопедией в мире — Википедией. Исследователи из Китая решили разобраться, что происходит, когда ИИ встречается с коллективным разумом тысяч добровольцев.

Читать далее

Как научить ИИ-агентов лучше планировать задачи с помощью мета-плана?

Время на прочтение4 мин
Охват и читатели2.1K

Языковые модели (LLM) уже умеют решать сложные задачи, но их способность к планированию остается несовершенной. Исследователи из Пекинского университета представили новый метод MPO (Meta Plan Optimization), который помогает LLM-агентам эффективнее выполнять многошаговые задачи.

Читать далее

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

Время на прочтение3 мин
Охват и читатели1.7K

Большие языковые модели (LLM) уже сегодня могут решать сложные задачи. Но почему некоторые из них рассуждают эффективнее, а другие почти не прибавляют в результативности после десятков циклов обучения?

Недавнее исследование команды из Стэнфорда «Cognitive Behaviors that Enable Self-Improving Reasoners» дает убедительный ответ: все дело в «когнитивных стратегиях поведения» - специальных стратегиях, которые помогают моделям самоулучшаться.

Читать далее

Когда ИИ-риэлтор убеждает лучше людей: новое исследование

Время на прочтение4 мин
Охват и читатели1.7K

Сегодня большие языковые модели (LLM) умеют писать тексты, вести диалоги и решать интеллектуальные задачи. Но их способность убеждать до сих пор изучена недостаточно. Между тем, именно искусство убеждения лежит в основе множества экономических процессов — по оценкам, до 30% ВВП США формируется благодаря рекламе, лоббированию, переговорам и другим видам коммуникации, где важно «продать» идею или продукт.

Исследователи из Чикагского университета разработали ИИ-агента на базе LLM, который массово генерирует персонализированные предложения по недвижимости. Что из этого вышло?

Читать далее

Способен ли ИИ помочь нам в дипломатии?

Время на прочтение4 мин
Охват и читатели1.2K

Исследования по применению больших языковых моделей (LLM) в политике начинают набирать обороты. Несмотря на впечатляющие успехи в понимании естественного языка, до сих пор не существовало бенчмарка, который бы охватывал все этапы принятия политических решений. Исследователи восполнили этот пробел, разработав UNBench — комплексный бенчмарк для оценки LLM на основе данных Совета Безопасности ООН (СБ ООН).

Читать далее

MLGym – новый шаг в автоматизации научных исследований

Время на прочтение4 мин
Охват и читатели2.9K

За последние время ускорение научных открытий с использованием ИИ стало одной из ключевых амбиций исследовательского сообщества. Исторически сложилось, что задачи автоматизации требовали создания гибких инструментов и бенчмарков для объективной оценки результатов.

Однако существующие фреймворки часто ограничиваются узкими задачами или слабо подходят для комплексных исследований, где требуется не просто воспроизведение известных результатов, а генерация новых идей, гипотез и алгоритмов. Поэтому исследователи представили MLGym и MLGym-Bench - первую среду для разработки и оценки ИИ-агентов в исследовательских задачах.

Читать далее

Технический отчет мультимодальной Qwen2.5-VL: прорыв в анализе документов и управлении интерфейсами

Время на прочтение4 мин
Охват и читатели3.4K

Привет, Хабр! Вчера команда Qwen (Alibaba) представила долгожданный техрепорт визуальной языковой модели (VLM) Qwen2.5-VL. Новую модель улучшили в задачах компьютерного зрения, локализации объектов, анализа документов и понимания видео длительностью до часа. В этой статье мы разберем ключевые технические инновации, архитектурные особенности и экспериментальные результаты модели, а также взглянем на интересные детали, упомянутые в официальном отчете.

Читать далее

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания

Время на прочтение3 мин
Охват и читатели1.7K

Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» (unlearning) больших языковых моделей – методе ReLearn, который позволяет не просто «забывать» нежелательную информацию, но и сохранять высокое качество генерируемого текста. Давайте подробно разберем как это работает.

Читать далее

Информация

В рейтинге
388-й
Зарегистрирован
Активность