Новости / Профиль andre

Датаист@andre_dataist

🤖 Дневник ИИ-исследователя

Подписчики

ПрофильСтатьи107Посты2Новости12Комментарии24

andre_dataist 3 апр 2025 в 17:16

Open-Sora 2.0: Видеогенерация коммерческого уровня за $200k — миф или реальность?

5 мин

8.3K

Искусственный интеллектМашинное обучение *

Генерация видео с помощью ИИ переживает настоящий бум. Модели становятся умнее, а видео все реалистичнее. Но у этого прогресса есть обратная сторона: затраты растут экспоненциально. Нужны все более крупные модели, гигантские объемы данных и колоссальные вычислительные мощности для обучения. Это создает высокий порог входа для исследователей и компаний, тормозит демократизацию технологии и концентрирует инновации в руках гигантов с почти безграничными бюджетами. Исследование "Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k" бросает вызов этой проблеме, утверждая, что высокое качество генерации видео достижимо при значительно меньших затратах.

andre_dataist 28 мар 2025 в 07:20

Интеллект как результат эволюции или игра на выживание с ИИ

3 мин

3.3K

Искусственный интеллектМашинное обучение *

Современные исследования искусственного интеллекта зачастую фокусируются на оценке его способностей через субъективные или узкоспециализированные тесты. Однако недавно китайские ученые предложили принципиально новый подход: рассматривать интеллект как эволюционную способность находить решения с минимальным числом неудачных попыток. Такой подход позволяет объективно измерять интеллект как живых организмов, так и искусственных систем.

andre_dataist 26 мар 2025 в 13:43

ИИ смеется последним: новое исследование подтверждает, что LLM в среднем создают мемы лучше людей

3 мин

2.7K

Машинное обучение * Искусственный интеллект

ИИ стремительно внедряется в самые разные сферы жизни, и творческий процесс не является исключением. Особенно любопытно, как большие языковые модели (LLM) могут влиять на совместное творчество с людьми в области интернет-мемов. Мемы стали универсальным языком интернет-культуры, где юмор и культурные нюансы переплетаются в визуально-текстовом формате. Недавнее исследование выяснило насколько полезным может быть сотрудничество людей и ИИ для генерации мемов. Сможет ли ИИ повысить продуктивность и сохранить оригинальность, или полностью заменит человеческое творчество?

andre_dataist 21 мар 2025 в 07:01

Википедия в эпоху LLM: когда ИИ начинает влиять на коллективный разум

4 мин

7.2K

Машинное обучение * Искусственный интеллектWiki-проекты *

Большие языковые модели (LLM), которые буквально за последние пару лет научились писать тексты почти как человек, теперь начинают активно взаимодействовать с крупнейшей онлайн-энциклопедией в мире — Википедией. Исследователи из Китая решили разобраться, что происходит, когда ИИ встречается с коллективным разумом тысяч добровольцев.

andre_dataist 14 мар 2025 в 09:30

Как научить ИИ-агентов лучше планировать задачи с помощью мета-плана?

4 мин

5.3K

Машинное обучение * Искусственный интеллект

Языковые модели (LLM) уже умеют решать сложные задачи, но их способность к планированию остается несовершенной. Исследователи из Пекинского университета представили новый метод MPO (Meta Plan Optimization), который помогает LLM-агентам эффективнее выполнять многошаговые задачи.

andre_dataist 11 мар 2025 в 20:39

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

3 мин

4.2K

Искусственный интеллектМашинное обучение *

Большие языковые модели (LLM) уже сегодня могут решать сложные задачи. Но почему некоторые из них рассуждают эффективнее, а другие почти не прибавляют в результативности после десятков циклов обучения?

Недавнее исследование команды из Стэнфорда «Cognitive Behaviors that Enable Self-Improving Reasoners» дает убедительный ответ: все дело в «когнитивных стратегиях поведения» - специальных стратегиях, которые помогают моделям самоулучшаться.

andre_dataist 26 фев 2025 в 14:12

Когда ИИ-риэлтор убеждает лучше людей: новое исследование

4 мин

4.2K

Искусственный интеллектМашинное обучение *

Сегодня большие языковые модели (LLM) умеют писать тексты, вести диалоги и решать интеллектуальные задачи. Но их способность убеждать до сих пор изучена недостаточно. Между тем, именно искусство убеждения лежит в основе множества экономических процессов — по оценкам, до 30% ВВП США формируется благодаря рекламе, лоббированию, переговорам и другим видам коммуникации, где важно «продать» идею или продукт.

Исследователи из Чикагского университета разработали ИИ-агента на базе LLM, который массово генерирует персонализированные предложения по недвижимости. Что из этого вышло?

andre_dataist 25 фев 2025 в 14:29

Способен ли ИИ помочь нам в дипломатии?

4 мин

3.3K

Искусственный интеллект

Исследования по применению больших языковых моделей (LLM) в политике начинают набирать обороты. Несмотря на впечатляющие успехи в понимании естественного языка, до сих пор не существовало бенчмарка, который бы охватывал все этапы принятия политических решений. Исследователи восполнили этот пробел, разработав UNBench — комплексный бенчмарк для оценки LLM на основе данных Совета Безопасности ООН (СБ ООН).

andre_dataist 23 фев 2025 в 13:50

MLGym – новый шаг в автоматизации научных исследований

4 мин

7.2K

Искусственный интеллект

За последние время ускорение научных открытий с использованием ИИ стало одной из ключевых амбиций исследовательского сообщества. Исторически сложилось, что задачи автоматизации требовали создания гибких инструментов и бенчмарков для объективной оценки результатов.

Однако существующие фреймворки часто ограничиваются узкими задачами или слабо подходят для комплексных исследований, где требуется не просто воспроизведение известных результатов, а генерация новых идей, гипотез и алгоритмов. Поэтому исследователи представили MLGym и MLGym-Bench - первую среду для разработки и оценки ИИ-агентов в исследовательских задачах.

andre_dataist 21 фев 2025 в 10:27

Технический отчет мультимодальной Qwen2.5-VL: прорыв в анализе документов и управлении интерфейсами

4 мин

8.8K

Искусственный интеллект

Привет, Хабр! Вчера команда Qwen (Alibaba) представила долгожданный техрепорт визуальной языковой модели (VLM) Qwen2.5-VL. Новую модель улучшили в задачах компьютерного зрения, локализации объектов, анализа документов и понимания видео длительностью до часа. В этой статье мы разберем ключевые технические инновации, архитектурные особенности и экспериментальные результаты модели, а также взглянем на интересные детали, упомянутые в официальном отчете.

+10

andre_dataist 20 фев 2025 в 16:20

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания

3 мин

4.3K

Искусственный интеллект

Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» (unlearning) больших языковых моделей – методе ReLearn, который позволяет не просто «забывать» нежелательную информацию, но и сохранять высокое качество генерируемого текста. Давайте подробно разберем как это работает.