Search
Write a publication
Pull to refresh
14
8
Андрей Кузьминых @andre_dataist

Технологический предприниматель

Send message

Open-Sora 2.0: Видеогенерация коммерческого уровня за $200k — миф или реальность?

Reading time5 min
Views4.4K

Генерация видео с помощью ИИ переживает настоящий бум. Модели становятся умнее, а видео все реалистичнее. Но у этого прогресса есть обратная сторона: затраты растут экспоненциально. Нужны все более крупные модели, гигантские объемы данных и колоссальные вычислительные мощности для обучения. Это создает высокий порог входа для исследователей и компаний, тормозит демократизацию технологии и концентрирует инновации в руках гигантов с почти безграничными бюджетами. Исследование "Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k" бросает вызов этой проблеме, утверждая, что высокое качество генерации видео достижимо при значительно меньших затратах.

Читать далее

Интеллект как результат эволюции или игра на выживание с ИИ

Reading time3 min
Views1.9K

Современные исследования искусственного интеллекта зачастую фокусируются на оценке его способностей через субъективные или узкоспециализированные тесты. Однако недавно китайские ученые предложили принципиально новый подход: рассматривать интеллект как эволюционную способность находить решения с минимальным числом неудачных попыток. Такой подход позволяет объективно измерять интеллект как живых организмов, так и искусственных систем.

Читать далее

ИИ смеется последним: новое исследование подтверждает, что LLM в среднем создают мемы лучше людей

Reading time3 min
Views1.5K

ИИ стремительно внедряется в самые разные сферы жизни, и творческий процесс не является исключением. Особенно любопытно, как большие языковые модели (LLM) могут влиять на совместное творчество с людьми в области интернет-мемов. Мемы стали универсальным языком интернет-культуры, где юмор и культурные нюансы переплетаются в визуально-текстовом формате. Недавнее исследование выяснило насколько полезным может быть сотрудничество людей и ИИ для генерации мемов. Сможет ли ИИ повысить продуктивность и сохранить оригинальность, или полностью заменит человеческое творчество?

Читать далее

Википедия в эпоху LLM: когда ИИ начинает влиять на коллективный разум

Reading time4 min
Views4K

Большие языковые модели (LLM), которые буквально за последние пару лет научились писать тексты почти как человек, теперь начинают активно взаимодействовать с крупнейшей онлайн-энциклопедией в мире — Википедией. Исследователи из Китая решили разобраться, что происходит, когда ИИ встречается с коллективным разумом тысяч добровольцев.

Читать далее

Как научить ИИ-агентов лучше планировать задачи с помощью мета-плана?

Reading time4 min
Views2.9K

Языковые модели (LLM) уже умеют решать сложные задачи, но их способность к планированию остается несовершенной. Исследователи из Пекинского университета представили новый метод MPO (Meta Plan Optimization), который помогает LLM-агентам эффективнее выполнять многошаговые задачи.

Читать далее

Четыре поведенческие стратегии для улучшения рассуждающих языковых моделей

Reading time3 min
Views2.4K

Большие языковые модели (LLM) уже сегодня могут решать сложные задачи. Но почему некоторые из них рассуждают эффективнее, а другие почти не прибавляют в результативности после десятков циклов обучения?

Недавнее исследование команды из Стэнфорда «Cognitive Behaviors that Enable Self-Improving Reasoners» дает убедительный ответ: все дело в «когнитивных стратегиях поведения» - специальных стратегиях, которые помогают моделям самоулучшаться.

Читать далее

Когда ИИ-риэлтор убеждает лучше людей: новое исследование

Reading time4 min
Views2.4K

Сегодня большие языковые модели (LLM) умеют писать тексты, вести диалоги и решать интеллектуальные задачи. Но их способность убеждать до сих пор изучена недостаточно. Между тем, именно искусство убеждения лежит в основе множества экономических процессов — по оценкам, до 30% ВВП США формируется благодаря рекламе, лоббированию, переговорам и другим видам коммуникации, где важно «продать» идею или продукт.

Исследователи из Чикагского университета разработали ИИ-агента на базе LLM, который массово генерирует персонализированные предложения по недвижимости. Что из этого вышло?

Читать далее

Способен ли ИИ помочь нам в дипломатии?

Reading time4 min
Views1.9K

Исследования по применению больших языковых моделей (LLM) в политике начинают набирать обороты. Несмотря на впечатляющие успехи в понимании естественного языка, до сих пор не существовало бенчмарка, который бы охватывал все этапы принятия политических решений. Исследователи восполнили этот пробел, разработав UNBench — комплексный бенчмарк для оценки LLM на основе данных Совета Безопасности ООН (СБ ООН).

Читать далее

MLGym – новый шаг в автоматизации научных исследований

Reading time4 min
Views4.2K

За последние время ускорение научных открытий с использованием ИИ стало одной из ключевых амбиций исследовательского сообщества. Исторически сложилось, что задачи автоматизации требовали создания гибких инструментов и бенчмарков для объективной оценки результатов.

Однако существующие фреймворки часто ограничиваются узкими задачами или слабо подходят для комплексных исследований, где требуется не просто воспроизведение известных результатов, а генерация новых идей, гипотез и алгоритмов. Поэтому исследователи представили MLGym и MLGym-Bench - первую среду для разработки и оценки ИИ-агентов в исследовательских задачах.

Читать далее

Технический отчет мультимодальной Qwen2.5-VL: прорыв в анализе документов и управлении интерфейсами

Reading time4 min
Views4.5K

Привет, Хабр! Вчера команда Qwen (Alibaba) представила долгожданный техрепорт визуальной языковой модели (VLM) Qwen2.5-VL. Новую модель улучшили в задачах компьютерного зрения, локализации объектов, анализа документов и понимания видео длительностью до часа. В этой статье мы разберем ключевые технические инновации, архитектурные особенности и экспериментальные результаты модели, а также взглянем на интересные детали, упомянутые в официальном отчете.

Читать далее

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания

Reading time3 min
Views2.5K

Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» (unlearning) больших языковых моделей – методе ReLearn, который позволяет не просто «забывать» нежелательную информацию, но и сохранять высокое качество генерируемого текста. Давайте подробно разберем как это работает.

Читать далее

Information

Rating
1,211-th
Registered
Activity