News / Profile of runaway_llm / Habr

Андрей Пешков @runaway_llm

User

ProfileArticles18PostsNews289Comments83

runaway_llm Oct 1 at 14:02

В Google DeepMind обучили ИИ Dreamer 4 добывать алмазы в Minecraft — почему это важно

2 min

13K

Artificial IntelligenceMachine learning *

Исследователи Google DeepMind представили агента Dreamer 4, которому удалось выполнить один из самых известных тестов для ИИ в Minecraft — добыть алмазы. Речь о задаче длиной порядка двадцати тысяч последовательных действий: раньше ее обычно решали через длительное онлайн-обучение, но в этот раз агент освоил умение по офлайн-данным, что стало шагом вперед.

Читать далее

+2

runaway_llm Sep 30 at 21:36

Президент OpenAI рассказал о будущем ИИ: каждому жителю Земли — по GPU

1 min

4.9K

Artificial IntelligenceMachine learning *

Директор OpenAI Грег Брокман в недавнем совместном интервью с Сэмом Альтманом и Дженсеном Хуангом описал свое видение того, как может развиваться ИИ. По его словам, когда-нибудь у каждого человека будет свой персональный ИИ-агент, который не только отвечает на запросы, а выполняет работу постоянно, даже когда владелец спит. В идеале каждый агент должен работать на выделенном ускорителе, поэтому Брокман считает, что человечеству понадобится порядка 10 миллиардов GPU.

Читать далее

+1

runaway_llm Sep 30 at 17:22

Представлена Sora 2 — доступна бесплатно, но пока с ограничениями

2 min

11K

Artificial IntelligenceMachine learning *

OpenAI представила свою новую ИИ-модель генерации видео — Sora 2. Новинка отличается лучшим «пониманием» физики (сложные движения, взаимодействия предметов, повреждения и т. д.), а также создает ролики со звуком. Длительность ролика — 16 секунд.

Читать далее

+3

runaway_llm Sep 30 at 15:40

Представлен прототип Imagine with Claude — ИИ-песочницы на базе Claude Sonnet 4.5

2 min

3K

Artificial IntelligenceMachine learning *

Вместе с анонсом Claude Sonnet 4.5, Anthropic запустила экспериментальный режим Imagine with Claude — браузерную песочницу, где приложения создаются на лету в диалоге с моделью. Предполагается, что пользователю достаточно описать задачу, и нейросеть соберет интерфейс и логику прямо в окне браузера. В отличие от привычной схемы работы, когда ИИ отдает готовый код или документ, здесь Claude строит работающий инструмент целиком — от кнопок и форм до базовой логики.

Читать далее

0

runaway_llm Sep 30 at 06:12

Новый ИИ Claude Sonnet 4.5 может программировать до 30 часов подряд

2 min

2.6K

Machine learning * Artificial Intelligence

После вчерашнего запуска Claude Sonnet 4.5, который по большинству бенчмарков стал лучшим ИИ для программирования, многие СМИ отдельно выделили его возможность непрерывно работать продолжительное время. Anthropic заявляет, что в одном из внутренних тестов Claude Sonnet 4.5 самостоятельно создал чат-приложение типа Slack или Teams, написал 11 тысяч строк кода и остановился. На задачу ушло около 30 часов, что в 4 раза выше предыдущего рекорда автономной работы для ИИ Anthropic.

Читать далее

0

runaway_llm Sep 29 at 21:07

OpenAI планирует запустить ИИ-версию TikTok — Wired

1 min

1.1K

Artificial IntelligenceMachine learning *

По данным источников издания Wired в OpenAI, компания планирует запустить отдельное приложение для ИИ-видео, которое по дизайну и структуре напоминает TikTok. Приложение будет работать на базе новой системы генерации видео Sora 2: пользователи смогут создавать видеоролики до 10 секунд, делиться ими в ленте, смотреть чужие видео, ставить лайки, комментарии и т. д. Также с помощью все той же Sora 2 можно сделать ремикс чужого видео.

Читать далее

0

runaway_llm Sep 29 at 17:25

Представлен Claude Sonnet 4.5: новый лидер в задачах программирования

2 min

6.4K

Machine learning * Artificial Intelligence

Компания Anthropic анонсировала новую модель Claude Sonnet 4.5, сделав ставку на улучшение в программировании и работе с агентными сценариями. На бенчмарке SWE-bench Verified — наборе реальных задач по исправлению ошибок в open-source-репозиториях — Sonnet 4.5 показала 77,2% успешных решений. При использовании параллельного инференса («несколько попыток с отбором лучшей») результат поднялся до 82% — лучший показатель среди открыто доступных моделей.

Читать далее

+3

runaway_llm Sep 29 at 13:31

В ChatGPT добавили функцию родительского контроля

1 min

731

Artificial IntelligenceMachine learning *

OpenAI запустила функцию родительского контроля для ChatGPT: доступ к ней можно получить в меню «Настройки» веб-версии и мобильных приложений или по прямой ссылке. Учитывайте, что функция запускается волнами и может быть какое-то время недоступна на вашем аккаунте.

Читать далее

0

runaway_llm Sep 29 at 11:20

Представлен DeepSeek-V3.2-Exp: в разы дешевле при той же производительности

1 min

4.3K

Artificial IntelligenceMachine learning *

Представлена экспериментальная модель DeepSeek-V3.2-Exp, в которой разработчики впервые опробовали новую схему разреженного внимания (DSA). Модель доступна в веб-версии и приложениях (раскатка может идти поэтапно), API, а также на Hugging Face.

Читать далее

+1

runaway_llm Sep 29 at 10:52

Создатели ChatGPT выпустили сборник из 300+ промптов для разных сфер

1 min

17K

Machine learning * Artificial Intelligence

В OpenAI Academy появился сборник из более 300 промптов, написанных специалистами компании для разных сфер — от повседневных задач до программирования. Важно отметить, что отдельные статьи с промптами были опубликованы еще в мае-июне и обновлены в начале августа (после выпуска GPT-5), теперь же OpenAI собрала их все в рамках одного хаба с удобной навигацией.

Читать далее

+3

runaway_llm Sep 28 at 19:33

GPT-5 частично прошла «тест Гёделя» на доказательство новых математических гипотез

2 min

2.4K

Artificial IntelligenceMachine learning *

На arXiv опубликован препринт с описанием нового способа проверки больших языковых моделей — «теста Гёделя» (название дано в честь Курта Гёделя, символа строгих математических доказательств). В отличие от привычных бенчмарков, он проверяет не умение решать известные задачи, а способность находить новые, пусть и простые, математические результаты.

Читать далее

-3

runaway_llm Sep 28 at 09:06

В OpenAI признали, что подменяют ответы одной модели ChatGPT на другую

1 min

23K

Machine learning * Artificial Intelligence

Глава приложения ChatGPT Ник Терли рассказал, что новая версия приложения при работе с GPT-4o автоматически переадресовывает некоторые запросы к GPT-5, если считает, что пользователь затрагивает слишком чувствительные и эмоциональные темы. В OpenAI считают, что улучшенные алгоритмы безопасности новой модели помогут дать более качественные ответы. Терли добавил, что пользователь всегда может спросить в чате, какая модель с ним разговаривает, и получить корректный ответ.

Читать далее

-17

runaway_llm Sep 27 at 19:13

Сэм Альтман ожидает, что ИИ превзойдет человека к 2030 году

1 min

4.3K

Artificial IntelligenceMachine learning *

В интервью сети Axel Springer Global Reporters Сэм Альтман высказался, что ИИ может превзойти человека уже к 2030 году. По его словам, к этому году у человечества появятся ИИ исключительно мощные и способные делать вещи, которые люди сами не умеют. При этом в 2026 году Альтман ожидает темпы прогресса не меньше, чем в 2024–25 годах. Также он считает, что ИИ уже скоро возьмет на себя 30–40% человеческих задач. Но при этом люди все равно будут в центре истории, ведь в их руках останутся фокус и инициатива.

Читать далее

+1

runaway_llm Sep 27 at 10:52

GPT-5 победил в необычном бенчмарке Among AIs

2 min

2K

Artificial IntelligenceMachine learning *

Команда 4Wall AI представила Among AIs: бенчмарк, в котором разные ИИ соревнуются в Among Us. Это вдохновленная «Мафией» видеоигра, правила которой были слегка упрощены для бенчмарка: на космическом корабле есть пять мирных, которые выполняют задания, и один «самозванец» (Impostor), который может саботировать и даже убивать мирных. При обнаружении трупа оставшиеся собираются, чтобы обсуждением и голосованием определить самозванца, который будет выброшен в открытый космос. Нередко самозванцем оказывается один из мирных, его называют scapegoat (козел отпущения).

Читать далее

+7

runaway_llm Sep 26 at 19:29

Сооснователь Palantir Питер Тиль: «контроль над ИИ ведет к Антихристу»

2 min

4K

Machine learning * Artificial Intelligence

Питер Тиль, сооснователь Palantir и PayPal, заявил что попытки жестко регулировать искусственный интеллект не принесут обществу пользы, а наоборот — ускорят приход «Антихриста». По его словам, лозунги «мира и безопасности» через контроль технологий прокладывают дорогу к тоталитарному мировому порядку. Эти тезисы прозвучали на закрытой серии лекций под названием «Антихрист: цикл из четырех лекций» (на данный момент прошли только две), о которой сообщили несколько СМИ.

Читать далее

+5

runaway_llm Sep 26 at 15:53

Создание ИИ-видео расходует больше электричества, чем ожидалось — исследование Hugging Face

1 min

1.1K

Artificial IntelligenceMachine learning *

Команда Hugging Face исследовала сколько на самом деле тратит электричества создание видео с помощью ИИ. Оказалось, что если удвоить длительность ролика или разрешение кадра, расход электричества увеличивается почти вчетверо. Это больше, чем можно ожидать: многие сервисы по созданию видео тарифицируют услуги по секундам, то есть линейно.

Читать далее

+4

runaway_llm Sep 26 at 11:46

Google улучшила Gemini 2.5 Flash. ИИ доступен бесплатно

1 min

7.9K

Artificial IntelligenceMachine learning *

Google выпустила новые версии Gemini 2.5 Flash и Gemini 2.5 Flash Lite, ориентированные на быстрые повседневные задачи. Для Gemini 2.5 Flash улучшили использование инструментов в многоэтапных задачах, а также подтянули результаты в бенчмарке на программирование SWE-Bench Verified — с 48,9% до 54%. Gemini 2.5 Flash Lite теперь лучше следует инструкциям, распознает графику и аудио и дает более четкие, короткие ответы. Для обеих моделей заявлена экономия токенов: до 24% в случае с Gemini 2.5 Flash и 50% в случае с Gemini 2.5 Flash Lite.

Читать далее

+3

runaway_llm Sep 26 at 10:12

OpenAI измерила влияние ИИ на экономику с помощью 1320 реальных задач

1 min

3.1K

Machine learning * Artificial Intelligence

OpenAI представила GDPval — бенчмарк для оценки влияния ИИ на реальную экономику. В отличие от привычных тестов вроде MMLU, где модели отвечают на короткие вопросы, здесь проверяются полноценные рабочие задачи из ключевых отраслей, формирующих ВВП. Идея проста: замерять не абстрактные баллы, а то, насколько ИИ реально справляется с работой, за которую платят деньги.

Читать далее

+10

runaway_llm Sep 25 at 18:14

xAI подала в суд на OpenAI: «украли секреты Grok и строительства дата-центров»

1 min

2.5K

Artificial IntelligenceMachine learning *

xAI Илона Маска подала новый иск против OpenAI в федеральный суд Северного округа Калифорнии, отделив его от августовского дела против бывшего сотрудника. По утверждению xAI, OpenAI целенаправленно переманивала людей, чтобы получить доступ к секретам: исходному коду Grok и материалам о стратегиях дата-центров. В жалобе прямо говорится о «стратегической кампании» по найму.

Читать далее

-1

runaway_llm Sep 25 at 17:21

Запущена ChatGPT Pulse

1 min

9.1K

Artificial IntelligenceMachine learning *

OpenAI представила ChatGPT Pulse - новую функцию для мобильного приложения, в которой ИИ готовит для пользователя сводку на день. Подготовка стартует ночью: ИИ перечитывает чаты с пользователем, изучает его интересы и предпочтения, отдельно анализирует последние события, а затем делает персонализированную подборку информации.

Читать далее

+4

3

4 5 ...