All streams
Search
Write a publication
Pull to refresh
25
97.6
Андрей Пешков @runaway_llm

User

Send message

В Google DeepMind обучили ИИ Dreamer 4 добывать алмазы в Minecraft — почему это важно

Reading time2 min
Views13K

Исследователи Google DeepMind представили агента Dreamer 4, которому удалось выполнить один из самых известных тестов для ИИ в Minecraft — добыть алмазы. Речь о задаче длиной порядка двадцати тысяч последовательных действий: раньше ее обычно решали через длительное онлайн-обучение, но в этот раз агент освоил умение по офлайн-данным, что стало шагом вперед.

Читать далее

Президент OpenAI рассказал о будущем ИИ: каждому жителю Земли — по GPU

Reading time1 min
Views4.9K

Директор OpenAI Грег Брокман в недавнем совместном интервью с Сэмом Альтманом и Дженсеном Хуангом описал свое видение того, как может развиваться ИИ. По его словам, когда-нибудь у каждого человека будет свой персональный ИИ-агент, который не только отвечает на запросы, а выполняет работу постоянно, даже когда владелец спит. В идеале каждый агент должен работать на выделенном ускорителе, поэтому Брокман считает, что человечеству понадобится порядка 10 миллиардов GPU.

Читать далее

Представлена Sora 2 — доступна бесплатно, но пока с ограничениями

Reading time2 min
Views11K

OpenAI представила свою новую ИИ-модель генерации видео — Sora 2. Новинка отличается лучшим «пониманием» физики (сложные движения, взаимодействия предметов, повреждения и т. д.), а также создает ролики со звуком. Длительность ролика — 16 секунд.

Читать далее

Представлен прототип Imagine with Claude — ИИ-песочницы на базе Claude Sonnet 4.5

Reading time2 min
Views3K

Вместе с анонсом Claude Sonnet 4.5, Anthropic запустила экспериментальный режим Imagine with Claude — браузерную песочницу, где приложения создаются на лету в диалоге с моделью. Предполагается, что пользователю достаточно описать задачу, и нейросеть соберет интерфейс и логику прямо в окне браузера. В отличие от привычной схемы работы, когда ИИ отдает готовый код или документ, здесь Claude строит работающий инструмент целиком — от кнопок и форм до базовой логики.

Читать далее

Новый ИИ Claude Sonnet 4.5 может программировать до 30 часов подряд

Reading time2 min
Views2.6K

После вчерашнего запуска Claude Sonnet 4.5, который по большинству бенчмарков стал лучшим ИИ для программирования, многие СМИ отдельно выделили его возможность непрерывно работать продолжительное время. Anthropic заявляет, что в одном из внутренних тестов Claude Sonnet 4.5 самостоятельно создал чат-приложение типа Slack или Teams, написал 11 тысяч строк кода и остановился. На задачу ушло около 30 часов, что в 4 раза выше предыдущего рекорда автономной работы для ИИ Anthropic.

Читать далее

OpenAI планирует запустить ИИ-версию TikTok — Wired

Reading time1 min
Views1.1K

По данным источников издания Wired в OpenAI, компания планирует запустить отдельное приложение для ИИ-видео, которое по дизайну и структуре напоминает TikTok. Приложение будет работать на базе новой системы генерации видео Sora 2: пользователи смогут создавать видеоролики до 10 секунд, делиться ими в ленте, смотреть чужие видео, ставить лайки, комментарии и т. д. Также с помощью все той же Sora 2 можно сделать ремикс чужого видео.

Читать далее

Представлен Claude Sonnet 4.5: новый лидер в задачах программирования

Reading time2 min
Views6.4K

Компания Anthropic анонсировала новую модель Claude Sonnet 4.5, сделав ставку на улучшение в программировании и работе с агентными сценариями. На бенчмарке SWE-bench Verified — наборе реальных задач по исправлению ошибок в open-source-репозиториях — Sonnet 4.5 показала 77,2% успешных решений. При использовании параллельного инференса («несколько попыток с отбором лучшей») результат поднялся до 82% — лучший показатель среди открыто доступных моделей.

Читать далее

В ChatGPT добавили функцию родительского контроля

Reading time1 min
Views731

OpenAI запустила функцию родительского контроля для ChatGPT: доступ к ней можно получить в меню «Настройки» веб-версии и мобильных приложений или по прямой ссылке. Учитывайте, что функция запускается волнами и может быть какое-то время недоступна на вашем аккаунте.

Читать далее

Представлен DeepSeek-V3.2-Exp: в разы дешевле при той же производительности

Reading time1 min
Views4.3K

Представлена экспериментальная модель DeepSeek-V3.2-Exp, в которой разработчики впервые опробовали новую схему разреженного внимания (DSA). Модель доступна в веб-версии и приложениях (раскатка может идти поэтапно), API, а также на Hugging Face.

Читать далее

Создатели ChatGPT выпустили сборник из 300+ промптов для разных сфер

Reading time1 min
Views17K

В OpenAI Academy появился сборник из более 300 промптов, написанных специалистами компании для разных сфер — от повседневных задач до программирования. Важно отметить, что отдельные статьи с промптами были опубликованы еще в мае-июне и обновлены в начале августа (после выпуска GPT-5), теперь же OpenAI собрала их все в рамках одного хаба с удобной навигацией.

Читать далее

GPT-5 частично прошла «тест Гёделя» на доказательство новых математических гипотез

Reading time2 min
Views2.4K

На arXiv опубликован препринт с описанием нового способа проверки больших языковых моделей — «теста Гёделя» (название дано в честь Курта Гёделя, символа строгих математических доказательств). В отличие от привычных бенчмарков, он проверяет не умение решать известные задачи, а способность находить новые, пусть и простые, математические результаты.

Читать далее

В OpenAI признали, что подменяют ответы одной модели ChatGPT на другую

Reading time1 min
Views23K

Глава приложения ChatGPT Ник Терли рассказал, что новая версия приложения при работе с GPT-4o автоматически переадресовывает некоторые запросы к GPT-5, если считает, что пользователь затрагивает слишком чувствительные и эмоциональные темы. В OpenAI считают, что улучшенные алгоритмы безопасности новой модели помогут дать более качественные ответы. Терли добавил, что пользователь всегда может спросить в чате, какая модель с ним разговаривает, и получить корректный ответ.

Читать далее

Сэм Альтман ожидает, что ИИ превзойдет человека к 2030 году

Reading time1 min
Views4.3K

В интервью сети Axel Springer Global Reporters Сэм Альтман высказался, что ИИ может превзойти человека уже к 2030 году. По его словам, к этому году у человечества появятся ИИ исключительно мощные и способные делать вещи, которые люди сами не умеют. При этом в 2026 году Альтман ожидает темпы прогресса не меньше, чем в 2024–25 годах. Также он считает, что ИИ уже скоро возьмет на себя 30–40% человеческих задач. Но при этом люди все равно будут в центре истории, ведь в их руках останутся фокус и инициатива.

Читать далее

GPT-5 победил в необычном бенчмарке Among AIs

Reading time2 min
Views2K

Команда 4Wall AI представила Among AIs: бенчмарк, в котором разные ИИ соревнуются в Among Us. Это вдохновленная «Мафией» видеоигра, правила которой были слегка упрощены для бенчмарка: на космическом корабле есть пять мирных, которые выполняют задания, и один «самозванец» (Impostor), который может саботировать и даже убивать мирных. При обнаружении трупа оставшиеся собираются, чтобы обсуждением и голосованием определить самозванца, который будет выброшен в открытый космос. Нередко самозванцем оказывается один из мирных, его называют scapegoat (козел отпущения).

Читать далее

Сооснователь Palantir Питер Тиль: «контроль над ИИ ведет к Антихристу»

Reading time2 min
Views4K

Питер Тиль, сооснователь Palantir и PayPal, заявил что попытки жестко регулировать искусственный интеллект не принесут обществу пользы, а наоборот — ускорят приход «Антихриста». По его словам, лозунги «мира и безопасности» через контроль технологий прокладывают дорогу к тоталитарному мировому порядку. Эти тезисы прозвучали на закрытой серии лекций под названием «Антихрист: цикл из четырех лекций» (на данный момент прошли только две), о которой сообщили несколько СМИ.

Читать далее

Создание ИИ-видео расходует больше электричества, чем ожидалось — исследование Hugging Face

Reading time1 min
Views1.1K

Команда Hugging Face исследовала сколько на самом деле тратит электричества создание видео с помощью ИИ. Оказалось, что если удвоить длительность ролика или разрешение кадра, расход электричества увеличивается почти вчетверо. Это больше, чем можно ожидать: многие сервисы по созданию видео тарифицируют услуги по секундам, то есть линейно.

Читать далее

Google улучшила Gemini 2.5 Flash. ИИ доступен бесплатно

Reading time1 min
Views7.9K

Google выпустила новые версии Gemini 2.5 Flash и Gemini 2.5 Flash Lite, ориентированные на быстрые повседневные задачи. Для Gemini 2.5 Flash улучшили использование инструментов в многоэтапных задачах, а также подтянули результаты в бенчмарке на программирование SWE-Bench Verified — с 48,9% до 54%. Gemini 2.5 Flash Lite теперь лучше следует инструкциям, распознает графику и аудио и дает более четкие, короткие ответы. Для обеих моделей заявлена экономия токенов: до 24% в случае с Gemini 2.5 Flash и 50% в случае с Gemini 2.5 Flash Lite.

Читать далее

OpenAI измерила влияние ИИ на экономику с помощью 1320 реальных задач

Reading time1 min
Views3.1K

OpenAI представила GDPval — бенчмарк для оценки влияния ИИ на реальную экономику. В отличие от привычных тестов вроде MMLU, где модели отвечают на короткие вопросы, здесь проверяются полноценные рабочие задачи из ключевых отраслей, формирующих ВВП. Идея проста: замерять не абстрактные баллы, а то, насколько ИИ реально справляется с работой, за которую платят деньги.

Читать далее

xAI подала в суд на OpenAI: «украли секреты Grok и строительства дата-центров»

Reading time1 min
Views2.5K

xAI Илона Маска подала новый иск против OpenAI в федеральный суд Северного округа Калифорнии, отделив его от августовского дела против бывшего сотрудника. По утверждению xAI, OpenAI целенаправленно переманивала людей, чтобы получить доступ к секретам: исходному коду Grok и материалам о стратегиях дата-центров. В жалобе прямо говорится о «стратегической кампании» по найму.

Читать далее

Запущена ChatGPT Pulse

Reading time1 min
Views9.1K

OpenAI представила ChatGPT Pulse - новую функцию для мобильного приложения, в которой ИИ готовит для пользователя сводку на день. Подготовка стартует ночью: ИИ перечитывает чаты с пользователем, изучает его интересы и предпочтения, отдельно анализирует последние события, а затем делает персонализированную подборку информации.

Читать далее

Information

Rating
74-th
Registered
Activity

Specialization

Content Director
Lead
Project management
Planning
Strategic planning
Building a team
Budgeting projects
Organization of business processes