Как стать автором
Обновить
1965.61
Timeweb Cloud
То самое облако

Нейро-дайджест: ключевые события мира AI за 4-ю неделю мая 2025

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров1.2K

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: обновление DeepSeek R1, в Telegram готовят глубокую интеграцию с Grok, Google Photos научился менять фон по тексту, а GPT-3 исполнилось 5 лет — и это повод оценить, как далеко мы ушли. 

Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

📋 В этом выпуске:

  • 🧠 LLM модели

    • Обновление DeepSeek-R1 

    • Пять лет GPT-3 — сравнение с 2020 годом

    • Стэнфордский курс по LLM

  • 🛠 Инструменты и платформы

    • Grok интегрируют прямо в Telegram

    • Flux Kontext — ИИ-убийца Photoshop от FLUX

    • Perplexity Labs — агент, который заменяет команду

    • Microsoft Copilot для геймеров — помощник внутри Xbox и Windows

    • Голосовой режим для Claude

    • Opera представила браузер Neon с AI-функциями

    • Manus - лучший генератор презантаций

  • 🎨 Генеративные нейросети

    • Veo 3 — герой фейковых видео

    • Новая модель Kling 2.1

    • Обновление Google Photos — ИИ всё делает сам!

    • Первый ИИ-ролик, с которым можно взаимодействовать

    • Runway генерирует видео из скетчей

  • 🧩 ИИ в обществе

    • Исследование: какой ИИ больше «стучит» на пользователей

    • У ИИ есть свобода воли? Да, считает философ

    • ИИ помогает детям с аутизмом общаться с родителями

    • Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом

    • Лондонский стартап Builder.ai, спонсируемый Microsoft, подал на банкротство

  • 🤖 AI-инфраструктура

    • Первый боксерский турнир роботов прошел в Китае

    • NVIDIA готовит новые GPU для Китая

    • Два опенсорс-робота от HuggingFace

🧠 LLM модели

❯ DeepSeek-VL-R1 — первая мультимодальная модель DeepSeek

Вышло обновление модели DeepSeek R1 (0528) — и стало заметно лучше по всем фронтам. Модель теперь уверенно обходит Qwen 3 235B, но всё ещё отстаёт от Gemini 2.5 Pro и o3, хотя уже не драматично. Прирост в reasoning и кодинге объясняется просто: теперь она прогоняет в среднем 23 тысячи токенов размышлений против 12 тысяч у прошлой версии — стало глубже, но не медленнее.

Модель стала аккуратнее в ответах, меньше галлюцинирует, гораздо лучше работает с фронтендом — хотя до уровня Claude по качеству UI всё ещё не дотягивает. Отдельно подчёркивают, что reasoning наконец вышел на уровень «используемо». По ощущениям — она догоняет лидеров, и довольно быстро.

Интересно, что цепочки рассуждений из этой версии дистиллировали в Qwen 3 8B, и результат тоже не подвёл: математические бенчмарки сразу пошли вверх.

🔗 Большая модель 🔗 8B дистиллированная 

❯ Пять лет GPT-3 — что изменилось

30 мая 2020 вышла GPT-3 — та самая модель, с которой для многих и началась эра ИИ. Тогда она казалась чудом: 175 миллиардов параметров, 300 миллиардов токенов в датасете, контекст на 2048 токенов. Сегодня всё это звучит скромно. Мы живём в мире моделей, которые переваривают миллион токенов и тренируются на 36 триллионах.

Но важен не только рост объёмов. Изменился сам подход: если GPT-3 просто продолжала текст, то современные модели умеют следовать инструкциям, вызывать функции, решать задачи, писать и запускать код. Их учат с помощью RLHF, дистилляции, посттрейна — и они уже не просто генераторы, а ассистенты. К этому добавилась мультимодальность: модели понимают и создают не только текст, но и изображения, звук, видео.

Железо тоже скакнуло вперёд. Если в 2020 кластер OpenAI на 10k V100 казался огромным, то сейчас xAI планирует собрать миллион GPU, а OpenAI строит Stargate. Переход на FP8 и FP4, агрессивная квантизация и миллиарды, вложенные в ускорение — всё это делает ИИ не просто умнее, но и доступнее.

И вот вишенка: если тогда GPT-3 была закрытым API, то сейчас модели уровня GPT-3.5 можно запускать прямо на телефоне.

И да — прошло всего пять лет.

❯ Стэнфордский курс по LLM

Language Modeling from Scratch — это курс из Стэнфорда, который показывает, как собрать полноценную LLM своими руками: от сбора и очистки датасета до тренировки, профайлинга и развёртывания модели. Все конспекты, ноутбуки и код публикуются сразу в открытой репе, так что повторить всё можно дома — хоть на одной-двух карточках, хоть в Google Colab.

Фокус тут на практике. В качестве домашних заданий предлагают: реализовать трансформер с нуля, переписать FlashAttention 2 на Triton, запустить распределённую тренировку, разобраться со scaling laws, научиться фильтровать датасет и внедрить RL в обучение.

Из требований — уверенное владение Python и PyTorch. Но если это есть, курс превращается в дорожную карту по созданию своей LLM без чёрных ящиков.

🔗 Лекции на ютубе 🔗 Материалы к лекциям на GitHub 🔗 Сайт курса

🛠 Инструменты и платформы

❯ Grok интегрируют прямо в Telegram

Ещё в марте подписчикам Telegram Premium дали доступ к Grok через бота, но, похоже, партнёрство решили расширить. Обновлённый функционал появится уже летом, не только в виде бота, но и как встроенный ИИ-инструмент в самом мессенджере. Обещают глубокую интеграцию, которая откроет Grok доступ ко всей платформе.

Вот что он будет делать: суммировать чаты, ссылки и файлы, помогать писать сообщения, модерировать чаты, фактчекать посты в каналах и генерировать стикеры с аватарами.

Соглашение рассчитано на год. Telegram получит $300 млн от xAI деньгами и акциями, плюс 50% выручки от подписок, оформленных через мессенджер. 

Что получит xAI — не раскрывается, но почти наверняка это доступ к данным, которые пользователи скармливают Grok'у.

❯ Flux Kontext — ИИ-убийца Photoshop от FLUX

Flux.1 Kontext — это полноценный ИИ-фотошоп, который редактирует изображение по промпту: можно удалять детали, заменять фон, добавлять объекты или менять стиль картинки за пару секунд. Интерфейс минималистичный, работает всё прямо в браузере.

Пока доступны две модели — [max] и [pro], в ближайшее время появится [dev] с открытым исходным кодом.

Вот что уже умеет:

Удалять текст и вотермарки с изображений;
Комбинировать картинки, например, наложить лого;
Заменять прически, одежду, фон и любые детали;
Менять стиль: сделать мультяшно, в пастельных тонах или как в комиксе.

Редактор работает через демо, и выглядит как одна из самых удобных реализаций визуального редактирования для генеративки.

🔗 Онлайн-демо 🔗 Kontext на BlackForestLabs

❯ Deep Research 2.0 в Perplexity Labs

Perplexity выпустили Deep Research 2.0 — это Deep Research на стероидах, который теперь умеет создавать и выполнять Python-код.

В отчётах можно сразу получить графики, изображения, диаграммы или даже целый сайт, сгенерированный на основе собранных данных. Всё работает внутри Perplexity, без необходимости подключать внешние инструменты.

Инструмент стал ближе к полноценному ассистенту для ресёрча — уже не просто собирает инфу, а помогает её структурировать и визуализировать.

🔗 Попробовать в Perplexity

❯ Copilot for Gaming — AI-помощник от Microsoft в Xbox-приложении

Microsoft начала тестировать Copilot for Gaming — ИИ-ассистента внутри приложения Xbox для iOS и Android. Он помогает разбираться в достижениях, подписках и играх, анализируя ваш профиль: показывает последние достижения, рекомендует новые тайтлы на основе истории, даёт советы и гайды по прохождению. Также через Copilot можно удалённо загружать и устанавливать игры на консоль. Голос ассистента настраивается — как в классическом Microsoft Copilot.

Сейчас функция доступна в бета-версии на Android, а на iOS её откроют позже для тех, у кого уже установлена бета Xbox. И главное — Россия входит в список 54 регионов, где Copilot можно протестировать прямо сейчас.

🔗 Источник

❯ Голосовой режим в Claude — уже в бете

Claude 3.7 Sonnet

Anthropic запустила бета-версию голосового режима в Claude — теперь в мобильных приложениях можно разговаривать с ассистентом, редактировать документы и изображения голосом, переключаться между текстом и голосом в процессе, а после — просматривать расшифровку и сводку беседы.

Доступно пять голосовых тембров, режим работает на Claude Sonnet 4, пока только на английском. Лимит — 20–30 голосовых запросов в день для бесплатных аккаунтов. Все голосовые запросы идут в общий суточный лимит.

Поддержка Google Docs и Gmail доступна только в подписке Claude Pro и выше, интеграция с Google Workspace — только на тарифе Enterprise.

Компания обсуждала сотрудничество с Amazon и ElevenLabs, но кто именно отвечает за текущую голосовую реализацию — не раскрывается.

🔗 TechCrunch 🔗 3DNews

❯ Opera представила AI-браузер Neon

Opera анонсировала Neon — браузер нового типа, где ИИ не просто помогает, а действует от имени пользователя. Он может совершать покупки, заполнять формы, писать код и выполнять другие рутинные задачи.

Neon работает через облачных ИИ-агентов, которые продолжают действовать даже при закрытом браузере. Интерфейс построен вокруг трёх блоков:
Chat: чат-бот для поиска и помощи по страницам
Do: автоматизация действий (бронирование, заполнение)
Make: генерация контента — от текстов до игр и отчётов

Все функции обрабатываются в облаке, через отдельную виртуальную машину. Браузер пока в раннем доступе, работает по подписке, цены и дата релиза не раскрыты. Попасть можно только через лист ожидания.

🔗 Источник  🔗Opera Neon

❯ MANUS — лучший AI-генератор презентаций

Manus собирает презентации по текстовому описанию и референсам — сам добавляет нужные факты, изображения, видео и даже цитаты из книг. Всё это можно потом редактировать прямо внутри сервиса.

Идеальный инструмент для студентов, маркетологов и всех, кому надо быстро собрать слайды без возни с шаблонами.

🔗 Попробовать Manus

🎨 Генеративные нейросети

❯ Veo 3 — герой фейковых видео

Google Veo 3 взорвала соцсети — новая видеомодель создаёт ролики со звуком, диалогами и разными акцентами, включая русский язык. Получается настолько реалистично, что многим уже сложно отличить фейк от настоящего стрима, интервью или клипа.

Вирусный кейс — видео с кенгуру, которого не пускают в самолёт. Его посмотрели более 11 млн человек, и даже несмотря на пометку «AI-generated», многие поверили в реальность происходящего.

По мнению Gizmodo, Veo 3 — это уже не просто генератор визуалов, а инструмент, способный подменить реальность. Даже если результат не идеален, одного беглого взгляда достаточно, чтобы поверить.

🔗 Анализ от Gizmodo

❯ Новая модель Kling 2.1

Пока Veo 3 захватывает заголовки, Kling не отстаёт — вышло обновление сразу с двумя моделями: Standard и Master. Генерации стали более динамичными, точными и логичными, особенно заметен прогресс на фоне предыдущих версий.

Доступно в режиме Image-to-Video, Text-to-Video — пока в перспективе.

Что по стоимости:
Kling 2.1 Standard (720p) — 20 кредитов за 5 секунд
Kling 2.1 Pro (1080p) — 35 кредитов за 5 секунд
Kling 2.1 Master (1080p) — 100 кредитов за 5 секунд

В месяц по-прежнему выдают 166 кредитов.

Обновление выглядит уверенно — особенно для тех, кто уже активно работает с генерацией видео.

🔗 Попробовать на сайте 🔗 Анонс на X

❯ Обновление Google Photos — ИИ всё делает сам!

Google мощно обновила Photos — теперь ИИ сам предлагает стили для фото, удаляет лишнее и расширяет фон. Работает почти как генеративка: загружаешь обычный снимок — получаешь вариации как из фотошопа.

Появились функции:
Reimagine — меняет объекты и фон по текстовому описанию
Auto Frame — кадрирует фото и заполняет пустые места с помощью AI

На Android новое обновление выйдет уже в июне. На iOS — позже, в течение года.

🔗Блогпост

❯ AI-ролик, с которым можно взаимодействовать

Стартап Odyssey показал новую AI-модель, которая генерирует интерактивные видео в реальном времени. Это не просто ролик, а 3D-пространство, в котором можно двигаться, взаимодействовать и исследовать — как в игре.

Технология открывает путь к совершенно новому формату контента, где видео становится не линейным просмотром, а полноценным опытом.

🔗Odyssey World

❯ Runway генерирует видео из скетчей

В Gen-4 от Runway появилась функция Layout Sketch теперь можно просто нарисовать, что должно быть в кадре, а нейросеть сама добавит объекты и сгенерирует видео. Работает даже с очень грубыми набросками, художником быть не обязательно.

Рисовать можно как поверх изображения, так и на пустом холсте. Функция уже доступна во всех тарифах.

🔗 Runway

🧩 ИИ в обществе

❯ Snitch Bench: кто из LLM чаще «стучит»

Помните, как Claude 4 начал уведомлять власти, если видел признаки серьёзного правонарушения? Тогда многие удивились — мол, ИИ может ошибиться, а разбираться потом придётся живым людям.

Но оказалось, что и другие модели тоже склонны к доносам — просто тесты на такие случаи почти никто не проводил. Теперь такие проверки появились: шуточный бенчмарк Snitch Bench выясняет, какие LLM скорее всего попробуют сообщить регуляторам при подозрительных промптах.

Самые молчаливые — o4-mini, а вот Claude и Gemini 2.0 Flash срабатывают часто. И да, срабатывают даже в ситуациях, где не всё так однозначно.

🔗 Источник 🔗 SnitchBench

❯ У ИИ есть свобода воли? Да, считает философ

Финский философ Фрэнк Мартела утверждает: современные ИИ-агенты обладают свободой воли — если судить по функциональному определению.

Согласно его критериям, свобода воли есть, если объект:

  1. Действует намеренно, а не просто реагирует;

  2. Выбирает из реальных альтернатив;

  3. Контролирует своё поведение для достижения цели.

Мартела проанализировал Minecraft-бота Voyager, основанного на GPT-4, и предложил мысленный эксперимент с дронами-агентами. В обоих случаях — агенты не просто исполняют команды, а действуют по внутренней логике, корректируя поведение в процессе.

Но если ИИ сам принимает решения — кто несёт ответственность? Мартела сравнивает: «Мы ругаем собаку, но отвечает владелец». Только вот ИИ уже влияет на медицину, работу и транспорт, так что простых аналогий уже мало.

Нужны моральные рамки — но кто будет их писать?

🔗 Источник

❯ ИИ помогает детям с аутизмом заговорить с родителями

Исследователи из Корейского института передовых технологий и Naver AI Lab создали приложение AACessTalk, которое помогает общаться с маловербальными детьми с аутизмом — теми, кто выражается жестами и знает лишь несколько слов.

Обычно используют карточки вроде «хочу есть», но они ограничивают. ИИ расширяет этот словарь до полноценного диалога.

Как работает?

Родитель выбирает тему — GPT-4 анализирует её и подбирает контекст. Ребёнок нажимает кнопку, чтобы начать говорить, и на экране появляются изображения, связанные с его интересами.

ИИ подсказывает родителям, как мягко продолжить беседу, а если они критикуют или говорят сложно — вежливо поправляет. Система адаптируется к стилю общения и даже реагирует на настроение ребёнка.

Результат — дети начинают диалог первыми

После двух недель тестов с 11 семьями дети впервые сами выбирали темы разговора. Родители тоже менялись: меньше спрашивали, больше слушали.

«Мы впервые действительно общались», — сказала одна из мам.

В будущем разработчики хотят применить технологию к другим группам детей с особенностями.

🔗 Источник

❯ Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом

Исследование Orgvue показало: 55% руководителей, уволивших людей ради внедрения ИИ, считают это ошибкой.

Опрос охватил более 1,1 тыс. топ-менеджеров в США, Европе и Азии. 39% подтвердили, что уже сократили штат. Но треть компаний вообще никого не увольняла — люди уходили сами, не выдерживая давления от автоматизации.

Около половины респондентов признались, что боятся бесконтрольного применения ИИ в бизнесе. У 35% компаний не хватает специалистов, чтобы разобраться в технологиях, а 38% всё ещё не понимают, как ИИ повлияет на их работу.

Каждый четвёртый руководитель не знает, какие должности получат выгоду от нейросетей, а 30% — какие рискуют исчезнуть. Из-за этого 80% компаний собираются обучать сотрудников повторно.

Отдельный кейс — финтех Klarna. В январе они заменили 700 сотрудников поддержки на ИИ, но теперь снова нанимают людей: автоматизация не справилась.

🔗 Источник 🔗 Про Klarna: Futurism

❯ Компания, выдававшая индийских программистов за AI Natasha, оказалась на грани банкротства

Стартап Builder.ai, обещавший автоматическую разработку приложений через искусственный интеллект Natasha, оказался под угрозой банкротства. На счета компании был наложен арест кредитором Viola Credit, из-за чего работа парализована в нескольких странах.

Builder.ai успел привлечь крупные инвестиции от Microsoft и Суверенного фонда Катара, а его оценка взлетела до $1 млрд. Однако ещё в 2019 году WSJ выясняли, что вместо ИИ код писали программисты из Индии, а сама Natasha — не более чем маркетинговая обёртка.

Несмотря на скандал, деньги продолжали поступать. Сейчас — полный крах.

🔗 Источник

🤖 AI-инфраструктура

❯ Первый боксерский турнир роботов прошёл в Китае

В Ханчжоу прошёл первый бойцовский турнир между человекоподобными роботами. На ринг вышли андроиды G1 от Unitree Robotics, каждый — с ИИ, отвечающим за баланс, удары и уклонения.

Роботы били руками, ногами, уклонялись, вставали после падений и даже выполняли вращательные атаки. В финале победил боец в чёрном шлеме, отправивший соперника в нокдаун. Следующее состязание пройдёт в декабре в Шэньчжэне.

🔗 Видео боя 🔗Новость

❯ NVIDIA готовит новые GPU для Китая

NVIDIA адаптирует архитектуру Blackwell под китайский рынок, чтобы обойти экспортные ограничения США. Новые чипы с кодовыми названиями B40 и 6000D — урезанная версия флагманов: без HBM-памяти, без дорогой упаковки CoWoS и с пропускной способностью до 1,7 ТБ/с.

Это ниже уровня H20, но всё ещё выше, чем у других разрешённых для Китая решений. Ожидается, что карты выйдут по цене $6,5–8 тыс., против $10–12 тыс. за H20. Серийное производство стартует уже в следующем месяце.

NVIDIA пытается удержать позиции: доля в Китае просела из-за Huawei и местных ASIC, убытки от санкций — уже $5 млрд. Новая линейка — попытка остаться в ИИ-центрах страны, не нарушая правила.

❯ Hugging Face показала двух open-source роботов

Hugging Face официально зашла в робототехнику: компания представила сразу двух человекоподобных роботов с открытым кодом — HopeJR и Reachy Mini.

  • HopeJR — полноразмерный гуманоид с 66 степенями свободы: умеет ходить, двигать руками и выполнять сложные действия.

  • Reachy Mini — компактная настольная версия, которая может поворачивать голову, слушать, говорить и использоваться для тестирования AI-приложений.

Обе модели ориентированы на разработчиков: их можно собрать самому, кастомизировать, встроить в агентные системы или обучать под свои задачи. Цена — от $250 до $3000, в зависимости от модели и сборки.

Hugging Face обещает начать поставки до конца года — уже открыта вейт-лист. Роботы появились благодаря покупке стартапа Pollen Robotics, чья команда теперь отвечает за hardware-направление компании.

Главная идея — доступная и прозрачная робототехника, без чёрных ящиков от корпораций. Hugging Face уже собрала вокруг себя open-source экосистему LeRobot — теперь дело дошло и до самих «тел».

🔗 Анонс на TechCrunch 🔗Источник

🔮 Заключение

Вот что происходило на неделе с 26 мая по 2 июня:

ИИ снова показывает, что будущее наступает не завтра, а прямо сейчас. Grok заходит в Telegram, Google превращает Photos в полноценный редактор, а NVIDIA переписывает железо под китайский рынок. 

Пока одни создают креативных агентов, другие — запускают боксерские турниры для роботов.

Инструменты становятся доступнее, понятнее и ближе к обычным пользователям. Всё, что вчера было фантастикой, сегодня можно запустить у себя на ноуте или телефоне.

Следим за апдейтами Gemini, ждем новых агентов от OpenAI и смотрим, как быстро ИИ выходит из экранов в реальный мир.

До встречи на следующей неделе — будет ещё жарче.

Какая новость самая интересная? Пиши в комментах! 👇


Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале 

Опробовать ↩
Теги:
Хабы:
+15
Комментарии1

Публикации

Информация

Сайт
timeweb.cloud
Дата регистрации
Дата основания
Численность
201–500 человек
Местоположение
Россия
Представитель
Timeweb Cloud