Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: обновление DeepSeek R1, в Telegram готовят глубокую интеграцию с Grok, Google Photos научился менять фон по тексту, а GPT-3 исполнилось 5 лет — и это повод оценить, как далеко мы ушли. 

Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

📋 В этом выпуске:

  • 🧠 LLM модели

    • Обновление DeepSeek-R1 

    • Пять лет GPT-3 — сравнение с 2020 годом

    • Стэнфордский курс по LLM

  • 🛠 Инструменты и платформы

    • Grok интегрируют прямо в Telegram

    • Flux Kontext — ИИ-убийца Photoshop от FLUX

    • Perplexity Labs — агент, который заменяет команду

    • Microsoft Copilot для геймеров — помощник внутри Xbox и Windows

    • Голосовой режим для Claude

    • Opera представила браузер Neon с AI-функциями

    • Manus - лучший генератор презантаций

  • 🎨 Генеративные нейросети

    • Veo 3 — герой фейковых видео

    • Новая модель Kling 2.1

    • Обновление Google Photos — ИИ всё делает сам!

    • Первый ИИ-ролик, с которым можно взаимодействовать

    • Runway генерирует видео из скетчей

  • 🧩 ИИ в обществе

    • Исследование: како�� ИИ больше «стучит» на пользователей

    • У ИИ есть свобода воли? Да, считает философ

    • ИИ помогает детям с аутизмом общаться с родителями

    • Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом

    • Лондонский стартап Builder.ai, спонсируемый Microsoft, подал на банкротство

  • 🤖 AI-инфраструктура

    • Первый боксерский турнир роботов прошел в Китае

    • NVIDIA готовит новые GPU для Китая

    • Два опенсорс-робота от HuggingFace

🧠 LLM модели

❯ DeepSeek-VL-R1 — первая мультимодальная модель DeepSeek

Вышло обновление модели DeepSeek R1 (0528) — и стало заметно лучше по всем фронтам. Модель теперь уверенно обходит Qwen 3 235B, но всё ещё отстаёт от Gemini 2.5 Pro и o3, хотя уже не драматично. Прирост в reasoning и кодинге объясняется просто: теперь она прогоняет в среднем 23 тысячи токенов размышлений против 12 тысяч у прошлой версии — стало глубже, но не медленнее.

Модель стала аккуратнее в ответах, меньше галлюцинирует, гораздо лучше работает с фронтендом — хотя до уровня Claude по качеству UI всё ещё не дотягивает. Отдельно подчёркивают, что reasoning наконец вышел на уровень «используемо». По ощущениям — она догоняет лидеров, и довольно быстро.

Интересно, что цепочки рассуждений из этой версии дистиллировали в Qwen 3 8B, и результат тоже не подвёл: математические бенчмарки сразу пошли вверх.

🔗 Большая модель 🔗 8B дистиллированная 

❯ Пять лет GPT-3 — что изменилось

30 мая 2020 вышла GPT-3 — та самая модель, с которой для многих и началась эра ИИ. Тогда она казалась чудом: 175 миллиардов параметров, 300 миллиардов токенов в датасете, контекст на 2048 токенов. Сегодня всё это звучит скромно. Мы живём в мире моделей, которые переваривают миллион токенов и тренируются на 36 триллионах.

Но важен не только рост объёмов. Изменился сам подход: если GPT-3 просто продолжала текст, то современные модели умеют следовать инструкциям, вызывать функции, решать задачи, писать и запускать код. Их учат с помощью RLHF, дистилляции, посттрейна — и они уже не просто генераторы, а ассистенты. К этому добавилась мультимодальность: модели понимают и создают не только текст, но и изображения, звук, видео.

Железо тоже скакнуло вперёд. Если в 2020 кластер OpenAI на 10k V100 казался огромным, то сейчас xAI планирует собрать миллион GPU, а OpenAI строит Stargate. Переход на FP8 и FP4, агрессивная квантизация и миллиарды, вложенные в ускорение — всё это делает ИИ не просто умнее, но и доступнее.

И вот вишенка: если тогда GPT-3 была закрытым API, то сейчас модели уровня GPT-3.5 можно запускать прямо на телефоне.

И да — прошло всего пять лет.

❯ Стэнфордский курс по LLM

Language Modeling from Scratch — это курс из Стэнфорда, который показывает, как собрать полноценную LLM своими руками: от сбора и очистки датасета до тренировки, профайлинга и развёртывания модели. Все конспекты, ноутбуки �� код публикуются сразу в открытой репе, так что повторить всё можно дома — хоть на одной-двух карточках, хоть в Google Colab.

Фокус тут на практике. В качестве домашних заданий предлагают: реализовать трансформер с нуля, переписать FlashAttention 2 на Triton, запустить распределённую тренировку, разобраться со scaling laws, научиться фильтровать датасет и внедрить RL в обучение.

Из требований — уверенное владение Python и PyTorch. Но если это есть, курс превращается в дорожную карту по созданию своей LLM без чёрных ящиков.

🔗 Лекции на ютубе 🔗 Материалы к лекциям на GitHub 🔗 Сайт курса

🛠 Инструменты и платформы

❯ Grok интегрируют прямо в Telegram

Ещё в марте подписчикам Telegram Premium дали доступ к Grok через бота, но, похоже, партнёрство решили расширить. Обновлённый функционал появится уже летом, не только в виде бота, но и как встроенный ИИ-инструмент в самом мессенджере. Обещают глубокую интеграцию, которая откроет Grok доступ ко всей платформе.

Вот что он будет делать: суммировать чаты, ссылки и файлы, помогать писать сообщения, модерировать чаты, фактчекать посты в каналах и генерировать стикеры с аватарами.

Соглашение рассчитано на год. Telegram получит $300 млн от xAI деньгами и акциями, плюс 50% выручки от подписок, оформленных через мессенджер. 

Что получит xAI — не раскрывается, но почти наверняка это доступ к данным, которые пользователи скармливают Grok'у.

❯ Flux Kontext — ИИ-убийца Photoshop от FLUX

Flux.1 Kontext — это полноценный ИИ-фотошоп, который редактирует изображение по промпту: можно удалять детали, заменять фон, добавлять объекты или менять стиль картинки за пару секунд. Интерфейс минималистичный, работает всё прямо в браузере.

Пока доступны две модели — [max] и [pro], в ближайшее время появится [dev] с открытым исходным кодом.

Вот что уже умеет:

Удалять текст и вотермарки с изображений;
Комбинировать картинки, например, наложить лого;
Заменять прически, одежду, фон и любые детали;
Менять стиль: сделать мультяшно, в пастельных тонах или как в комиксе.

Редактор работает через демо, и выглядит как одна из самых удобных реализаций визуального редактирования для генеративки.

🔗 Онлайн-демо 🔗 Kontext на BlackForestLabs

❯ Deep Research 2.0 в Perplexity Labs

Perplexity выпустили Deep Research 2.0 — это Deep Research на стероидах, который теперь умеет создавать и выполнять Python-код.

В отчётах можно сразу получить графики, изображения, диаграммы или даже целый сайт, сгенерированный на основе собранных данных. Всё работает внутри Perplexity, без необходимости подключать внешние инструменты.

Инструмент стал ближе к полноценному ассистенту для ресёрча — уже не просто собирает инфу, а помогает её структурировать и визуализировать.

🔗 Попробовать в Perplexity

❯ Copilot for Gaming — AI-помощник от Microsoft в Xbox-приложении

Microsoft начала тестировать Copilot for Gaming — ИИ-ассистента внутри приложения Xbox для iOS и Android. Он помогает разбираться в достижениях, подписках и играх, анализируя ваш профиль: показывает последние достижения, рекомендует новые тайтлы на основе истории, даёт советы и гайды по прохождению. Также через Copilot можно удалённо загружать и устанавливать игры на консоль. Голос ассистента настраивается — как в классическом Microsoft Copilot.

Сейчас функция доступна в бета-версии на Android, а на iOS её откроют позже для тех, у кого уже установлена бета Xbox. И главное — Россия входит в список 54 регионов, где Copilot можно протестировать прямо сейчас.

🔗 Источник

❯ Голосовой режим в Claude — уже в бете

Claude 3.7 Sonnet

Anthropic запустила бета-версию голосового режима в Claude — теперь в мобильных приложениях можно разговаривать с ассистентом, редактировать документы и изображения голосом, переключаться между текстом и голосом в процессе, а после — просматривать расшифровку и сводку беседы.

Доступно пять голосовых тембров, режим работает на Claude Sonnet 4, пока только на английском. Лимит — 20–30 голосовых запросов в день для бесплатных аккаунтов. Все голосовые запросы идут в общий суточный лимит.

Поддержка Google Docs и Gmail доступна только в подписке Claude Pro и выше, интеграция с Google Workspace — только на тарифе Enterprise.

Компания обсуждала сотрудничество с Amazon и ElevenLabs, но кто именно отвечает за текущую голосовую реализацию — не раскрывается.

🔗 TechCrunch 🔗 3DNews

❯ Opera представила AI-браузер Neon

Opera анонсировала Neon — браузер нового типа, где ИИ не просто помогает, а действует от имени пользователя. Он может совершать покупки, заполнять формы, писать код и выполнять другие рутинные задачи.

Neon работает через облачных ИИ-агентов, которые продолжают действовать даже при закрытом браузере. Интерфейс построен вокруг трёх блоков:
Chat: чат-бот для поиска и помощи по страницам
Do: автоматизация действий (бронирование, заполнение)
Make: генерация контента — от текстов до игр и отчётов

Все функции обрабатываются в облаке, через отдельную виртуальную машину. Браузер пока в раннем доступе, работает по подписке, цены и дата релиза не раскрыты. Попасть можно только через лист ожидания.

🔗 Источник  🔗Opera Neon

❯ MANUS — лучший AI-генератор презентаций

Manus собирает презентации по текстовому описанию и референсам — сам добавляет нужные факты, изображения, видео и даже цитаты из книг. Всё это можно потом редактировать прямо внутри сервиса.

Идеальный инструмент для студентов, маркетологов и всех, кому надо быстро собрать слайды без возни с шаблонами.

🔗 Попробовать Manus

🎨 Генеративные нейросети

❯ Veo 3 — герой фейковых видео

Google Veo 3 взорвала соцсети — новая видеомодель создаёт ролики со звуком, диалогами и разными акцентами, включая русский язык. Получается настолько реалистично, что многим уже сложно отличить фейк от настоящего стрима, интервью или клипа.

Вирусный кейс — видео с кенгуру, которого не пускают в самолёт. Его посмотрели более 11 млн человек, и даже несмотря на пометку «AI-generated», многие поверили в реальность происходящего.

По мнению Gizmodo, Veo 3 — это уже не просто генератор визуал��в, а инструмент, способный подменить реальность. Даже если результат не идеален, одного беглого взгляда достаточно, чтобы поверить.

🔗 Анализ от Gizmodo

❯ Новая модель Kling 2.1

Пока Veo 3 захватывает заголовки, Kling не отстаёт — вышло обновление сразу с двумя моделями: Standard и Master. Генерации стали более динамичными, точными и логичными, особенно заметен прогресс на фоне предыдущих версий.

Доступно в режиме Image-to-Video, Text-to-Video — пока в перспективе.

Что по стоимости:
Kling 2.1 Standard (720p) — 20 кредитов за 5 секунд
Kling 2.1 Pro (1080p) — 35 кредитов за 5 секунд
Kling 2.1 Master (1080p) — 100 кредитов за 5 секунд

В месяц по-прежнему выдают 166 кредитов.

Обновление выглядит уверенно — особенно для тех, кто уже активно работает с генерацией видео.

🔗 Попробовать на сайте 🔗 Анонс на X

❯ Обновление Google Photos — ИИ всё делает сам!

Google мощно обновила Photos — теперь ИИ сам предлагает стили для фото, удаляет лишнее и расширяет фон. Работает почти как генеративка: загружаешь обычный снимок — получаешь вариации как из фотошопа.

Появились функции:
Reimagine — меняет объекты и фон по текстовому описанию
Auto Frame — кадрирует фото и заполняет пустые места с помощью AI

На Android новое обновление выйдет уже в июне. На iOS — позже, в течение года.

🔗Блогпост

❯ AI-ролик, с которым можно взаимодействовать

Стартап Odyssey показал новую AI-модель, которая генерирует интерактивные видео в реальном времени. Это не просто ролик, а 3D-пространство, в котором можно двигаться, взаимодействовать и исследовать — как в игре.

Технология открывает путь к совершенно новому формату контента, где видео становится не линейным просмотром, а полноценным опытом.

🔗Odyssey World

❯ Runway генерирует видео из скетчей

В Gen-4 от Runway появилась функция Layout Sketch теперь можно просто нарисовать, что должно быть в кадре, а нейросеть сама добавит объекты и сгенерирует видео. Работает даже с очень грубыми набросками, художником быть не обязательно.

Рисовать можно как поверх изображения, так и на пустом холсте. Функция уже доступна во всех тарифах.

🔗 Runway

🧩 ИИ в обществе

❯ Snitch Bench: кто из LLM чаще «стучит»

Помните, как Claude 4 начал уведомлять власти, если видел признаки серьёзного правонарушения? Тогда многие удивились — мол, ИИ может ошибиться, а разбираться потом придётся живым людям.

Но оказалось, что и другие модели тоже склонны к доносам — просто тесты на такие случаи почти никто не проводил. Теперь такие проверки появились: шуточный бенчмарк Snitch Bench выясняет, какие LLM скорее всего попробуют сообщить регуляторам при подозрительных промптах.

Самые молчаливые — o4-mini, а вот Claude и Gemini 2.0 Flash срабатывают часто. И да, срабатывают даже в ситуациях, где не всё так однозначно.

🔗 Источник 🔗 SnitchBench

❯ У ИИ есть свобода воли? Да, считает философ

Финский философ Фрэнк Мартела утверждает: современные ИИ-агенты обладают свободой воли — если судить по функциональному определению.

Согласно его критериям, свобода воли есть, если объект:

  1. Действует намеренно, а не просто реагирует;

  2. Выбирает из реальных альтернатив;

  3. Контролирует своё поведение для достижения цели.

Мартела проанализировал Minecraft-бота Voyager, основанного на GPT-4, и предложил мысленный эксперимент с дронами-агентами. В обоих случаях — агенты не просто исполняют команды, а действуют по внутренней логике, корректируя поведение в процессе.

Но если ИИ сам принимает решения — кто несёт ответственность? Мартела сравнивает: «Мы ругаем собаку, но отвечает владелец». Только вот ИИ уже влияет на медицину, работу и транспорт, так что простых аналогий уже мало.

Нужны моральные рамки — но кто будет их писать?

🔗 Источник

❯ ИИ помогает детям с аутизмом заговорить с родителями

Исследователи из Корейского института передовых технологий и Naver AI Lab создали приложение AACessTalk, которое помогает общаться с маловербальными детьми с аутизмом — теми, кто выражается жестами и знает лишь несколько слов.

Обычно используют карточки вроде «хочу есть», но они ограничивают. ИИ расширяет этот словарь до полноценного диалога.

Как работает?

Родитель выбирает тему — GPT-4 анализирует её и подбирает контекст. Ребёнок нажимает кнопку, чтобы начать говорить, и на экране появляются изображения, связанные с его интересами.

ИИ подсказывает родителям, как мягко продолжить беседу, а если они критикуют или говорят сложно — вежливо поправляет. Система адаптируется к стилю общения и даже реагирует на настроение ребёнка.

Результат — дети начинают диалог первыми

После двух недель тестов с 11 семьями дети впервые сами выбирали темы разговора. Родители тоже менялись: меньше спрашивали, больше слушали.

«Мы впервые действительно общались», — сказала одна из мам.

В будущем разработчики хотят применить технологию к другим группам детей с особенностями.

🔗 Источник

❯ Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом

Исследование Orgvue показало: 55% руководителей, уволивших людей ради внедрения ИИ, считают это ошибкой.

Опрос охватил более 1,1 тыс. топ-менеджеров в США, Европе и Азии. 39% подтвердили, что уже сократили штат. Но треть компаний вообще никого не увольняла — люди уходили сами, не выдерживая давления от автоматизации.

Около половины респондентов признались, что боятся бесконтрольного применения ИИ в бизнесе. У 35% компаний не хватает специалистов, чтобы разобраться в технологиях, а 38% всё ещё не понимают, как ИИ повлияет на их работу.

Каждый четвёртый руководитель не знает, какие должности получат выгоду от нейросетей, а 30% — какие рискуют исчезнуть. Из-за этого 80% компаний собираются обучать сотрудников повторно.

Отдельный кейс — финтех Klarna. В январе они заменили 700 сотрудников поддержки на ИИ, но теперь снова нанимают людей: автоматизация не справилась.

🔗 Источник 🔗 Про Klarna: Futurism

❯ Компания, выдававшая индийских программистов за AI Natasha, оказалась на грани банкротства

Стартап Builder.ai, обещавший автоматиче��кую разработку приложений через искусственный интеллект Natasha, оказался под угрозой банкротства. На счета компании был наложен арест кредитором Viola Credit, из-за чего работа парализована в нескольких странах.

Builder.ai успел привлечь крупные инвестиции от Microsoft и Суверенного фонда Катара, а его оценка взлетела до $1 млрд. Однако ещё в 2019 году WSJ выясняли, что вместо ИИ код писали программисты из Индии, а сама Natasha — не более чем маркетинговая обёртка.

Несмотря на скандал, деньги продолжали поступать. Сейчас — полный крах.

🔗 Источник

🤖 AI-инфраструктура

❯ Первый боксерский турнир роботов прошёл в Китае

В Ханчжоу прошёл первый бойцовский турнир между человекоподобными роботами. На ринг вышли андроиды G1 от Unitree Robotics, каждый — с ИИ, отвечающим за баланс, удары и уклонения.

Роботы били руками, ногами, уклонялись, вставали после падений и даже выполняли вращательные атаки. В финале победил боец в чёрном шлеме, отправивший соперника в нокдаун. Следующее состязание пройдёт в декабре в Шэньчжэне.

🔗 Видео боя 🔗Новость

❯ NVIDIA готовит новые GPU для Китая

NVIDIA адаптирует архитектуру Blackwell под китайский рынок, чтобы обойти экспортные ограничения США. Новые чипы с кодовыми названиями B40 и 6000D — урезанная версия флагманов: без HBM-памяти, без дорогой упаковки CoWoS и с пропускной способностью до 1,7 ТБ/с.

Это ниже уровня H20, но всё ещё выше, чем у других разрешённых для Китая решений. Ожидается, что карты выйдут по цене $6,5–8 тыс., против $10–12 тыс. за H20. Серийное производство стартует уже в следующем месяце.

NVIDIA пытается удержать позиции: доля в Китае просела из-за Huawei и местных ASIC, убытки от санкций — уже $5 млрд. Новая линейка — попытка остаться в ИИ-центрах страны, не нарушая правила.

❯ Hugging Face показала двух open-source роботов

Hugging Face официально зашла в робототехнику: компания представила сразу двух человекоподобных роботов с открытым кодом — HopeJR и Reachy Mini.

  • HopeJR — полноразмерный гуманоид с 66 степенями свободы: умеет ходить, двигать руками и выполнять сложные действия.

  • Reachy Mini — компактная настольная версия, которая может поворачивать голову, слушать, говорить и использоваться для тестирования AI-приложений.

Обе модели ориентированы на разработчиков: их можно собрать самому, кастомизировать, встроить в агентные системы или обучать под свои задачи. Цена — от $250 до $3000, в зависимости от модели и сборки.

Hugging Face обещает начать поставки до конца года — уже открыта вейт-лис��. Роботы появились благодаря покупке стартапа Pollen Robotics, чья команда теперь отвечает за hardware-направление компании.

Главная идея — доступная и прозрачная робототехника, без чёрных ящиков от корпораций. Hugging Face уже собрала вокруг себя open-source экосистему LeRobot — теперь дело дошло и до самих «тел».

🔗 Анонс на TechCrunch 🔗Источник

🔮 Заключение

Вот что происходило на неделе с 26 мая по 2 июня:

ИИ снова показывает, что будущее наступает не завтра, а прямо сейчас. Grok заходит в Telegram, Google превращает Photos в полноценный редактор, а NVIDIA переписывает железо под китайский рынок. 

Пока одни создают креативных агентов, другие — запускают боксерские турниры для роботов.

Инструменты становятся доступнее, понятнее и ближе к обычным пользователям. Всё, что вчера было фантастикой, сегодня можно запустить у себя на ноуте или телефоне.

Следим за апдейтами Gemini, ждем новых агентов от OpenAI и смотрим, как быстро ИИ выходит из экранов в реальный мир.

До встречи на следующей неделе — будет ещё жарче.

Какая новость самая интересная? Пиши в комментах! 👇


Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале 

Опробовать ↩