
Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.
Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.
Неделя выдалась насыщенной: обновление DeepSeek R1, в Telegram готовят глубокую интеграцию с Grok, Google Photos научился менять фон по тексту, а GPT-3 исполнилось 5 лет — и это повод оценить, как далеко мы ушли.
Всё самое важное — в одном месте. Поехали!
📋 В этом выпуске:
🧠 LLM модели
Обновление DeepSeek-R1
Пять лет GPT-3 — сравнение с 2020 годом
Стэнфордский курс по LLM
🛠 Инструменты и платформы
Grok интегрируют прямо в Telegram
Flux Kontext — ИИ-убийца Photoshop от FLUX
Perplexity Labs — агент, который заменяет команду
Microsoft Copilot для геймеров — помощник внутри Xbox и Windows
Голосовой режим для Claude
Opera представила браузер Neon с AI-функциями
Manus - лучший генератор презантаций
🎨 Генеративные нейросети
Veo 3 — герой фейковых видео
Новая модель Kling 2.1
Обновление Google Photos — ИИ всё делает сам!
Первый ИИ-ролик, с которым можно взаимодействовать
Runway генерирует видео из скетчей
🧩 ИИ в обществе
Исследование: како�� ИИ больше «стучит» на пользователей
У ИИ есть свобода воли? Да, считает философ
ИИ помогает детям с аутизмом общаться с родителями
Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом
Лондонский стартап Builder.ai, спонсируемый Microsoft, подал на банкротство
🤖 AI-инфраструктура
Первый боксерский турнир роботов прошел в Китае
NVIDIA готовит новые GPU для Китая
Два опенсорс-робота от HuggingFace
🧠 LLM модели

❯ DeepSeek-VL-R1 — первая мультимодальная модель DeepSeek
Вышло обновление модели DeepSeek R1 (0528) — и стало заметно лучше по всем фронтам. Модель теперь уверенно обходит Qwen 3 235B, но всё ещё отстаёт от Gemini 2.5 Pro и o3, хотя уже не драматично. Прирост в reasoning и кодинге объясняется просто: теперь она прогоняет в среднем 23 тысячи токенов размышлений против 12 тысяч у прошлой версии — стало глубже, но не медленнее.
Модель стала аккуратнее в ответах, меньше галлюцинирует, гораздо лучше работает с фронтендом — хотя до уровня Claude по качеству UI всё ещё не дотягивает. Отдельно подчёркивают, что reasoning наконец вышел на уровень «используемо». По ощущениям — она догоняет лидеров, и довольно быстро.
Интересно, что цепочки рассуждений из этой версии дистиллировали в Qwen 3 8B, и результат тоже не подвёл: математические бенчмарки сразу пошли вверх.
🔗 Большая модель 🔗 8B дистиллированная
❯ Пять лет GPT-3 — что изменилось
30 мая 2020 вышла GPT-3 — та самая модель, с которой для многих и началась эра ИИ. Тогда она казалась чудом: 175 миллиардов параметров, 300 миллиардов токенов в датасете, контекст на 2048 токенов. Сегодня всё это звучит скромно. Мы живём в мире моделей, которые переваривают миллион токенов и тренируются на 36 триллионах.
Но важен не только рост объёмов. Изменился сам подход: если GPT-3 просто продолжала текст, то современные модели умеют следовать инструкциям, вызывать функции, решать задачи, писать и запускать код. Их учат с помощью RLHF, дистилляции, посттрейна — и они уже не просто генераторы, а ассистенты. К этому добавилась мультимодальность: модели понимают и создают не только текст, но и изображения, звук, видео.
Железо тоже скакнуло вперёд. Если в 2020 кластер OpenAI на 10k V100 казался огромным, то сейчас xAI планирует собрать миллион GPU, а OpenAI строит Stargate. Переход на FP8 и FP4, агрессивная квантизация и миллиарды, вложенные в ускорение — всё это делает ИИ не просто умнее, но и доступнее.
И вот вишенка: если тогда GPT-3 была закрытым API, то сейчас модели уровня GPT-3.5 можно запускать прямо на телефоне.
И да — прошло всего пять лет.
❯ Стэнфордский курс по LLM

Language Modeling from Scratch — это курс из Стэнфорда, который показывает, как собрать полноценную LLM своими руками: от сбора и очистки датасета до тренировки, профайлинга и развёртывания модели. Все конспекты, ноутбуки �� код публикуются сразу в открытой репе, так что повторить всё можно дома — хоть на одной-двух карточках, хоть в Google Colab.
Фокус тут на практике. В качестве домашних заданий предлагают: реализовать трансформер с нуля, переписать FlashAttention 2 на Triton, запустить распределённую тренировку, разобраться со scaling laws, научиться фильтровать датасет и внедрить RL в обучение.
Из требований — уверенное владение Python и PyTorch. Но если это есть, курс превращается в дорожную карту по созданию своей LLM без чёрных ящиков.
🔗 Лекции на ютубе 🔗 Материалы к лекциям на GitHub 🔗 Сайт курса
🛠 Инструменты и платформы
❯ Grok интегрируют прямо в Telegram
Ещё в марте подписчикам Telegram Premium дали доступ к Grok через бота, но, похоже, партнёрство решили расширить. Обновлённый функционал появится уже летом, не только в виде бота, но и как встроенный ИИ-инструмент в самом мессенджере. Обещают глубокую интеграцию, которая откроет Grok доступ ко всей платформе.
Вот что он будет делать: суммировать чаты, ссылки и файлы, помогать писать сообщения, модерировать чаты, фактчекать посты в каналах и генерировать стикеры с аватарами.
Соглашение рассчитано на год. Telegram получит $300 млн от xAI деньгами и акциями, плюс 50% выручки от подписок, оформленных через мессенджер.
Что получит xAI — не раскрывается, но почти наверняка это доступ к данным, которые пользователи скармливают Grok'у.
❯ Flux Kontext — ИИ-убийца Photoshop от FLUX
Flux.1 Kontext — это полноценный ИИ-фотошоп, который редактирует изображение по промпту: можно удалять детали, заменять фон, добавлять объекты или менять стиль картинки за пару секунд. Интерфейс минималистичный, работает всё прямо в браузере.
Пока доступны две модели — [max] и [pro], в ближайшее время появится [dev] с открытым исходным кодом.
Вот что уже умеет:
– Удалять текст и вотермарки с изображений;
– Комбинировать картинки, например, наложить лого;
– Заменять прически, одежду, фон и любые детали;
– Менять стиль: сделать мультяшно, в пастельных тонах или как в комиксе.
Редактор работает через демо, и выглядит как одна из самых удобных реализаций визуального редактирования для генеративки.
🔗 Онлайн-демо 🔗 Kontext на BlackForestLabs
❯ Deep Research 2.0 в Perplexity Labs
Perplexity выпустили Deep Research 2.0 — это Deep Research на стероидах, который теперь умеет создавать и выполнять Python-код.
В отчётах можно сразу получить графики, изображения, диаграммы или даже целый сайт, сгенерированный на основе собранных данных. Всё работает внутри Perplexity, без необходимости подключать внешние инструменты.
Инструмент стал ближе к полноценному ассистенту для ресёрча — уже не просто собирает инфу, а помогает её структурировать и визуализировать.
❯ Copilot for Gaming — AI-помощник от Microsoft в Xbox-приложении

Microsoft начала тестировать Copilot for Gaming — ИИ-ассистента внутри приложения Xbox для iOS и Android. Он помогает разбираться в достижениях, подписках и играх, анализируя ваш профиль: показывает последние достижения, рекомендует новые тайтлы на основе истории, даёт советы и гайды по прохождению. Также через Copilot можно удалённо загружать и устанавливать игры на консоль. Голос ассистента настраивается — как в классическом Microsoft Copilot.
Сейчас функция доступна в бета-версии на Android, а на iOS её откроют позже для тех, у кого уже установлена бета Xbox. И главное — Россия входит в список 54 регионов, где Copilot можно протестировать прямо сейчас.
🔗 Источник
❯ Голосовой режим в Claude — уже в бете

Anthropic запустила бета-версию голосового режима в Claude — теперь в мобильных приложениях можно разговаривать с ассистентом, редактировать документы и изображения голосом, переключаться между текстом и голосом в процессе, а после — просматривать расшифровку и сводку беседы.
Доступно пять голосовых тембров, режим работает на Claude Sonnet 4, пока только на английском. Лимит — 20–30 голосовых запросов в день для бесплатных аккаунтов. Все голосовые запросы идут в общий суточный лимит.
Поддержка Google Docs и Gmail доступна только в подписке Claude Pro и выше, интеграция с Google Workspace — только на тарифе Enterprise.
Компания обсуждала сотрудничество с Amazon и ElevenLabs, но кто именно отвечает за текущую голосовую реализацию — не раскрывается.
🔗 TechCrunch 🔗 3DNews
❯ Opera представила AI-браузер Neon

Opera анонсировала Neon — браузер нового типа, где ИИ не просто помогает, а действует от имени пользователя. Он может совершать покупки, заполнять формы, писать код и выполнять другие рутинные задачи.
Neon работает через облачных ИИ-агентов, которые продолжают действовать даже при закрытом браузере. Интерфейс построен вокруг трёх блоков:
— Chat: чат-бот для поиска и помощи по страницам
— Do: автоматизация действий (бронирование, заполнение)
— Make: генерация контента — от текстов до игр и отчётов
Все функции обрабатываются в облаке, через отдельную виртуальную машину. Браузер пока в раннем доступе, работает по подписке, цены и дата релиза не раскрыты. Попасть можно только через лист ожидания.
❯ MANUS — лучший AI-генератор презентаций
Manus собирает презентации по текстовому описанию и референсам — сам добавляет нужные факты, изображения, видео и даже цитаты из книг. Всё это можно потом редактировать прямо внутри сервиса.
Идеальный инструмент для студентов, маркетологов и всех, кому надо быстро собрать слайды без возни с шаблонами.
🎨 Генеративные нейросети
❯ Veo 3 — герой фейковых видео
Google Veo 3 взорвала соцсети — новая видеомодель создаёт ролики со звуком, диалогами и разными акцентами, включая русский язык. Получается настолько реалистично, что многим уже сложно отличить фейк от настоящего стрима, интервью или клипа.
Вирусный кейс — видео с кенгуру, которого не пускают в самолёт. Его посмотрели более 11 млн человек, и даже несмотря на пометку «AI-generated», многие поверили в реальность происходящего.
По мнению Gizmodo, Veo 3 — это уже не просто генератор визуал��в, а инструмент, способный подменить реальность. Даже если результат не идеален, одного беглого взгляда достаточно, чтобы поверить.
❯ Новая модель Kling 2.1
Пока Veo 3 захватывает заголовки, Kling не отстаёт — вышло обновление сразу с двумя моделями: Standard и Master. Генерации стали более динамичными, точными и логичными, особенно заметен прогресс на фоне предыдущих версий.
Доступно в режиме Image-to-Video, Text-to-Video — пока в перспективе.
Что по стоимости:
— Kling 2.1 Standard (720p) — 20 кредитов за 5 секунд
— Kling 2.1 Pro (1080p) — 35 кредитов за 5 секунд
— Kling 2.1 Master (1080p) — 100 кредитов за 5 секунд
В месяц по-прежнему выдают 166 кредитов.
Обновление выглядит уверенно — особенно для тех, кто уже активно работает с генерацией видео.
🔗 Попробовать на сайте 🔗 Анонс на X
❯ Обновление Google Photos — ИИ всё делает сам!
Google мощно обновила Photos — теперь ИИ сам предлагает стили для фото, удаляет лишнее и расширяет фон. Работает почти как генеративка: загружаешь обычный снимок — получаешь вариации как из фотошопа.
Появились функции:
— Reimagine — меняет объекты и фон по текстовому описанию
— Auto Frame — кадрирует фото и заполняет пустые места с помощью AI
На Android новое обновление выйдет уже в июне. На iOS — позже, в течение года.
❯ AI-ролик, с которым можно взаимодействовать
Стартап Odyssey показал новую AI-модель, которая генерирует интерактивные видео в реальном времени. Это не просто ролик, а 3D-пространство, в котором можно двигаться, взаимодействовать и исследовать — как в игре.
Технология открывает путь к совершенно новому формату контента, где видео становится не линейным просмотром, а полноценным опытом.
❯ Runway генерирует видео из скетчей
В Gen-4 от Runway появилась функция Layout Sketch — теперь можно просто нарисовать, что должно быть в кадре, а нейросеть сама добавит объекты и сгенерирует видео. Работает даже с очень грубыми набросками, художником быть не обязательно.
Рисовать можно как поверх изображения, так и на пустом холсте. Функция уже доступна во всех тарифах.
🔗 Runway
🧩 ИИ в обществе

❯ Snitch Bench: кто из LLM чаще «стучит»
Помните, как Claude 4 начал уведомлять власти, если видел признаки серьёзного правонарушения? Тогда многие удивились — мол, ИИ может ошибиться, а разбираться потом придётся живым людям.
Но оказалось, что и другие модели тоже склонны к доносам — просто тесты на такие случаи почти никто не проводил. Теперь такие проверки появились: шуточный бенчмарк Snitch Bench выясняет, какие LLM скорее всего попробуют сообщить регуляторам при подозрительных промптах.
Самые молчаливые — o4-mini, а вот Claude и Gemini 2.0 Flash срабатывают часто. И да, срабатывают даже в ситуациях, где не всё так однозначно.
🔗 Источник 🔗 SnitchBench
❯ У ИИ есть свобода воли? Да, считает философ
Финский философ Фрэнк Мартела утверждает: современные ИИ-агенты обладают свободой воли — если судить по функциональному определению.
Согласно его критериям, свобода воли есть, если объект:
Действует намеренно, а не просто реагирует;
Выбирает из реальных альтернатив;
Контролирует своё поведение для достижения цели.
Мартела проанализировал Minecraft-бота Voyager, основанного на GPT-4, и предложил мысленный эксперимент с дронами-агентами. В обоих случаях — агенты не просто исполняют команды, а действуют по внутренней логике, корректируя поведение в процессе.
Но если ИИ сам принимает решения — кто несёт ответственность? Мартела сравнивает: «Мы ругаем собаку, но отвечает владелец». Только вот ИИ уже влияет на медицину, работу и транспорт, так что простых аналогий уже мало.
Нужны моральные рамки — но кто будет их писать?
🔗 Источник
❯ ИИ помогает детям с аутизмом заговорить с родителями
Исследователи из Корейского института передовых технологий и Naver AI Lab создали приложение AACessTalk, которое помогает общаться с маловербальными детьми с аутизмом — теми, кто выражается жестами и знает лишь несколько слов.
Обычно используют карточки вроде «хочу есть», но они ограничивают. ИИ расширяет этот словарь до полноценного диалога.
Как работает?
Родитель выбирает тему — GPT-4 анализирует её и подбирает контекст. Ребёнок нажимает кнопку, чтобы начать говорить, и на экране появляются изображения, связанные с его интересами.
ИИ подсказывает родителям, как мягко продолжить беседу, а если они критикуют или говорят сложно — вежливо поправляет. Система адаптируется к стилю общения и даже реагирует на настроение ребёнка.
Результат — дети начинают диалог первыми
После двух недель тестов с 11 семьями дети впервые сами выбирали темы разговора. Родители тоже менялись: меньше спрашивали, больше слушали.
«Мы впервые действительно общались», — сказала одна из мам.
В будущем разработчики хотят применить технологию к другим группам детей с особенностями.
🔗 Источник
❯ Более половины компаний, сокративших сотрудников из-за ИИ, жалеют об этом
Исследование Orgvue показало: 55% руководителей, уволивших людей ради внедрения ИИ, считают это ошибкой.
Опрос охватил более 1,1 тыс. топ-менеджеров в США, Европе и Азии. 39% подтвердили, что уже сократили штат. Но треть компаний вообще никого не увольняла — люди уходили сами, не выдерживая давления от автоматизации.
Около половины респондентов признались, что боятся бесконтрольного применения ИИ в бизнесе. У 35% компаний не хватает специалистов, чтобы разобраться в технологиях, а 38% всё ещё не понимают, как ИИ повлияет на их работу.
Каждый четвёртый руководитель не знает, какие должности получат выгоду от нейросетей, а 30% — какие рискуют исчезнуть. Из-за этого 80% компаний собираются обучать сотрудников повторно.
Отдельный кейс — финтех Klarna. В январе они заменили 700 сотрудников поддержки на ИИ, но теперь снова нанимают людей: автоматизация не справилась.
🔗 Источник 🔗 Про Klarna: Futurism
❯ Компания, выдававшая индийских программистов за AI Natasha, оказалась на грани банкротства

Стартап Builder.ai, обещавший автоматиче��кую разработку приложений через искусственный интеллект Natasha, оказался под угрозой банкротства. На счета компании был наложен арест кредитором Viola Credit, из-за чего работа парализована в нескольких странах.
Builder.ai успел привлечь крупные инвестиции от Microsoft и Суверенного фонда Катара, а его оценка взлетела до $1 млрд. Однако ещё в 2019 году WSJ выясняли, что вместо ИИ код писали программисты из Индии, а сама Natasha — не более чем маркетинговая обёртка.
Несмотря на скандал, деньги продолжали поступать. Сейчас — полный крах.
🔗 Источник
🤖 AI-инфраструктура

❯ Первый боксерский турнир роботов прошёл в Китае
В Ханчжоу прошёл первый бойцовский турнир между человекоподобными роботами. На ринг вышли андроиды G1 от Unitree Robotics, каждый — с ИИ, отвечающим за баланс, удары и уклонения.
Роботы били руками, ногами, уклонялись, вставали после падений и даже выполняли вращательные атаки. В финале победил боец в чёрном шлеме, отправивший соперника в нокдаун. Следующее состязание пройдёт в декабре в Шэньчжэне.
❯ NVIDIA готовит новые GPU для Китая
NVIDIA адаптирует архитектуру Blackwell под китайский рынок, чтобы обойти экспортные ограничения США. Новые чипы с кодовыми названиями B40 и 6000D — урезанная версия флагманов: без HBM-памяти, без дорогой упаковки CoWoS и с пропускной способностью до 1,7 ТБ/с.
Это ниже уровня H20, но всё ещё выше, чем у других разрешённых для Китая решений. Ожидается, что карты выйдут по цене $6,5–8 тыс., против $10–12 тыс. за H20. Серийное производство стартует уже в следующем месяце.
NVIDIA пытается удержать позиции: доля в Китае просела из-за Huawei и местных ASIC, убытки от санкций — уже $5 млрд. Новая линейка — попытка остаться в ИИ-центрах страны, не нарушая правила.
❯ Hugging Face показала двух open-source роботов
Hugging Face официально зашла в робототехнику: компания представила сразу двух человекоподобных роботов с открытым кодом — HopeJR и Reachy Mini.
HopeJR — полноразмерный гуманоид с 66 степенями свободы: умеет ходить, двигать руками и выполнять сложные действия.
Reachy Mini — компактная настольная версия, которая может поворачивать голову, слушать, говорить и использоваться для тестирования AI-приложений.
Обе модели ориентированы на разработчиков: их можно собрать самому, кастомизировать, встроить в агентные системы или обучать под свои задачи. Цена — от $250 до $3000, в зависимости от модели и сборки.
Hugging Face обещает начать поставки до конца года — уже открыта вейт-лис��. Роботы появились благодаря покупке стартапа Pollen Robotics, чья команда теперь отвечает за hardware-направление компании.
Главная идея — доступная и прозрачная робототехника, без чёрных ящиков от корпораций. Hugging Face уже собрала вокруг себя open-source экосистему LeRobot — теперь дело дошло и до самих «тел».
🔗 Анонс на TechCrunch 🔗Источник
🔮 Заключение
Вот что происходило на неделе с 26 мая по 2 июня:
ИИ снова показывает, что будущее наступает не завтра, а прямо сейчас. Grok заходит в Telegram, Google превращает Photos в полноценный редактор, а NVIDIA переписывает железо под китайский рынок.
Пока одни создают креативных агентов, другие — запускают боксерские турниры для роботов.
Инструменты становятся доступнее, понятнее и ближе к обычным пользователям. Всё, что вчера было фантастикой, сегодня можно запустить у себя на ноуте или телефоне.
Следим за апдейтами Gemini, ждем новых агентов от OpenAI и смотрим, как быстро ИИ выходит из экранов в реальный мир.
До встречи на следующей неделе — будет ещё жарче.
Какая новость самая интересная? Пиши в комментах! 👇
Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩

