Обновить
66
38.6
Иван Никитин@python_leader

Passionate Developer.

Отправить сообщение

OpenAI выпустила GPT-5.4 — свою новую флагманскую модель

Время на прочтение1 мин
Охват и читатели3.9K

Главное изменение: модель объединила возможности кодинга из GPT-5.3-Codex с улучшенным рассуждением из GPT-5.2. Раньше это были отдельные модели под разные задачи, теперь одна.

На бенчмарке GDPval, где модели выполняют рабочие задачи по 44 профессиям (презентации, таблицы, графики, расписания), GPT-5.4 совпала с уровнем профессионалов или превзошла их в 83% случаев. У GPT-5.2 было 70.9%.

Читать далее

Cursor теперь работает внутри JetBrains IDE

Время на прочтение1 мин
Охват и читатели9.6K

Команда Cursor объявила о поддержке IntelliJ IDEA, PyCharm, WebStorm и других IDE от JetBrains. Интеграция работает через Agent Client Protocol (ACP) — открытый протокол, который JetBrains разработали совместно с Zed. Идея ACP в том, чтобы любой AI-агент мог подключаться к любому редактору без кастомных интеграций. По аналогии с LSP, только для AI-агентов.

Читать далее

OpenAI обновила основную модель в ChatGPT — GPT-5.3 Instant

Время на прочтение1 мин
Охват и читатели7.2K

Обновление сфокусировано на тоне и поведении. Модель меньше отказывает в безобидных вопросах, реже читает нотации и даёт ответ сразу, без длинных оговорок про то, чем она не может помочь.

Читать далее

В Codex App и CLI появился голосовой режим

Время на прочтение1 мин
Охват и читатели5.4K

Не прошло и суток после анонса у Anthropic — аналогичная функция появилась в Codex от OpenAI.

Голосовая транскрибация теперь доступна в Codex App и в CLI. В приложении — кнопка микрофона или сочетание Ctrl + M. Нажал, продиктовал, текст вставился в поле ввода.

Читать далее

В Claude Code появился голосовой режим

Время на прочтение1 мин
Охват и читатели7.2K

Функция уже доступна примерно 5% пользователей. Полный rollout займёт несколько недель. После подключения на welcome-экране появляется уведомление. Включение — через команду /voice.

Механика простая: удерживаешь пробел, говоришь, отпускаешь. Push-to-talk без отдельного окна. Распознанный текст вставляется прямо в позицию курсора.

Читать далее

Anthropic запустили программу для опенсорс-разработчиков: 6 месяцев Claude Max 20x бесплатно

Время на прочтение1 мин
Охват и читатели19K

Claude Max 20x — самая дорогая подписка на Claude, $200 в месяц. В 20 раз больше лимитов, чем на Pro, расширенный доступ к Opus, приоритет на новые фичи. За полгода это $1200.

Подать заявку могут мейнтейнеры публичных репозиториев с 5 000+ звёзд на GitHub или 1M+ скачиваний в месяц на NPM. Anthropic будут проверять активность (коммиты, ревью, релизы) за последние 3 месяца.

Читать далее

Claude Code теперь автоматически запоминает контекст между сессиями

Время на прочтение1 мин
Охват и читатели11K

Раньше при каждом запуске Claude Code начинал с чистого листа. Был файл CLAUDE.md, куда вы сами писали инструкции: какие команды использовать, какой стиль кода, как устроен проект. Но всё, что Claude узнавал в процессе работы, терялось после завершения сессии.

Теперь Claude сам записывает то, что узнаёт: паттерны проекта, решения багов, архитектурные особенности, ваши предпочтения. Всё это сохраняется в отдельную директорию ~/.claude/projects/<project>/memory/ и подгружается при следующем запуске.

Читать далее

Qwen 3.5 Medium — серия средних моделей, которые бьют прошлый флагман

Время на прочтение1 мин
Охват и читатели11K

Alibaba выпустила серию средних моделей Qwen 3.5 с открытыми весами. Неделю назад вышел флагман на 397B параметров, а сегодня — модели поменьше: 27B, 35B и 122B. Главное здесь — модель на 35B параметров с 3B активными обходит по бенчмаркам прошлый флагман Qwen3-235B, который был в 7 раз тяжелее. Новая гибридная архитектура (Gated Delta Networks + sparse MoE) позволила сильно поднять и качество, и скорость инференса без наращивания размера.

Читать далее

Anthropic: DeepSeek, Moonshot и MiniMax тайно обучали свои модели на ответах Claude

Время на прочтение2 мин
Охват и читатели9.8K

По заявлениям Anthropic, они обнаружили, что три китайские AI-лаборатории — DeepSeek, Moonshot и MiniMax — массово выкачивали ответы Claude, чтобы обучать на них свои модели. Суммарно они сгенерировали больше 16 миллионов запросов через примерно 24 000 поддельных аккаунтов.

Метод называется дистилляция: берёшь сильную модель, скармливаешь ей тысячи промптов, собираешь ответы и используешь их как обучающие данные для своей модели. Сам по себе метод легальный и распространённый, но в данном случае лаборатории нарушали условия использования и обходили региональные ограничения через прокси-сервисы.

Масштабы у всех разные.

Читать далее

Модели набирали 80% на бенчмарке OpenAI. Оказалось, они просто запомнили решения

Время на прочтение2 мин
Охват и читатели9.1K

Компания OpenAI перестала использовать SWE-bench Verified — один из самых популярных бенчмарков для оценки того, насколько хорошо ИИ справляется с реальными задачами по программированию. Компания сама создала этот бенчмарк в 2024 году.

Суть SWE-bench Verified: модели получают описание бага из GitHub-репозитория и должны сами написать патч, который его починит. 500 задач, проверенных вручную инженерами. За полтора года бенчмарк стал стандартом — результаты по нему указывали в каждом релизе новой модели.

Проблемы нашли две.

Читать далее

Anthropic выпустили Claude Code Security. Инструмент сканирует кодовые базы на уязвимости и предлагает патчи

Время на прочтение1 мин
Охват и читатели8.7K

Отличие от классических статических анализаторов в подходе. Обычные инструменты ищут по известным паттернам: утёкшие пароли, устаревшее шифрование. Claude Code Security вместо этого читает код как исследователь безопасности: отслеживает, как данные проходят через приложение, и находит сложные ошибки вроде нарушенного контроля доступа или багов в бизнес-логике.

Читать далее

SkillsBench: скиллы дают реальный буст, но только если их писал человек

Время на прочтение1 мин
Охват и читатели8.4K

Исследователи сделали первый бенчмарк, который измеряет, помогают ли «скиллы» ИИ-агентам решать задачи. Его назвали SkillsBench.

Skill — это, по сути, папка с инструкциями, скриптами и подсказками, которую агент читает перед тем, как приступить к задаче. Что-то вроде методички для конкретной предметной области. Такие скиллы уже активно используются в Claude Code, Gemini CLI и Codex CLI, но до сих пор никто систематически не проверял, работают ли они вообще.

Читать далее

Большое исследование Anthropic про автономность ИИ-агентов в продакшене

Время на прочтение2 мин
Охват и читатели4.9K

Anthropic выпустила исследование о том, как люди используют автономных ИИ-агентов в продакшене. Для этого они посмотрели на миллионы взаимодействий в Claude Code и на вызовы инструментов через публичный API.

Самый наглядный сигнал – это длительность работы Claude Code без остановки. Медианный “ход” короткий (порядка 45 секунд), а вот 99.9-й перцентиль за три месяца почти удвоился: с <25 минут до >45 минут. Причём рост получился плавным и не совпадает скачками с релизами моделей — то есть автономность в практике растёт не только из-за самой модели, но и из-за доверия пользователей и привычки делегировать.

Читать далее

Вышел Cursor 2.5: маркетплейс плагинов и многоагентная архитектура

Время на прочтение1 мин
Охват и читатели10K

Cursor выпустил обновление 2.5. Главное нововведение — плагины. Теперь навыки, субагенты, MCP-серверы, хуки и правила можно упаковать в один установочный пакет и подключить через маркетплейс.

Среди первых партнёров — Amplitude, Amazon Web Services, Figma, Linear, Stripe. Плагины закрывают задачи дизайна, аналитики, работы с БД, платежей и деплоя. Установить можно из редактора командой /add-plugin или через marketplace.

Второе крупное изменение...

Читать далее

Anthropic выпустила Claude Sonnet 4.6 с контекстом в 1 млн токенов

Время на прочтение2 мин
Охват и читатели9.8K

Anthropic представила Claude Sonnet 4.6 — обновлённую версию своей «средней» модели, которая по ряду задач уже приближается к уровню Opus.

Теперь Sonnet 4.6 — модель по умолчанию в claude.ai и Claude Cowork для пользователей Free и Pro. Цена осталась прежней: от $3 за миллион входных токенов и $15 за миллион выходных — как у Sonnet 4.5.

Главное обновление — окно контекста в 1 миллион токенов (пока в бета-режиме). Это объём, в который помещается...

Читать далее

MiniMax представили M2.5 — флагманскую модель для кодинга и агентных задач

Время на прочтение2 мин
Охват и читатели9.1K

MiniMax выпустили MiniMax-M2.5. Модель обучали с RL в сотнях тысяч реальных окружений. Фокус — кодинг, tool use, поиск и офисные сценарии.

По бенчмаркам:

– 80.2% на SWE-Bench Verified
– 51.3% на Multi-SWE-Bench
– 76.3% на BrowseComp (с управлением контекстом)

SWE-Bench Verified M2.5 проходит на 37% быстрее, чем M2.1: среднее время снизилось с 31.3 до 22.8 минут. Это сопоставимо с Opus 4.6 (22.9 мин), при этом заявленная стоимость задачи — около 10% от него.

В кодинге модель обучалась более чем на...

Читать далее

Z Code: новая ИИ IDE из Китая

Время на прочтение1 мин
Охват и читатели13K

Компания Zhipu AI, которая вчера выпустила свежую версию своей флагманской модели GLM-5, сегодня показала полноценный сайт и changelog для своей новой IDE на базе Tauri под названием Z Code — спустя два месяца после первого релиза.

У Z Code первая версия вышла...

Читать далее

Anthropic открыла возможности платного тарифа Claude для пользователей без подписки

Время на прочтение2 мин
Охват и читатели13K

Anthropic объявила, что в бесплатном плане Claude теперь доступны создание файлов, подключение внешних сервисов и использование Skills — раньше это требовало подписки.

Новость вышла через два дня после того, как OpenAI начала показывать рекламу в ChatGPT для пользователей без подписки и на тарифе Go.

В бесплатном плане Claude можно...

Читать далее

Релиз GLM-5: от вайб-кодинга к агентной инженерии

Время на прочтение2 мин
Охват и читатели16K

Z.ai представили GLM-5 — новую open-source модель для системной разработки и long-horizon агентных задач.

По сравнению с GLM-4.7 масштаб вырос с 355B (32B active) до 744B параметров (40B active). Объём предобучения увеличен с 23T до 28.5T токенов. Добавили DeepSeek Sparse Attention — это снижает стоимость инференса при сохранении длинного контекста.

Для посттрейна команда сделала собственную асинхронную RL-инфраструктуру slime. Задача — ускорить reinforcement learning и сделать возможными...

Читать далее

Релиз Go 1.26: изменения в синтаксисе, новый GC и экспериментальный SIMD

Время на прочтение2 мин
Охват и читатели5K

Команда Go объявила о релизе версии 1.26. Обновление затрагивает синтаксис языка, систему типов, сборщик мусора, компилятор и стандартную библиотеку.

В Go 1.26 переработана встроенная функция new. Теперь в неё можно передавать выражение, задающее начальное значение переменной.

Ранее код выглядел так:

Читать далее

Информация

В рейтинге
222-й
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик
Ведущий
Python
SQL
Git
ООП
PostgreSQL
Docker
Django