Обновить
52
92
Developer Hero@python_leader

Passionate Developer.

Отправить сообщение

Как Bugbot в Cursor удвоил число реально исправленных багов

Время на прочтение2 мин
Охват и читатели2.2K

В Cursor подробно разобрали, как эволюционировал Bugbot — агент для код-ревью pull request’ов, который ищет логические баги, проблемы с производительностью и уязвимости до мержа.

Изначально качество оценивали почти вручную: меняли пайплайны, модели и фильтры, опрашивали инженеров и отсекали конфигурации с высоким числом false positive. Один из первых устойчивых приёмов...

Читать далее

Anthropic инвестируют $1.5 млн в Python — и делают ставку на безопасность open source

Время на прочтение1 мин
Охват и читатели9.1K

Anthropic объявили о двухлетнем партнёрстве с Python Software Foundation и инвестируют $1.5 млн в развитие Python-экосистемы. Ключевой фокус — безопасность цепочки поставок и защита PyPI.

Деньги пойдут не просто «на поддержку сообщества», а на вполне конкретные инженерные изменения:

Читать далее

Anthropic представили Cowork — «агентный режим» Claude для обычных задач

Время на прочтение2 мин
Охват и читатели7.2K

После запуска Claude Code в Anthropic заметили, что разработчики начали использовать его не только для кода, но вообще для всего — от заметок до работы с файлами. Ответом стал Cowork — упрощённый агентный интерфейс для некодовых задач.

Ключевое отличие Cowork от обычного чата — доступ к файловой системе. Ты даёшь Claude папку, и дальше он может читать, править и создавать файлы сам: разложить загрузки, собрать таблицу расходов из скриншотов, сделать черновик отчёта из разрозненных заметок.

Важно, что Cowork работает именно как агент. Он сам строит план, выполняет шаги последовательно и периодически отчитывается о прогрессе. По сути, это тот же фундамент, что и у Claude Code, но без фокуса на программирование — ближе к...

Читать далее

Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0

Время на прочтение1 мин
Охват и читатели10K

Оказывается, JetBrains развивает собственный агент для работы в терминале — Junie CLI. Инструмент не фигурирует в публичных анонсах, но именно он занял первое место в свежем бенчмарке Terminal-Bench 2.0, обойдя более известные решения.

Terminal-Bench — это прикладной бенчмарк для оценки агентных систем, работающих внутри терминального окружения. Агенту выдается контейнер с «сырой» средой и набор инженерных задач: выполнять shell-команды, писать и править скрипты, устанавливать зависимости, разбираться с ошибками окружения, дебажить и доводить систему до рабочего состояния.

Читать далее

Claude Code получил нативную поддержку LSP

Время на прочтение2 мин
Охват и читатели12K

Anthropic выкатили нативную поддержку Language Server Protocol (LSP) для Claude Code. Изменение уже доступно в CLI-инструменте, но прошло почти незаметно: без анонсов, документации и публичных разборов.

Поддержка LSP позволяет агенту напрямую обращаться к возможностям языковых серверов: переход к определению, поиск всех ссылок на символ, получение типов и документации, навигация по workspace и даже построение call-graph. По сути, Claude Code получает доступ к тем же структурным данным о коде, которыми обычно располагают IDE.

До этого Claude Code и аналогичные CLI-агенты были вынуждены опираться на grep, ripgrep и эвристики контекста. Это плохо масштабируется: переименование символа или перенос API в большом кодовой базе быстро раздувает контекст и повышает вероятность ошибок.

Читать далее

Китайцы снова радуют. Вышла GLM-4.7 – заметный апгрейд именно для агентного кодинга

Время на прочтение2 мин
Охват и читатели12K

Z.ai представили GLM-4.7 — новую версию своей модели для кодинга, и апдейт получился не косметическим. Основной фокус — агентные сценарии, терминал и устойчивость на длинных задачах.

По бенчмаркам рост выглядит вполне предметно: SWE-bench Verified — 73.8% (+5.8%), SWE-bench Multilingual — 66.7% (+12.9%), Terminal Bench 2.0 — 41% (+16.5%).

Читать далее

Claude Code научили работать с Chrome. Вот насколько это опасно

Время на прочтение2 мин
Охват и читатели7.7K

Anthropic запустили пилот Claude in Chrome — браузерное расширение, в котором Claude может видеть DOM, читать консоль, кликать кнопки и выполнять действия за пользователя. На самом деле сделали они это еще летом, а сейчас допилили само расширение, а также научили его взаимодействовать с Claude Code из CLI.

Читать далее

Вслед за MCP Anthropic заопенсорсили Skills

Время на прочтение1 мин
Охват и читатели5.1K

Anthropic продолжает последовательно выносить ключевые элементы агентной архитектуры в открытую экосистему. Вслед за MCP компания заопенсорсила Agent Skills — открытый стандарт для описания и распространения повторяемых агентных workflows между AI-платформами.

Читать далее

OpenAI выпустили GPT-5.2-Codex

Время на прочтение2 мин
Охват и читатели8.5K

GPT-5.1-Codex-Max в прошлый раз сделал ставку на масштаб: компакция контекста и агентные циклы длиной в сутки. GPT-5.2-Codex развивает ту же идею, но делает её более надёжной и прикладной для реальных продакшн-сценариев.

Если 5.1-Codex-Max показывал максимум на SWE-Bench и SWE-Lancer, то 5.2-Codex подтверждает прогресс уже на agent-ориентированных бенчмарках:

Читать далее

Google выпустили Gemini 3 Flash — frontier-интеллект со скоростью Flash и ценой ниже рынка

Время на прочтение2 мин
Охват и читатели7.2K

Gemini 3 Flash — новая модель в линейке Gemini 3, которая сочетает Pro-уровень reasoning с минимальной задержкой и агрессивной оптимизацией по стоимости.

По бенчмаркам модель выглядит неожиданно сильно. На GPQA Diamond — 90.4%, на Humanity’s Last Exam — 33.7% без инструментов, а на MMMU Pro — 81.2%, почти на уровне Gemini 3 Pro. При этом Flash уверенно обходит Gemini 2.5 Pro и конкурирует с крупными frontier-моделями, оставаясь в другом ценовом классе.

Ключевая инженерная фишка...

Читать далее

OpenAI представила GPT-5.2: ставка на долгие агентные сценарии и профессиональную автоматизацию

Время на прочтение2 мин
Охват и читатели15K

OpenAI анонсировала новое поколение своих фронтир-моделей. GPT-5.2 позиционируется как инструмент для сложной профессиональной работы: от агентных пайплайнов до многочасовых задач с длинным контекстом и мультимодальностью.

Читать далее

Cursor представили Debug Mode

Время на прочтение2 мин
Охват и читатели9.4K

Cursor внедрили Debug Mode, отдельный рабочий цикл для кодовых агентов, который впервые сочетает автоматическую диагностику, инструментирование рантайма и обязательную верификацию со стороны разработчика. Цель нововведения не ускорить генерацию кода, а научить модель системно устранять баги, которые прежде оказывались для нее слишком «глубокими».

Читать далее

OpenRouter выкатили огромное исследование: как реально используют LLM (анализ 100 трлн токенов)

Время на прочтение2 мин
Охват и читатели17K

В исследовании изучили 100 трлн токенов живого трафика через OpenRouter (300+ моделей, 60+ провайдеров, миллионы пользователей, до ноября 2025 года).

Ключевые выводы 👇

Open source закрепился на ~30% и привёл с собой Китай.

Открытые модели стабильно держат около трети токенов. Особенно выросли китайские OSS (DeepSeek, Qwen, Kimi): с ~1–2% до до 30% трафика в отдельные недели, в среднем ~13%.

Читать далее

Mistral выкатили Devstral 2 — открытая SOTA модель для кодинга

Время на прочтение1 мин
Охват и читатели4.6K

Неделю назад мы писали про Mistral 3 с MoE-моделью на 675B параметров. Сегодня компания представила Devstral 2 — новое поколение открытых моделей для кодинга.

Главное:

– Devstral 2 (123B): 72.2% на SWE-bench Verified, фактически новый SOTA среди open-weight кодовых агентов.
– До 7 раз дешевле Sonnet на реальных инженерных задачах.
– Devstral Small 2 (24B): 68% на SWE-bench, работает локально на потребительском железе, 256K контекста, Apache 2.0.
– Модель бесплатна в API на старте. Доступна на OpeRouter.
– Mistral Vibe CLI: нативный open-source кодовый агент прямо в терминале, умеет исследовать проект, вносить многофайловые правки и выполнять shell-команды.

Devstral 2 и Small 2 получились удивительно компактными: они...

Читать далее

Google тихо отключил Gemini 2.5 Pro в бесплатном тарифе

Время на прочтение1 мин
Охват и читатели12K

На форуме Gemini API и Reddit десятки разработчиков заметили, что Gemini 2.5 Pro внезапно исчез из Free Tier, несмотря на то что на официальной странице он по-прежнему указан как «free of charge». В реальности модель недоступна: нет квоты, нет вызовов, проекты падают на rate limit без объяснений.

Читать далее

Linux Foundation запускает Agentic AI Foundation

Время на прочтение1 мин
Охват и читатели3.8K

Под крыло фонда сразу передали MCP (Anthropic), goose (Block) и AGENTS.md (OpenAI), то есть весь тот стек, который за год стал основой современного агентного подхода.

Смысл AAIF в наведении порядка: агентные системы уже инфраструктура, а инфраструктура требует открытых протоколов, понятной модели управления и отсутствия единоличного влияния. 

Например, до сих пор всё держалось на «OpenAI API» как де-факто интерфейса для работы с моделями. Многим может напомнить историю Oracle с JavaScript, когда критическая технология оказывается под контролем одного игрока. AAIF – это попытка избежать ровно этого.

Что уже попало под крыло AAIF:

Читать далее

В IDE от JetBrains появилась поддержка Agent Client Protocol

Время на прочтение1 мин
Охват и читатели6.1K

В релиз-кандидатах линейки 25.3 появилась бета-поддержка Agent Client Protocol (ACP) — открытого стандарта взаимодействия IDE и локальных/удалённых AI-агентов. Идея проста: как когда-то LSP стал мостом между редакторами и языковыми серверами, так ACP должен стать общим языком для IDE и умных ассистентов.

Читать далее

JetBrains представила Air: новую агентную IDE

Время на прочтение2 мин
Охват и читатели13K

Компания выпустила Air — ADE (Agentic Development Environment), ориентированную на гибридную работу «разработчик + ИИ-агенты». Это не просто чат с моделью внутри IDE, а отдельная среда, где можно ставить задачи агентам, запускать их параллельно, контролировать изменения и коммитить результаты.

Air пока доступен в превью и работает только с одним агентом — Claude Agent, причём для использования требуется активная подписка Anthropic. Версии для Windows и Linux обещают в 2026 году — сейчас приложение доступно только на macOS.

Читать далее

MinIO перевёл репозиторий в режим maintenance: развитие остановлено

Время на прочтение2 мин
Охват и читатели13K

Команда MinIO официально перевела один из ключевых репозиториев в режим maintenance. Проект больше не принимает никаких изменений — ни функциональных, ни инфраструктурных. Судя по заявлению, разработчики фиксируют лишь критические уязвимости, и то в индивидуальном порядке.

Что именно меняется...

Читать далее

Вышел Django 6.0: фоновые задачи, частичные шаблоны и обновлённая безопасность

Время на прочтение2 мин
Охват и читатели5.1K

Команда Django представила релиз версии 6.0 — крупное обновление, в котором фреймворк делает заметный шаг в сторону «современного Python-стека» и упорядочивания накопившихся возможностей. Новая версия сфокусирована на удобстве разработки, безопасности и снижении архитектурной «магии».

Читать далее

Информация

В рейтинге
66-й
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик
Ведущий
Python
SQL
Git
ООП
PostgreSQL
Docker
Django