Pull to refresh
47
113.4
Developer Hero@python_leader

Passionate Developer.

Send message

Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0

Reading time1 min
Reach and readers10K

Оказывается, JetBrains развивает собственный агент для работы в терминале — Junie CLI. Инструмент не фигурирует в публичных анонсах, но именно он занял первое место в свежем бенчмарке Terminal-Bench 2.0, обойдя более известные решения.

Terminal-Bench — это прикладной бенчмарк для оценки агентных систем, работающих внутри терминального окружения. Агенту выдается контейнер с «сырой» средой и набор инженерных задач: выполнять shell-команды, писать и править скрипты, устанавливать зависимости, разбираться с ошибками окружения, дебажить и доводить систему до рабочего состояния.

Читать далее

Claude Code получил нативную поддержку LSP

Reading time2 min
Reach and readers12K

Anthropic выкатили нативную поддержку Language Server Protocol (LSP) для Claude Code. Изменение уже доступно в CLI-инструменте, но прошло почти незаметно: без анонсов, документации и публичных разборов.

Поддержка LSP позволяет агенту напрямую обращаться к возможностям языковых серверов: переход к определению, поиск всех ссылок на символ, получение типов и документации, навигация по workspace и даже построение call-graph. По сути, Claude Code получает доступ к тем же структурным данным о коде, которыми обычно располагают IDE.

До этого Claude Code и аналогичные CLI-агенты были вынуждены опираться на grep, ripgrep и эвристики контекста. Это плохо масштабируется: переименование символа или перенос API в большом кодовой базе быстро раздувает контекст и повышает вероятность ошибок.

Читать далее

Китайцы снова радуют. Вышла GLM-4.7 – заметный апгрейд именно для агентного кодинга

Reading time2 min
Reach and readers11K

Z.ai представили GLM-4.7 — новую версию своей модели для кодинга, и апдейт получился не косметическим. Основной фокус — агентные сценарии, терминал и устойчивость на длинных задачах.

По бенчмаркам рост выглядит вполне предметно: SWE-bench Verified — 73.8% (+5.8%), SWE-bench Multilingual — 66.7% (+12.9%), Terminal Bench 2.0 — 41% (+16.5%).

Читать далее

Claude Code научили работать с Chrome. Вот насколько это опасно

Reading time2 min
Reach and readers7.7K

Anthropic запустили пилот Claude in Chrome — браузерное расширение, в котором Claude может видеть DOM, читать консоль, кликать кнопки и выполнять действия за пользователя. На самом деле сделали они это еще летом, а сейчас допилили само расширение, а также научили его взаимодействовать с Claude Code из CLI.

Читать далее

Вслед за MCP Anthropic заопенсорсили Skills

Reading time1 min
Reach and readers5.1K

Anthropic продолжает последовательно выносить ключевые элементы агентной архитектуры в открытую экосистему. Вслед за MCP компания заопенсорсила Agent Skills — открытый стандарт для описания и распространения повторяемых агентных workflows между AI-платформами.

Читать далее

OpenAI выпустили GPT-5.2-Codex

Reading time2 min
Reach and readers8.4K

GPT-5.1-Codex-Max в прошлый раз сделал ставку на масштаб: компакция контекста и агентные циклы длиной в сутки. GPT-5.2-Codex развивает ту же идею, но делает её более надёжной и прикладной для реальных продакшн-сценариев.

Если 5.1-Codex-Max показывал максимум на SWE-Bench и SWE-Lancer, то 5.2-Codex подтверждает прогресс уже на agent-ориентированных бенчмарках:

Читать далее

Google выпустили Gemini 3 Flash — frontier-интеллект со скоростью Flash и ценой ниже рынка

Reading time2 min
Reach and readers7.2K

Gemini 3 Flash — новая модель в линейке Gemini 3, которая сочетает Pro-уровень reasoning с минимальной задержкой и агрессивной оптимизацией по стоимости.

По бенчмаркам модель выглядит неожиданно сильно. На GPQA Diamond — 90.4%, на Humanity’s Last Exam — 33.7% без инструментов, а на MMMU Pro — 81.2%, почти на уровне Gemini 3 Pro. При этом Flash уверенно обходит Gemini 2.5 Pro и конкурирует с крупными frontier-моделями, оставаясь в другом ценовом классе.

Ключевая инженерная фишка...

Читать далее

OpenAI представила GPT-5.2: ставка на долгие агентные сценарии и профессиональную автоматизацию

Reading time2 min
Reach and readers15K

OpenAI анонсировала новое поколение своих фронтир-моделей. GPT-5.2 позиционируется как инструмент для сложной профессиональной работы: от агентных пайплайнов до многочасовых задач с длинным контекстом и мультимодальностью.

Читать далее

Cursor представили Debug Mode

Reading time2 min
Reach and readers9.4K

Cursor внедрили Debug Mode, отдельный рабочий цикл для кодовых агентов, который впервые сочетает автоматическую диагностику, инструментирование рантайма и обязательную верификацию со стороны разработчика. Цель нововведения не ускорить генерацию кода, а научить модель системно устранять баги, которые прежде оказывались для нее слишком «глубокими».

Читать далее

OpenRouter выкатили огромное исследование: как реально используют LLM (анализ 100 трлн токенов)

Reading time2 min
Reach and readers17K

В исследовании изучили 100 трлн токенов живого трафика через OpenRouter (300+ моделей, 60+ провайдеров, миллионы пользователей, до ноября 2025 года).

Ключевые выводы 👇

Open source закрепился на ~30% и привёл с собой Китай.

Открытые модели стабильно держат около трети токенов. Особенно выросли китайские OSS (DeepSeek, Qwen, Kimi): с ~1–2% до до 30% трафика в отдельные недели, в среднем ~13%.

Читать далее

Mistral выкатили Devstral 2 — открытая SOTA модель для кодинга

Reading time1 min
Reach and readers4.5K

Неделю назад мы писали про Mistral 3 с MoE-моделью на 675B параметров. Сегодня компания представила Devstral 2 — новое поколение открытых моделей для кодинга.

Главное:

– Devstral 2 (123B): 72.2% на SWE-bench Verified, фактически новый SOTA среди open-weight кодовых агентов.
– До 7 раз дешевле Sonnet на реальных инженерных задачах.
– Devstral Small 2 (24B): 68% на SWE-bench, работает локально на потребительском железе, 256K контекста, Apache 2.0.
– Модель бесплатна в API на старте. Доступна на OpeRouter.
– Mistral Vibe CLI: нативный open-source кодовый агент прямо в терминале, умеет исследовать проект, вносить многофайловые правки и выполнять shell-команды.

Devstral 2 и Small 2 получились удивительно компактными: они...

Читать далее

Google тихо отключил Gemini 2.5 Pro в бесплатном тарифе

Reading time1 min
Reach and readers12K

На форуме Gemini API и Reddit десятки разработчиков заметили, что Gemini 2.5 Pro внезапно исчез из Free Tier, несмотря на то что на официальной странице он по-прежнему указан как «free of charge». В реальности модель недоступна: нет квоты, нет вызовов, проекты падают на rate limit без объяснений.

Читать далее

Linux Foundation запускает Agentic AI Foundation

Reading time1 min
Reach and readers3.8K

Под крыло фонда сразу передали MCP (Anthropic), goose (Block) и AGENTS.md (OpenAI), то есть весь тот стек, который за год стал основой современного агентного подхода.

Смысл AAIF в наведении порядка: агентные системы уже инфраструктура, а инфраструктура требует открытых протоколов, понятной модели управления и отсутствия единоличного влияния. 

Например, до сих пор всё держалось на «OpenAI API» как де-факто интерфейса для работы с моделями. Многим может напомнить историю Oracle с JavaScript, когда критическая технология оказывается под контролем одного игрока. AAIF – это попытка избежать ровно этого.

Что уже попало под крыло AAIF:

Читать далее

В IDE от JetBrains появилась поддержка Agent Client Protocol

Reading time1 min
Reach and readers6.1K

В релиз-кандидатах линейки 25.3 появилась бета-поддержка Agent Client Protocol (ACP) — открытого стандарта взаимодействия IDE и локальных/удалённых AI-агентов. Идея проста: как когда-то LSP стал мостом между редакторами и языковыми серверами, так ACP должен стать общим языком для IDE и умных ассистентов.

Читать далее

JetBrains представила Air: новую агентную IDE

Reading time2 min
Reach and readers13K

Компания выпустила Air — ADE (Agentic Development Environment), ориентированную на гибридную работу «разработчик + ИИ-агенты». Это не просто чат с моделью внутри IDE, а отдельная среда, где можно ставить задачи агентам, запускать их параллельно, контролировать изменения и коммитить результаты.

Air пока доступен в превью и работает только с одним агентом — Claude Agent, причём для использования требуется активная подписка Anthropic. Версии для Windows и Linux обещают в 2026 году — сейчас приложение доступно только на macOS.

Читать далее

MinIO перевёл репозиторий в режим maintenance: развитие остановлено

Reading time2 min
Reach and readers13K

Команда MinIO официально перевела один из ключевых репозиториев в режим maintenance. Проект больше не принимает никаких изменений — ни функциональных, ни инфраструктурных. Судя по заявлению, разработчики фиксируют лишь критические уязвимости, и то в индивидуальном порядке.

Что именно меняется...

Читать далее

Вышел Django 6.0: фоновые задачи, частичные шаблоны и обновлённая безопасность

Reading time2 min
Reach and readers5.1K

Команда Django представила релиз версии 6.0 — крупное обновление, в котором фреймворк делает заметный шаг в сторону «современного Python-стека» и упорядочивания накопившихся возможностей. Новая версия сфокусирована на удобстве разработки, безопасности и снижении архитектурной «магии».

Читать далее

Внутреннее исследование Anthropic: рост output, падение deep-skills и новая роль разработчика

Reading time3 min
Reach and readers5.4K

Компания Anthropic опубликовала большое внутреннее исследование о том, как использование Claude меняет работу её собственных инженеров и исследователей. Это редкий случай, когда разработчики ИИ смотрят не на рынок в целом, а на себя — как на первых «подопытных» новой технологической эпохи.

За август 2025 года команда собрала данные опроса 132 сотрудников, провела 53 глубинных интервью и проанализировала 200 000 сессий в Claude Code. Выводы двоякие: продуктивность растёт, инженеры становятся более «фуллстековыми» и смелее в задачах, но параллельно растут тревоги — от потери навыков до угрозы автоматизации собственных рабочих мест.

Читать далее

Французский стартап представил линейку Mistral 3: 675 миллиардов параметров в open source

Reading time2 min
Reach and readers9.1K

Компания Mistral AI выпустила новое поколение своих моделей — Mistral 3. В релиз вошли три небольших плотных модели (3B, 8B и 14B), а также флагманская Mistral Large 3 — разреженная Mixture-of-Experts-архитектура с 41B активных и 675B общих параметров. Все модели распространяются под Apache 2.0, что делает Mistral 3 одним из крупнейших полностью открытых релизов в сегменте frontier-класса.

Технические нововведения и архитектура

Large 3 — первый MoE-модельный релиз Mistral со времён Mixtral. Она обучалась с нуля на 3000 GPU NVIDIA H200 и демонстрирует паритет с лучшими инструкционно-натренированными open-weight-моделями. Новинка поддерживает понимание изображений и показывает лидирующие результаты в многоязычных диалогах, особенно за пределами англо-китайских датасетов, где большинство конкурентов традиционно...

Читать далее

DeepSeek представила модели V3.2 и V3.2-Speciale: новый фокус на reasoning и агентные сценарии

Reading time2 min
Reach and readers9.8K

Китайский стартап DeepSeek выпустил очередное обновление линейки своих LLM — модели DeepSeek-V3.2 и DeepSeek-V3.2-Speciale. Обе позиционируются как системы нового поколения, оптимизированные под работу агентов: многошаговое рассуждение, планирование, сложные цепочки вывода и интеракции со структурированными средами.

V3.2 уже доступна в чате DeepSeek, на сайте и через API. Версия Speciale пока работает только по API через временный endpoint — до 15 декабря 2025 года.

Читать далее

Information

Rating
52-nd
Date of birth
Registered
Activity

Specialization

Бэкенд разработчик
Ведущий
Python
SQL
Git
ООП
PostgreSQL
Docker
Django