News / Profile of python_leader / Habr

Developer Hero@python_leader

Passionate Developer.

ProfileArticles144PostsNews79Comments7

python_leader Dec 24 2025 at 13:32

Оказывается, у JetBrains есть свой CLI-агент Junie и он оказался лучшим в Terminal-Bench 2.0

1 min

10K

Programming * Machine learning * Artificial IntelligenceThe future is here

Оказывается, JetBrains развивает собственный агент для работы в терминале — Junie CLI. Инструмент не фигурирует в публичных анонсах, но именно он занял первое место в свежем бенчмарке Terminal-Bench 2.0, обойдя более известные решения.

Terminal-Bench — это прикладной бенчмарк для оценки агентных систем, работающих внутри терминального окружения. Агенту выдается контейнер с «сырой» средой и набор инженерных задач: выполнять shell-команды, писать и править скрипты, устанавливать зависимости, разбираться с ошибками окружения, дебажить и доводить систему до рабочего состояния.

Читать далее

-2

python_leader Dec 22 2025 at 19:28

Claude Code получил нативную поддержку LSP

2 min

12K

Text editors and IDEs * The future is hereArtificial IntelligenceProgramming *

Anthropic выкатили нативную поддержку Language Server Protocol (LSP) для Claude Code. Изменение уже доступно в CLI-инструменте, но прошло почти незаметно: без анонсов, документации и публичных разборов.

Поддержка LSP позволяет агенту напрямую обращаться к возможностям языковых серверов: переход к определению, поиск всех ссылок на символ, получение типов и документации, навигация по workspace и даже построение call-graph. По сути, Claude Code получает доступ к тем же структурным данным о коде, которыми обычно располагают IDE.

До этого Claude Code и аналогичные CLI-агенты были вынуждены опираться на grep, ripgrep и эвристики контекста. Это плохо масштабируется: переименование символа или перенос API в большом кодовой базе быстро раздувает контекст и повышает вероятность ошибок.

Читать далее

+8

python_leader Dec 22 2025 at 19:09

Китайцы снова радуют. Вышла GLM-4.7 – заметный апгрейд именно для агентного кодинга

2 min

12K

Machine learning * Natural Language Processing * The future is hereArtificial IntelligenceProgramming *

Z.ai представили GLM-4.7 — новую версию своей модели для кодинга, и апдейт получился не косметическим. Основной фокус — агентные сценарии, терминал и устойчивость на длинных задачах.

По бенчмаркам рост выглядит вполне предметно: SWE-bench Verified — 73.8% (+5.8%), SWE-bench Multilingual — 66.7% (+12.9%), Terminal Bench 2.0 — 41% (+16.5%).

Читать далее

+6

python_leader Dec 20 2025 at 06:27

Claude Code научили работать с Chrome. Вот насколько это опасно

2 min

7.7K

Programming * Machine learning * Artificial IntelligenceThe future is hereText editors and IDEs *

Anthropic запустили пилот Claude in Chrome — браузерное расширение, в котором Claude может видеть DOM, читать консоль, кликать кнопки и выполнять действия за пользователя. На самом деле сделали они это еще летом, а сейчас допилили само расширение, а также научили его взаимодействовать с Claude Code из CLI.

Читать далее

+2

python_leader Dec 19 2025 at 12:37

Вслед за MCP Anthropic заопенсорсили Skills

1 min

5.1K

Open source * The future is hereArtificial IntelligenceMachine learning * Programming *

Anthropic продолжает последовательно выносить ключевые элементы агентной архитектуры в открытую экосистему. Вслед за MCP компания заопенсорсила Agent Skills — открытый стандарт для описания и распространения повторяемых агентных workflows между AI-платформами.

Читать далее

0

python_leader Dec 18 2025 at 19:24

OpenAI выпустили GPT-5.2-Codex

2 min

8.4K

Programming * Machine learning * Artificial IntelligenceThe future is hereNatural Language Processing *

GPT-5.1-Codex-Max в прошлый раз сделал ставку на масштаб: компакция контекста и агентные циклы длиной в сутки. GPT-5.2-Codex развивает ту же идею, но делает её более надёжной и прикладной для реальных продакшн-сценариев.

Если 5.1-Codex-Max показывал максимум на SWE-Bench и SWE-Lancer, то 5.2-Codex подтверждает прогресс уже на agent-ориентированных бенчмарках:

Читать далее

+1

python_leader Dec 17 2025 at 16:39

Google выпустили Gemini 3 Flash — frontier-интеллект со скоростью Flash и ценой ниже рынка

2 min

7.2K

Natural Language Processing * Machine learning * The future is hereArtificial IntelligenceProgramming *

Gemini 3 Flash — новая модель в линейке Gemini 3, которая сочетает Pro-уровень reasoning с минимальной задержкой и агрессивной оптимизацией по стоимости.

По бенчмаркам модель выглядит неожиданно сильно. На GPQA Diamond — 90.4%, на Humanity’s Last Exam — 33.7% без инструментов, а на MMMU Pro — 81.2%, почти на уровне Gemini 3 Pro. При этом Flash уверенно обходит Gemini 2.5 Pro и конкурирует с крупными frontier-моделями, оставаясь в другом ценовом классе.

Ключевая инженерная фишка...

Читать далее

+2

python_leader Dec 11 2025 at 18:44

OpenAI представила GPT-5.2: ставка на долгие агентные сценарии и профессиональную автоматизацию

2 min

15K

Natural Language Processing * The future is hereArtificial IntelligenceMachine learning * Programming *

OpenAI анонсировала новое поколение своих фронтир-моделей. GPT-5.2 позиционируется как инструмент для сложной профессиональной работы: от агентных пайплайнов до многочасовых задач с длинным контекстом и мультимодальностью.

Читать далее

+4

python_leader Dec 11 2025 at 09:33

Cursor представили Debug Mode

2 min

9.4K

Programming * Machine learning * Artificial IntelligenceThe future is hereText editors and IDEs *

Cursor внедрили Debug Mode, отдельный рабочий цикл для кодовых агентов, который впервые сочетает автоматическую диагностику, инструментирование рантайма и обязательную верификацию со стороны разработчика. Цель нововведения не ускорить генерацию кода, а научить модель системно устранять баги, которые прежде оказывались для нее слишком «глубокими».

Читать далее

+8

python_leader Dec 10 2025 at 09:35

OpenRouter выкатили огромное исследование: как реально используют LLM (анализ 100 трлн токенов)

2 min

17K

Natural Language Processing * The future is hereArtificial IntelligenceMachine learning * Programming *

В исследовании изучили 100 трлн токенов живого трафика через OpenRouter (300+ моделей, 60+ провайдеров, миллионы пользователей, до ноября 2025 года).

Ключевые выводы 👇

Open source закрепился на ~30% и привёл с собой Китай.

Открытые модели стабильно держат около трети токенов. Особенно выросли китайские OSS (DeepSeek, Qwen, Kimi): с ~1–2% до до 30% трафика в отдельные недели, в среднем ~13%.

Читать далее

+10

python_leader Dec 10 2025 at 08:10

Mistral выкатили Devstral 2 — открытая SOTA модель для кодинга

1 min

4.5K

The future is hereOpen source * Artificial IntelligenceMachine learning * Programming *

Неделю назад мы писали про Mistral 3 с MoE-моделью на 675B параметров. Сегодня компания представила Devstral 2 — новое поколение открытых моделей для кодинга.

Главное:

– Devstral 2 (123B): 72.2% на SWE-bench Verified, фактически новый SOTA среди open-weight кодовых агентов.
– До 7 раз дешевле Sonnet на реальных инженерных задачах.
– Devstral Small 2 (24B): 68% на SWE-bench, работает локально на потребительском железе, 256K контекста, Apache 2.0.
– Модель бесплатна в API на старте. Доступна на OpeRouter.
– Mistral Vibe CLI: нативный open-source кодовый агент прямо в терминале, умеет исследовать проект, вносить многофайловые правки и выполнять shell-команды.

Devstral 2 и Small 2 получились удивительно компактными: они...

Читать далее

+6

python_leader Dec 10 2025 at 07:55

Google тихо отключил Gemini 2.5 Pro в бесплатном тарифе

1 min

12K

Programming * IT-companiesGoogle API *

На форуме Gemini API и Reddit десятки разработчиков заметили, что Gemini 2.5 Pro внезапно исчез из Free Tier, несмотря на то что на официальной странице он по-прежнему указан как «free of charge». В реальности модель недоступна: нет квоты, нет вызовов, проекты падают на rate limit без объяснений.

Читать далее

+10

python_leader Dec 10 2025 at 07:39

Linux Foundation запускает Agentic AI Foundation

1 min

3.8K

IT Standards * Development for Linux * IT-companiesProgramming *

Под крыло фонда сразу передали MCP (Anthropic), goose (Block) и AGENTS.md (OpenAI), то есть весь тот стек, который за год стал основой современного агентного подхода.

Смысл AAIF в наведении порядка: агентные системы уже инфраструктура, а инфраструктура требует открытых протоколов, понятной модели управления и отсутствия единоличного влияния.

Например, до сих пор всё держалось на «OpenAI API» как де-факто интерфейса для работы с моделями. Многим может напомнить историю Oracle с JavaScript, когда критическая технология оказывается под контролем одного игрока. AAIF – это попытка избежать ровно этого.

Что уже попало под крыло AAIF:

Читать далее

+3

python_leader Dec 6 2025 at 11:23

В IDE от JetBrains появилась поддержка Agent Client Protocol

1 min

6.1K

Artificial IntelligenceThe future is hereProgramming * Text editors and IDEs * Machine learning *

В релиз-кандидатах линейки 25.3 появилась бета-поддержка Agent Client Protocol (ACP) — открытого стандарта взаимодействия IDE и локальных/удалённых AI-агентов. Идея проста: как когда-то LSP стал мостом между редакторами и языковыми серверами, так ACP должен стать общим языком для IDE и умных ассистентов.

Читать далее

+1

python_leader Dec 4 2025 at 16:06

JetBrains представила Air: новую агентную IDE

2 min

13K

Machine learning * Text editors and IDEs * The future is hereArtificial IntelligenceProgramming *

Компания выпустила Air — ADE (Agentic Development Environment), ориентированную на гибридную работу «разработчик + ИИ-агенты». Это не просто чат с моделью внутри IDE, а отдельная среда, где можно ставить задачи агентам, запускать их параллельно, контролировать изменения и коммитить результаты.

Air пока доступен в превью и работает только с одним агентом — Claude Agent, причём для использования требуется активная подписка Anthropic. Версии для Windows и Linux обещают в 2026 году — сейчас приложение доступно только на macOS.

Читать далее

+9

python_leader Dec 4 2025 at 08:26

MinIO перевёл репозиторий в режим maintenance: развитие остановлено

2 min

13K

Data storage * IT Infrastructure * Open source * Programming *

Команда MinIO официально перевела один из ключевых репозиториев в режим maintenance. Проект больше не принимает никаких изменений — ни функциональных, ни инфраструктурных. Судя по заявлению, разработчики фиксируют лишь критические уязвимости, и то в индивидуальном порядке.

Что именно меняется...

Читать далее

+2

python_leader Dec 4 2025 at 07:42

Вышел Django 6.0: фоновые задачи, частичные шаблоны и обновлённая безопасность

2 min

5.1K

Programming * Python * Django * Website development *

Команда Django представила релиз версии 6.0 — крупное обновление, в котором фреймворк делает заметный шаг в сторону «современного Python-стека» и упорядочивания накопившихся возможностей. Новая версия сфокусирована на удобстве разработки, безопасности и снижении архитектурной «магии».

Читать далее

+5

python_leader Dec 3 2025 at 08:39

Внутреннее исследование Anthropic: рост output, падение deep-skills и новая роль разработчика

3 min

5.4K

IT-companiesThe future is hereArtificial IntelligenceMachine learning * Programming *

Компания Anthropic опубликовала большое внутреннее исследование о том, как использование Claude меняет работу её собственных инженеров и исследователей. Это редкий случай, когда разработчики ИИ смотрят не на рынок в целом, а на себя — как на первых «подопытных» новой технологической эпохи.

За август 2025 года команда собрала данные опроса 132 сотрудников, провела 53 глубинных интервью и проанализировала 200 000 сессий в Claude Code. Выводы двоякие: продуктивность растёт, инженеры становятся более «фуллстековыми» и смелее в задачах, но параллельно растут тревоги — от потери навыков до угрозы автоматизации собственных рабочих мест.

Читать далее

+6

python_leader Dec 2 2025 at 19:32

Французский стартап представил линейку Mistral 3: 675 миллиардов параметров в open source

2 min

9.1K

Natural Language Processing * The future is hereArtificial IntelligenceMachine learning * Programming *

Компания Mistral AI выпустила новое поколение своих моделей — Mistral 3. В релиз вошли три небольших плотных модели (3B, 8B и 14B), а также флагманская Mistral Large 3 — разреженная Mixture-of-Experts-архитектура с 41B активных и 675B общих параметров. Все модели распространяются под Apache 2.0, что делает Mistral 3 одним из крупнейших полностью открытых релизов в сегменте frontier-класса.

Технические нововведения и архитектура

Large 3 — первый MoE-модельный релиз Mistral со времён Mixtral. Она обучалась с нуля на 3000 GPU NVIDIA H200 и демонстрирует паритет с лучшими инструкционно-натренированными open-weight-моделями. Новинка поддерживает понимание изображений и показывает лидирующие результаты в многоязычных диалогах, особенно за пределами англо-китайских датасетов, где большинство конкурентов традиционно...

Читать далее

+8

python_leader Dec 1 2025 at 11:43

DeepSeek представила модели V3.2 и V3.2-Speciale: новый фокус на reasoning и агентные сценарии

2 min

9.8K

Programming * Machine learning * Artificial IntelligenceThe future is hereNatural Language Processing *

Китайский стартап DeepSeek выпустил очередное обновление линейки своих LLM — модели DeepSeek-V3.2 и DeepSeek-V3.2-Speciale. Обе позиционируются как системы нового поколения, оптимизированные под работу агентов: многошаговое рассуждение, планирование, сложные цепочки вывода и интеракции со структурированными средами.

V3.2 уже доступна в чате DeepSeek, на сайте и через API. Версия Speciale пока работает только по API через временный endpoint — до 15 декабря 2025 года.

Читать далее

+7

1