Новости / Профиль python_leader / Хабр

Все потоки

Иван Никитин@python_leader

Passionate Developer.

43,7

Рейтинг

213

Подписчики

ПрофильСтатьи33ПостыНовости155Комментарии7

python_leader 28 мая в 17:14

Anthropic выпустили Opus 4.8: в 4 раза меньше незамеченных багов и fast mode в 3 раза дешевле

1 мин

17K

Искусственный интеллектМашинное обучение * Будущее здесь

Anthropic выпустили Claude Opus 4.8 — обновление флагманской модели, доступное с сегодняшнего дня по той же цене: $5 за млн входящих токенов и $25 за млн исходящих.

Одно из ключевых изменений — честность модели при работе с кодом. По данным Anthropic, Opus 4.8 в 4 раза реже, чем 4.7, пропускает незамеченными баги в собственном коде. На Super-Agent benchmark от компании Linkup — единственная модель, прошедшая все кейсы от начала до конца, при паритете по стоимости с GPT-5.5. На Online-Mind2Web набрала 84% — выше, чем Opus 4.7 и GPT-5.5.

Читать далее

+4

python_leader 28 мая в 16:17

Отчёт Cursor: только 1% разработчиков пишет в 46 раз больше кода

1 мин

11K

Искусственный интеллектМашинное обучение * Программирование * Будущее здесь

Cursor выпустил Developer Habits Report — первый публичный срез того, как их пользователи работают с AI-инструментами. Данные собраны с января 2025 по май 2026 года на основе сессий, токенов и активности в репозиториях.

Скорость написания кода выросла примерно вдвое за год: с 3,6 тыс. строк в неделю до 8,6 тыс. PR стали крупнее в 2,5 раза, а доля пул-реквестов с тысячей и более изменённых строк выросла с 8% до 14%.

Читать далее

+3

python_leader 27 мая в 10:49

Новый бенчмарк DeepSWE: GPT-5.5 — 70%, Opus 4.7 — 54%

1 мин

8K

Программирование * Будущее здесьМашинное обучение * Искусственный интеллект

Новый бенчмарк DeepSWE показал, что GPT-5.5 решает 70% задач по разработке ПО, тогда как Claude Opus 4.7 — 54%. На SWE-Bench Pro картина была ровно обратной: там Opus 4.7 занимал первое место с 64%, а GPT-5.5 шёл следом с 59%.

DeepSWE — бенчмарк от команды Datacurve. В отличие от SWE-Bench, все задачи в нём написаны с нуля: никаких адаптаций существующих PR и коммитов. Средняя задача требует написать 668 строк кода и затронуть 7 файлов — против 120 строк и 5 файлов в SWE-Bench Pro. Верификаторы тестируют поведение, а не реализацию, поэтому правильный ответ не привязан к конкретной структуре кода.

Читать далее

+4

python_leader 25 мая в 10:28

Cerebras запустили Kimi K2.6 на скорости ~1000 токенов в секунду

1 мин

7.4K

Искусственный интеллектМашинное обучение * Будущее здесьПроцессоры

Cerebras запустили Kimi K2.6 (1T open-weight) на своём чипе со скоростью 981 токен/с — в 6,7× быстрее лучших GPU-облаков.

Запрос 10k токенов на вход и 500 токенов на выход обрабатывается за 5,6 секунды вместо 164 секунд на официальном эндпоинте.

Читать далее

+4

python_leader 21 мая в 16:12

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

1 мин

16K

Искусственный интеллектПрограммирование * Будущее здесьМашинное обучение *

Alibaba выпустила Qwen3.7-Max — закрытую флагманскую модель для долгоживущих агентов. В тестах: 35 часов автономной работы, 1158 вызовов инструментов, 10x ускорение CUDA-ядра. На SWE-bench Pro — 60.6, между Opus 4.6 и Opus 4.7.

Читать далее

+12

python_leader 15 мая в 07:51

xAI выпустили Grok Build — агентный CLI для разработчиков

1 мин

5.7K

Искусственный интеллектПрограммирование * Текстовые редакторы и IDE *

xAI открыли ранний бета-тест Grok Build — консольного агента для профессиональной разработки. Пока доступно только подписчикам SuperGrok Heavy.

Устанавливается одной командой: curl -fsSL https://x.ai/cli/install.sh | bash. Инструмент подхватывает конфигурацию репозитория автоматически — AGENTS.md, плагины, хуки, skills и MCP-серверы работают без дополнительной настройки.

Для сложных задач есть режим планирования...

Читать далее

+1

python_leader 13 мая в 18:43

С 15 июня у подписчиков Claude появится отдельный ежемесячный кредит на API

1 мин

12K

Будущее здесьМашинное обучение * Искусственный интеллект

Anthropic объявила, что с 15 июня 2026 года подписчиĸи Pro, Max и Team получат отдельный ежемесячный ĸредит на программное использование Claude — он не связан с лимитами основной подписĸи.

Читать далее

+3

python_leader 6 мая в 08:21

SubQ: первая LLM с контекстом в 12 млн токенов

1 мин

6.4K

Искусственный интеллектМашинное обучение * Будущее здесь

Компания Subquadratic выпустила модель SubQ 1M-Preview — первую, по их словам, LLM на полностью субквадратичной архитектуре. Речь про SSA (Subquadratic Sparse Attention): вместо того чтобы сравнивать каждый токен с каждым (O(n²)), механизм выбирает только релевантные позиции на основе содержимого. Вычислительная сложность растёт линейно.

Читать далее

+2

python_leader 6 мая в 07:57

Gemma 4 стала быстрее в 3 раза без потери качества

1 мин

11K

Искусственный интеллектМашинное обучение * Будущее здесьOpen source *

Google открыла веса вспомогательных моделей для всей линейки Gemma 4 — E2B, E4B, 26B MoE и 31B Dense. Они доступны на Hugging Face и Kaggle под Apache 2.0 и уже работают с transformers, MLX, vLLM, SGLang и Ollama.

Стандартная генерация токенов устроена неэффективно: процессор большую часть времени тратит не на вычисления, а на перекачку весов модели из памяти. Из-за этого даже мощные GPU простаивают, пока генерируется один токен.

Читать далее

+6

python_leader 28 апр в 08:49

Copilot сделает Claude Opus в 27 раз дороже

1 мин

15K

Программирование * GitHub * Текстовые редакторы и IDE * Искусственный интеллект

С 1 июня GitHub переводит Copilot на usage-based оплату. Автодополнения кода остаются без лимитов, всё остальное — чат, агентные режимы, code review — тратит GitHub AI Credits по токенным расценкам.

Базовая цена подписки не меняется: Pro $10/мес, Pro+ $39. Кредиты включены на ту же сумму.

Для годовых планов: Sonnet 4.5 — с 1x до 6x, Sonnet 4.6 — до 9x, Opus 4.6 и 4.7 — до 27x. Годовые планы постепенно выводят из обращения. После окончания текущего годового периода пользователя переведут на Free или предложат перейти на monthly план.

Читать далее

+2

python_leader 24 апр в 05:49

DeepSeek выпустил V4 — открытую модель с контекстом в миллион токенов

1 мин

12K

Искусственный интеллектМашинное обучение * Natural Language Processing * Будущее здесьOpen source *

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.

V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. При этом модель потребляет около 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.

V4-Flash меньше — 284 миллиарда параметров с 13 активными — и ещё экономичнее: примерно 10% FLOPs и 7% KV-cache по сравнению с V3. Контекст тот же — миллион токенов.

Читать далее

+8

python_leader 23 апр в 18:13

OpenAI выпустили GPT-5.5: пишет код дешевле предшественника

1 мин

12K

Искусственный интеллектПрограммирование * Natural Language Processing * Машинное обучение *

GPT-5.5 — это следующая модель после GPT-5.4, ориентированная прежде всего на агентную работу: многошаговые задачи, где модель планирует, использует инструменты и доводит работу до конца без постоянного участия пользователя.

На Terminal-Bench 2.0 (сложные командно-строковые сценарии с планированием и итерациями) модель показала 82.7% против 75.1% у GPT-5.4. На SWE-Bench Pro, который оценивает решение реальных GitHub-задач, — 58.6%. Примечательно, что этих результатов GPT-5.5 достигает при меньшем количестве токенов, чем предшественник.

Читать далее

0

python_leader 22 апр в 06:40

Anthropic убирает Claude Code из плана Pro за 20$

1 мин

45K

Искусственный интеллектПрограммирование *

Anthropic обновили страницу с тарифами: Claude Code теперь доступен только начиная с Max 5x за $100/месяц. Pro за $20 его больше не включает. Официального анонса не было.

Amol Avasare из Anthropic объяснил логику в треде на X. Год назад Max проектировался под интенсивный чат — без Claude Code, без Cowork, без долгих асинхронных агентов. После выхода Opus 4 всё изменилось: агентные сценарии стали повседневными, нагрузка на подписчика выросла, а текущие планы под это не рассчитывались.

Читать далее

+17

python_leader 20 апр в 15:49

Kimi выпустили открытую модель K2.6 для долгих задач по программированию

1 мин

11K

Искусственный интеллектПрограммирование * Машинное обучение * Natural Language Processing *

Moonshot AI представила Kimi K2.6 — открытую модель, заточенную под длинные задачи в программировании и агентные сценарии. В компании утверждают, что новая версия лучше справляется с многошаговой работой: может дольше удерживать контекст, чаще корректно вызывать инструменты и эффективнее координировать несколько субагентов.

Читать далее

0

python_leader 18 апр в 11:57

Бесплатная Stealth-модель оказалась в топе OpenRouter за 72 часа

1 мин

11K

Искусственный интеллектМашинное обучение *

13 апреля на OpenRouter появилась Elephant Alpha — 100-миллиардная языковая модель без имени автора, пресс-релиза и маркетинга. Через несколько дней она заняла первое место в Trending-ранкинге платформы, обойдя платные модели по реальному потреблению токенов.

OpenRouter описывает её как модель, «ориентированную на интеллектуальную эффективность». Контекст — 256K токенов, максимальный вывод — 32K, скорость — около 50–65 токенов в секунду. Поддерживает function calling и structured output. Цена — $0 за миллион токенов.

Читать далее

+2

python_leader 18 апр в 10:17

GPT-5.4 и Opus 4.6 воспроизвели находки закрытой модели Mythos от Anthropic

1 мин

9.7K

Искусственный интеллектМашинное обучение * Информационная безопасность *

Anthropic заявила, что их закрытая модель Mythos находит уязвимости, недоступные публичным инструментам. Исследователи из Vidoc проверили это.

В начале апреля Anthropic опубликовала результаты проекта Mythos: специализированная модель нашла баги в FreeBSD, OpenBSD, FFmpeg, Botan и wolfSSL — включая 27-летний баг в TCP-стеке OpenBSD. Вместе с анонсом Project Glasswing это подавалось как аргумент за то, что доступ к новой frontier-модели должен быть закрытым и подконтрольным.

Команда Vidoc Security взяла те же публично запатченные примеры и прогнала их через GPT-5.4 и Claude Opus 4.6 в opencode — опенсорсном агенте. Без внутреннего стека Anthropic, без доступа к «уникальной» модели.

Читать далее

+3

python_leader 16 апр в 14:46

Anthropic выпустили Claude Opus 4.7

2 мин

15K

Искусственный интеллектМашинное обучение * Natural Language Processing * Будущее здесьПрограммирование *

Сегодня Anthropic объявила о выходе Claude Opus 4.7. Модель стала заметным шагом вперёд в программировании: в тестах на реальных задачах Cursor зафиксировал рост с 58% до 70%, CodeRabbit отметил улучшение recall на 10% при стабильной точности, а Rakuten — трёхкратный рост решённых production-задач по сравнению с Opus 4.6.

Читать далее

+7

python_leader 14 апр в 06:48

Вышел Cursor 3.1: параллельные агенты в одном окне и новый голосовой ввод

1 мин

5.5K

Искусственный интеллектПрограммирование * Текстовые редакторы и IDE *

Команда Cursor выпустила обновление 3.1, которое сосредоточено вокруг Agents Window.

Главное добавление — tiled layout: окно с агентами теперь можно разбить на панели, запускать несколько агентов параллельно и сравнивать их вывод рядом. Настройки раскладки сохраняются между сессиями.

Читать далее

+5

python_leader 10 апр в 16:59

Anthropic научили Sonnet консультироваться с Opus

1 мин

7.8K

Искусственный интеллектПрограммирование *

Anthropic выпустили advisor tool — инструмент, который позволяет запустить Opus как советника внутри задачи, которую выполняет Sonnet или Haiku.

Работает так: Sonnet ведёт задачу от начала до конца — вызывает инструменты, читает результаты, двигается к решению. Когда упирается в решение, которое не может принять сам, обращается к Opus. Тот смотрит на контекст, возвращает план или корректировку — и Sonnet продолжает.

Читать далее

+5

python_leader 10 апр в 14:13

Anthropic собирается разрабатывать собственные ИИ-чипы

1 мин

6K

Искусственный интеллектПроцессорыIT-компании

Anthropic рассматривает разработку собственных чипов — пишет Reuters со ссылкой на три источника

Планы пока на ранней стадии: выделенной команды нет, конкретной архитектуры тоже. Сейчас Anthropic использует TPU от Google и чипы Amazon для обучения и запуска Claude. На этой неделе компания подписала долгосрочный контракт с Google и Broadcom (который как раз и проектирует TPU).

Читать далее

+2

1

2 3 ...