Обновить
64K+
88
Иван Никитин@python_leader

Passionate Developer.

118,5
Рейтинг
226
Подписчики
Отправить сообщение

OpenAI выпустили GPT-5.5: пишет код дешевле предшественника

Время на прочтение1 мин
Охват и читатели12K

GPT-5.5 — это следующая модель после GPT-5.4, ориентированная прежде всего на агентную работу: многошаговые задачи, где модель планирует, использует инструменты и доводит работу до конца без постоянного участия пользователя.

На Terminal-Bench 2.0 (сложные командно-строковые сценарии с планированием и итерациями) модель показала 82.7% против 75.1% у GPT-5.4. На SWE-Bench Pro, который оценивает решение реальных GitHub-задач, — 58.6%. Примечательно, что этих результатов GPT-5.5 достигает при меньшем количестве токенов, чем предшественник.

Читать далее

Anthropic убирает Claude Code из плана Pro за 20$

Время на прочтение1 мин
Охват и читатели46K

Anthropic обновили страницу с тарифами: Claude Code теперь доступен только начиная с Max 5x за $100/месяц. Pro за $20 его больше не включает. Официального анонса не было.

Amol Avasare из Anthropic объяснил логику в треде на X. Год назад Max проектировался под интенсивный чат — без Claude Code, без Cowork, без долгих асинхронных агентов. После выхода Opus 4 всё изменилось: агентные сценарии стали повседневными, нагрузка на подписчика выросла, а текущие планы под это не рассчитывались.

Читать далее

Kimi выпустили открытую модель K2.6 для долгих задач по программированию

Время на прочтение1 мин
Охват и читатели12K

Moonshot AI представила Kimi K2.6 — открытую модель, заточенную под длинные задачи в программировании и агентные сценарии. В компании утверждают, что новая версия лучше справляется с многошаговой работой: может дольше удерживать контекст, чаще корректно вызывать инструменты и эффективнее координировать несколько субагентов.

Читать далее

Бесплатная Stealth-модель оказалась в топе OpenRouter за 72 часа

Время на прочтение1 мин
Охват и читатели12K

13 апреля на OpenRouter появилась Elephant Alpha — 100-миллиардная языковая модель без имени автора, пресс-релиза и маркетинга. Через несколько дней она заняла первое место в Trending-ранкинге платформы, обойдя платные модели по реальному потреблению токенов.

OpenRouter описывает её как модель, «ориентированную на интеллектуальную эффективность». Контекст — 256K токенов, максимальный вывод — 32K, скорость — около 50–65 токенов в секунду. Поддерживает function calling и structured output. Цена — $0 за миллион токенов.

Читать далее

GPT-5.4 и Opus 4.6 воспроизвели находки закрытой модели Mythos от Anthropic

Время на прочтение1 мин
Охват и читатели9.7K

Anthropic заявила, что их закрытая модель Mythos находит уязвимости, недоступные публичным инструментам. Исследователи из Vidoc проверили это.

В начале апреля Anthropic опубликовала результаты проекта Mythos: специализированная модель нашла баги в FreeBSD, OpenBSD, FFmpeg, Botan и wolfSSL — включая 27-летний баг в TCP-стеке OpenBSD. Вместе с анонсом Project Glasswing это подавалось как аргумент за то, что доступ к новой frontier-модели должен быть закрытым и подконтрольным.

Команда Vidoc Security взяла те же публично запатченные примеры и прогнала их через GPT-5.4 и Claude Opus 4.6 в opencode — опенсорсном агенте. Без внутреннего стека Anthropic, без доступа к «уникальной» модели.

Читать далее

Anthropic выпустили Claude Opus 4.7

Время на прочтение2 мин
Охват и читатели15K

Сегодня Anthropic объявила о выходе Claude Opus 4.7. Модель стала заметным шагом вперёд в программировании: в тестах на реальных задачах Cursor зафиксировал рост с 58% до 70%, CodeRabbit отметил улучшение recall на 10% при стабильной точности, а Rakuten — трёхкратный рост решённых production-задач по сравнению с Opus 4.6.

Читать далее

Вышел Cursor 3.1: параллельные агенты в одном окне и новый голосовой ввод

Время на прочтение1 мин
Охват и читатели5.5K

Команда Cursor выпустила обновление 3.1, которое сосредоточено вокруг Agents Window.

Главное добавление — tiled layout: окно с агентами теперь можно разбить на панели, запускать несколько агентов параллельно и сравнивать их вывод рядом. Настройки раскладки сохраняются между сессиями.

Читать далее

Anthropic научили Sonnet консультироваться с Opus

Время на прочтение1 мин
Охват и читатели7.8K

Anthropic выпустили advisor tool — инструмент, который позволяет запустить Opus как советника внутри задачи, которую выполняет Sonnet или Haiku.

Работает так: Sonnet ведёт задачу от начала до конца — вызывает инструменты, читает результаты, двигается к решению. Когда упирается в решение, которое не может принять сам, обращается к Opus. Тот смотрит на контекст, возвращает план или корректировку — и Sonnet продолжает.

Читать далее

Anthropic собирается разрабатывать собственные ИИ-чипы

Время на прочтение1 мин
Охват и читатели6K

Anthropic рассматривает разработку собственных чипов — пишет Reuters со ссылкой на три источника

Планы пока на ранней стадии: выделенной команды нет, конкретной архитектуры тоже. Сейчас Anthropic использует TPU от Google и чипы Amazon для обучения и запуска Claude. На этой неделе компания подписала долгосрочный контракт с Google и Broadcom (который как раз и проектирует TPU).

Читать далее

Один из сооснователей GitHub поднял $17M инвестиций на то, чтобы заменить Git

Время на прочтение1 мин
Охват и читатели12K

Скотт Чакон, который помогал создавать GitHub, в 2022 году запустил GitButler — и сейчас закрыл раунд Series A от a16z. Идея простая: за 20 лет Git почти не изменился, а мир разработки изменился кардинально.

Сегодня команды используют Git, чтобы координировать работу агентов, параллельные ветки нескольких разработчиков и асинхронные правки. Но сам инструмент проектировался под совершенно другую модель: один человек, один терминал, одна ветка, линейный поток изменений.

Читать далее

Anthropic показали Claude Mythos Preview — и сразу заявили: в паблик модель выпускать не будут

Время на прочтение1 мин
Охват и читатели20K

Anthropic запустили Project Glasswing — закрытую инициативу по defensive security вместе с AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, JPMorganChase, Linux Foundation и другими.

Внутри проекта участникам дали доступ к Claude Mythos Preview — новой frontier-модели, которую Anthropic не собираются выпускать в общий доступ.

Читать далее

Z.ai выпустили GLM-5.1 — open-source модель, заточенную под долгие агентные задачи

Время на прочтение2 мин
Охват и читатели11K

Z.ai выпустили GLM-5.1 — новую флагманскую модель под MIT-лицензией, ориентированную на агентные инженерные задачи. По SWE-Bench Pro она набирает 58.4% против 57.3% у Claude Opus 4.6 и 57.7% у GPT-5.4. На NL2Repo (генерация репозиториев) GLM-5.1 обходит GLM-5 с 35.9% до 42.7%.

Но интереснее другое. Большинство моделей ведут себя одинаково: быстро берут низко висящие плоды, потом останавливаются. Дополнительное время не помогает — стратегия исчерпана. GLM-5.1 проектировали с прицелом на другое поведение.

Читать далее

Telegram снял ограничение на общение ботов между собой

Время на прочтение1 мин
Охват и читатели14K

Исторически ботам было запрещено общаться между собой.

Теперь они могут писать друг другу в чатах (через упоминание /command@OtherBot или реплай) и через Business Mode. Достаточно, чтобы у одного из ботов был включён Bot-to-Bot Communication Mode в BotFather.

Читать далее

Alibaba выкатили Qwen3.6-Plus — новый флагман серии Qwen

Время на прочтение1 мин
Охват и читатели12K

Модель появилась на OpenRouter в ночь с 30 на 31 марта как бесплатный превью без анонса и пресс-релиза: один твит от исследователя Qwen с таблицей бенчмарков — и всё. За первые два дня через неё прошло 400 млн completion-токенов в ~400 тыс. запросах.

Контекстное окно по умолчанию — 1 млн токенов. На Terminal-Bench 2.0 модель набрала 61.6 против 59.3 у Claude 4.5 Opus, на OmniDocBench v1.5 — 91.2 против 87.7. На SWE-bench Verified пока отстаёт: 78.8 против 80.9 у Claude. 

Читать далее

Anthropic случайно слили исходники Claude Code

Время на прочтение1 мин
Охват и читатели14K

Anthropic случайно слили исходный код Claude Code через файл source map в npm-пакете.

Утечку обнаружил исследователь Chaofan Shou — в публичном пакете оказался .map-файл с полным TypeScript-кодом. Это не взлом, просто ошибка при сборке.

Читать далее

Qwen3.6 Plus Preview появился на OpenRouter бесплатно

Время на прочтение1 мин
Охват и читатели11K

Сегодня Alibaba выпустила Qwen3.5-Omni — мультимодальную модель, которая принимает текст, изображения, аудио и видео, а на выходе генерирует текст и речь одновременно. Три размера: Plus, Flash, Light. Контекст до 256k токенов, больше 10 часов аудиовхода.

И сегодня же на OpenRouter появился Qwen3.6 Plus Preview — следующая версия после 3.5 — бесплатно, с контекстом 1M токенов. Условие одно: промпты и ответы собираются для дообучения модели.

Читать далее

Cursor начали делать локальные индексы для regex-поиска прямо в IDE

Время на прочтение1 мин
Охват и читатели6.9K

Классический ripgrep работает быстро, но всё равно читает каждый файл. В крупных монорепо это стоит 15+ секунд на один вызов, а агент делает их десятками.

Решение взяли из 1993 года: тригрaмный инвертированный индекс. Любой текст разбивается на все возможные 3-символьные последовательности, они становятся ключами в словаре, значения — список файлов. Regex-запрос декомпозируется в набор тригрaм, пересечение posting lists даёт кандидатов, и уже по ним запускается grep. Вместо тысячи файлов — десяток.

Читать далее

Composer 2 оказался Kimi K2.5: Cursor не раскрыл базовую модель и нарушил лицензию

Время на прочтение1 мин
Охват и читатели12K

19 марта Cursor выпустил Composer 2 —свою новую флагманскую модель. В анонсе говорилось о дообучении через RL и улучшении производительности, но базовая модель не упоминалась.

Спустя несколько часов после релиза разработчик подменил OpenAI base URL в Cursor на собственный прокси и перехватил запрос. В нём оказался model ID accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast.

Читать далее

Cursor выпустили Composer 2 — собственную модель, заточенную под кодинг

Время на прочтение1 мин
Охват и читатели17K

На Terminal-Bench 2.0 она набирает 61.7 против 47.9 у предыдущей версии, на SWE-bench Multilingual — 73.7 против 65.9. Прирост примерно в 25-30% по всем замерам.

Команда Cursor утверждает, что Composer 2 справляется с задачами, требующими сотен последовательных действий.

Читать далее

Анонимная модель неделю держала топ OpenRouter. Это оказалась модель от Xiaomi

Время на прочтение1 мин
Охват и читатели5.9K

На OpenRouter неделю держалась анонимная модель Hunter Alpha. Многие LLM-провайдеры часто делают так с новыми моделями, чтобы затестить на реальных пользователях.

За это время она стала топ-1 по дневным вызовам и пробила 1 трлн токенов суммарно. Версий было много: DeepSeek тестирует V4, MiniMax (которыe вчера как раз представили M2.7) — и ещё куча вариантов.

Оказалось — Xiaomi!

Читать далее

Информация

В рейтинге
56-й
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик
Ведущий
Python
SQL
Git
ООП
PostgreSQL
Docker
Django