Обновить
64K+
88
Иван Никитин@python_leader

Passionate Developer.

117,5
Рейтинг
226
Подписчики
Отправить сообщение

Вышел Grok 4.1 от xAI

Время на прочтение2 мин
Охват и читатели5K

Компания xAI официально объявила о выпуске Grok 4.1. По данным компании, Grok 4.1 значительно улучшает качество взаимодействия за счёт расширенных творческих, эмоциональных и совместных возможностей. Модель стала лучше воспринимать тонкие намерения пользователя, придерживается более целостного стиля общения и сохраняет «личность», при этом не теряя точности и надёжности, характерных для предыдущих поколений Grok.

Для достижения этих результатов xAI применила масштабную инфраструктуру обучения с подкреплением, ранее использовавшуюся для Grok 4, и оптимизировала стиль, характер, полезность и выравнивание новой версии. Компания также разработала методы, позволяющие использовать передовые агентные модели рассуждений в качестве моделей вознаграждения, что обеспечивает автоматическую оценку и улучшение ответов в большом масштабе.

Тихий запуск и метрики качества

С 1 по 14 ноября 2025 года xAI проводила тихий запуск предварительных сборок Grok 4.1, постепенно увеличивая долю реального трафика, перенаправляемого на новую модель. В течение этого периода компания проводила непрерывные слепые попарные сравнения.

Результаты показали, что пользователи...

Читать далее

TOON: новый формат на смену JSON для более эффективного взаимодействия с LLM?

Время на прочтение2 мин
Охват и читатели24K

TOON — это ещё один способ записать те же самые JSON-данные, но компактнее и понятнее для моделей. Вместо  "key": "value" он использует отступы как YAML и табличную запись для массивов объектов: шапка с названиями полей, дальше строки с данными.

Главная идея — экономия токенов и более предсказуемое поведение LLM на больших массивах данных. Помните, мы даже рассказывали про то, что от формата напрямую может зависеть результат генерации. (Какой табличный формат LLM понимают лучше всего? (Результаты по 11 форматам))

В бенчмарках TOON даёт порядка 30–60% экономии токенов...

Читать далее

Go исполнилось 16 лет

Время на прочтение1 мин
Охват и читатели6.1K

10 ноября языку Go стукнуло 16 лет с момента выхода в Open source — и команда подошла к дню рождения не с ностальгией, а с результатами. В честь праздника они выпустили обзор, в котором подчёркивают направления, ставшие ключевыми в развитии Go за последний год: улучшения языка и стандартной библиотекибезопасная разработка, серьёзные апгрейды «под капотом» и продвижение всей платформы разработки.

К одному из самых заметных прорывов относится новый сборщик мусора Green Tea, который снижает накладные расходы на 10–40%. Для продакшн-сервисов это означает меньше пауз, стабильнее задержки и ощутимый выигрыш без каких-либо доработок в коде.

Не менее значимый апдейт — flight recorder для диагностики: он сохраняет последние миллисекунды жизни сервиса и позволяет понять, что случилось, даже если проблема проявилась спустя часы.

А ещё Go уверенно заходит в эпоху ИИ: официальный MCP SDK и Agent Development Kit (ADK) для Go формируют прочный фундамент для разработки агентных систем и инструментов прямо на Go. Команда обещает, что это только начало — и обороты они точно снижать не собираются.

Источник

Читать далее

GPT-5.1 оказалась настолько дотошной, что традиционные подходы к управлению кодовыми агентами перестали работать

Время на прочтение2 мин
Охват и читатели6.6K

Команда Cline несколько недель изучала поведение GPT-5.1 и увидела в нём качественный сдвиг. Модель читает всё, что может, строит “карту местности” задачи и удерживает в голове огромный объём контекста — даже если нужно поправить один символ.

Это не просто более мощная модель: она действует как инженер, который сначала анализирует систему целиком, а уже потом приступает к изменениям. Такая глубина полезна при сложных задачах, но без жёстких рамок GPT-5.1 легко уходит в сторону — и именно это потребовало серьёзных обновлений в архитектуре Cline.

Разработчики усилили структурную часть агента:

Читать далее

Вышел GPT-5.1: более умный и более разговорчивый ChatGPT

Время на прочтение2 мин
Охват и читатели6.8K

OpenAI выкатывает сразу два обновления линейки GPT-5 — Instant и Thinking, а вместе с ними полностью перестраивает систему тонов и персонализации.

OpenAI провела масштабный апгрейд моделей, чтобы уменьшить разрыв между «умным ИИ» и «приятным собеседником». Обновление начинает раскатываться уже сегодня — сначала платным пользователям, затем всем остальным.

Цель проста: сделать ChatGPT предсказуемее, человечнее и точнее в сложных задачах — от математики до кодинга.

Ключевые инсайты...

Читать далее

OpenAI выпустила GPT-5 Codex-Mini: в 4 раза дешевле, почти без потерь в мощности

Время на прочтение1 мин
Охват и читатели12K

OpenAI представила новую модель для разработчиков — GPT-5-Codex-Mini. Это упрощённая версия Codex, которая позволяет выполнять примерно в 4 раза больше запросов, но за счёт небольшой потери точности.

Детали обновления

Модель уже доступна в CLI и IDE-расширениях, если войти через аккаунт ChatGPT. Поддержка API появится позже.

Codex-Mini предназначен для простых задач и для случаев, когда пользователи приближаются к лимиту запросов. При достижении 90% лимита система автоматически предложит перейти на Mini, чтобы избежать остановки работы.

Ключевые факты

Читать далее

Вышла Kimi K2 Thinking – свежая open source-модель для сложных рассуждений и агентных задач

Время на прочтение2 мин
Охват и читатели7.3K

Она способна выполнять до 300 последовательных действий, строя цепочку логики, поиска и кода. В тестах вроде Humanity’s Last Exam, BrowseComp и SWE-Bench она поставила новые рекорды.

Эта модель — очередной шаг в направлении масштабирования вычислений во время выполнения, благодаря увеличению как количества «токенов размышления», так и числа шагов при вызове инструментов.

Kimi K2 Thinking устанавливает новые рекорды на бенчмарках, оценивающих логическое мышление, кодинг и агентные способности.

Читать далее

OpenAI стал самой быстрорастущей бизнес-платформой в истории

Время на прочтение1 мин
Охват и читатели5.9K

Компания называет себя самой быстрорастущей бизнес-платформой в истории, и цифры действительно впечатляют. Среди клиентов — Booking, Cisco, T-Mobile, Target, Morgan Stanley, Lowe’s и десятки других корпораций из финансового, розничного и технологического секторов.

Количество рабочих мест в ChatGPT for Work превысило 7 миллионов (рост на 40% за два месяца), а ChatGPT Enterprise — в 9 раз больше, чем год назад. Внедрение идёт быстро, потому что миллионы пользователей уже знакомы с ChatGPT в личных целях — и компании просто масштабируют этот опыт.

Инструменты, которые предоставляет OpenAI для бизнеса:

Читать далее

Claude Code снова удивляет — теперь уже в криптографии

Время на прочтение1 мин
Охват и читатели10K

Мы уже видели, как языковые модели решают задачки, над которыми профессора чесали головы годами. Видели, как они не решали задачу, а просто находили ответ, потому что знали, где копать (и не ленились, в отличие от нас, смертных). А теперь Claude Code от Anthropic залез в криптографию и починил реализацию постквантового алгоритма.

Инженер писал на Go реализацию ML-DSA, всё шло по плану, пока проверки не начали сыпаться с “invalid signature”.

Читать далее

Cline v3.35: нативные вызовы инструментов, обновлённое авторазрешение и бесплатный MiniMax M2

Время на прочтение3 мин
Охват и читатели7.9K

Вышел Cline v3.35, и он включает поддержку нативных вызовов инструментов, редизайн элементов меню и модель MiniMax M2. Пройдёмся по обновлению подробнее.

Читать далее

OpenAI запустила Aardvark — агента на GPT-5, который занимается кибербезопасностью

Время на прочтение1 мин
Охват и читатели7.2K

Он умеет подключаться к репозиториям, находить уязвимости, объяснять, в чём проблема, и предлагать патчи. 

Aardvark начинался как внутренний инструмент OpenAI: им пользовались собственные разработчики, чтобы проверять код. После нескольких успешных тестов компанию решили вывести систему наружу — пока в виде приватной беты для партнёров

Читать далее

Octoverse 2025: вот что важно знать Python-разработчикам

Время на прочтение1 мин
Охват и читатели6.1K

GitHub выкатили ежегодный Octoverse 2025: разработчиков теперь больше 180 миллионов, а новый аккаунт появляется буквально каждую секунду. Главный триггер этого бума? Бесплатный GitHub Copilot, который запустили в конце 2024-го. Привет всем вайбкодерам!)

А теперь — к тому, что важно Python-разработчикам. 

Во-первых, Python впервые уступил первое место TypeScript’у, но не потому, что сдал позиции. Просто фронтенд и строгая типизация сейчас на пике популярности вместе с агентами и Copilot’ом. TypeScript — идеальный партнёр для ИИ, который пишет код: строгие типы помогают ограничить количество “галлюцинирующего” кода.

Читать далее

Google представил Green Tea GC — сборщик мусора, который экономит до 40% CPU

Время на прочтение1 мин
Охват и читатели6.7K

Новый сборщик мусора в Go – Green Tea GC – уже тестируют в продакшене Google, и результаты ошеломляют — до 40% меньше времени на сборку мусора.

Исследование провели инженеры Google — Michael Knyszek и Austin Clements. Их цель: адаптировать Go GC под современные многоядерные процессоры, где традиционные алгоритмы просто застревают в ожидании кэш-памяти. Green Tea дебютировал в Go 1.25 как эксперимент (через GOEXPERIMENT=greenteagc), и уже в Go 1.26 его планируют включить по умолчанию.

Главные инсайты:

Читать далее

Вышел Cursor 2.0 и Composer – новая агентная модель, которая в 4 раза быстрее GPT-5

Время на прочтение1 мин
Охват и читатели9K

Команда Cursor представила обновление 2.0 – основной акцент в свежем обновлении на multi-agent интерфейс, в котором несколько моделей пишут код вместе. Кроме того, ребята зарелизили Composer – новую agentic-LLM, которая работает в 4 раза быстрее аналогов.

Что нового в Cursor 2.0...

Читать далее

Китайцы снова сделали это: MiniMax-M2 — новая SOTA в опенсорсе для кодинга

Время на прочтение1 мин
Охват и читатели8.3K

Внезапно, но факт: свежая MiniMax-M2 от китайской команды MiniMaxAI догнала Grok 4 Fast и Gemini 2.5 Pro. MoE-модель с всего 10B активных параметров обошла многих топ-игроков — от Claude до Gemini и GLM.

MiniMax-M2 — это компактная, но безумно мощная система, созданная специально для кода и агентов.

Что умеет MiniMax-M2...

Читать далее

Copilot стал умнее и быстрее: GitHub представил новую модель для автодополнения кода

Время на прочтение1 мин
Охват и читатели8.8K

Команда GitHub рассказала, как они обучили новый кастомный модельный стек для Copilot, полностью переосмыслив подход к метрикам и качеству предложений. Вместо того чтобы просто гнаться за “accept rate”, они оптимизировали то, что реально важно — полезность кода, который остаётся в проекте, а не удаляется через секунду.

Вот что изменилось...

Читать далее

ChatGPT Atlas: всё, что понятно на данный момент

Время на прочтение2 мин
Охват и читатели8.1K

Экосистема решений на базе LLM растёт со скоростью апдейтов ChatGPT. И вот теперь — ChatGPT Atlas, собственный браузер от OpenAI. Основан на Chromium (да, как Яндекс Браузер) ), но вместо привычной строки поиска — чат с вашим личным ИИ-ассистентом.

Да, стандартные Chrome-расширения работают без проблем, но мне интересно другое. Кажется, что должен появится новый тип расширений, “заточенных” под LLM-составляющую Atlas — те, что смогут напрямую общаться с моделью, использовать контекст вкладок и управлять агентами. И этот шаг был бы крайне логичным с точки зрения построения экосистемы и сообщества вокруг своего продукта...

Читать далее

Anthropic тратит больше, чем зарабатывает… и это нормально

Время на прочтение2 мин
Охват и читатели4.7K

Пока половина интернета всё еще плохо работает из-за сбоя в инфраструктуре AWS, давайте немного поговорим про деньги и облака. 

Прямо сейчас один из главных игроков рынка — Anthropic — сжигает $2.66 млрд только на AWS за девять месяцев 2025 года… при выручке в $2.55 млрд. То есть тратит больше, чем получает. И это — только облако Amazon. Google Cloud? Зарплаты? Тренировки моделей? По оценкам, можно смело удваивать предыдущий счёт. 

Anthropic не просто «в минусе» — он живёт в режиме постоянного кризиса ликвидности. А чтобы выжить, делает то, что делают все отчаявшиеся платформы: поднимает цены на своих же клиентов. Особенно на Cursor — своего крупнейшего покупателя API. В июне 2025-го Anthropic внезапно ввёл «Priority Service Tiers» — систему, где за стабильный доступ к модели надо платить вперёд и в разы дороже. Особенно больно это ударило по стартапам вроде Cursor, чьи расходы на AWS за месяц удвоились — с $6.2 млн до $12.6 млн. Совпадение? Не думаем. 

Ирония в том, что в тот же момент Anthropic запустил...

Читать далее

Вот почему Claude Skills намного лучше MCP

Время на прочтение2 мин
Охват и читатели9.8K

Пока все обсуждали Model Context Protocol (MCP) как “будущее интеграции ИИ”, Anthropic тихо выкатили Claude Skills, и это нововведение может оказаться гораздо мощнее. Теперь у Claude есть Skills — по сути, это “папки с навыками”. В каждой — markdown-файл с инструкциями, скриптами и ресурсами, которые Claude может подгружать по мере надобности. Никакого API — просто структура, понятная всем, и при этом чертовски гибкая.

Хочешь, чтобы ИИ делал Excel-таблицы, следовал брендбуку или лепил GIF’ы для Slack? Клади нужный skill в папку — и погнали. Claude сам решит, когда ему пригодится этот навык, без лишнего трепа и с минимальным расходом токенов. Один пример — “slack-gif-creator”: просишь “сделай мне мем о том, как Skills круче MCP”, и Claude реально выдает готовую анимашку (пусть и слегка адовую).

Читать далее

Anthropic выкатила Claude Haiku 4.5

Время на прочтение1 мин
Охват и читатели19K

Anthropic представила Claude Haiku 4.5, и этот малыш делает то, что пять месяцев назад умел топовый на то время Sonnet 4 — но в три раза дешевле и в два раза быстрее...

Читать далее

Информация

В рейтинге
57-й
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик
Ведущий
Python
SQL
Git
ООП
PostgreSQL
Docker
Django