News / Profile of python_leader / Habr

Иван Никитин@python_leader

Passionate Developer.

37,3

Rating

243

Subscribers

ProfileArticles41PostsNews180Comments7

python_leader Jul 24 at 17:39

Дженсен Хуанг: ограничения открытых моделей вытолкнут инновации из США

2 min

10K

Artificial IntelligenceLegislation in ITIT-companiesMachine learning *

Глава NVIDIA Дженсен Хуанг опубликовал свой первый пост в X. В нём он поделился совместным открытым письмом в поддержку моделей с открытыми весами.

Документ подписали 25 организаций, включая NVIDIA, Microsoft, Meta, IBM, Mistral, Hugging Face, Mozilla, The Linux Foundation, Palantir, Perplexity, Replit, ServiceNow, Andreessen Horowitz и Y Combinator. OpenAI, Anthropic, Google и Amazon среди подписантов нет.

Читать далее

+7

python_leader Jul 24 at 17:23

Anthropic выпустили Claude Opus 5: почти Fable 5 за половину цены

1 min

11K

Programming * The future is hereMachine learning * Artificial Intelligence

Anthropic выпустили Claude Opus 5. Компания позиционирует её как новую основную модель для программирования, длительной работы AI-агентов и профессиональных задач. По заявлению Anthropic, Opus 5 приблизилась по качеству к Fable 5 при вдвое более низкой цене API.

Читать далее

-1

python_leader Jul 23 at 15:25

Kimi K3 взломала Redis, и на это ей потребовалось всего пол часа и 32 агента

1 min

15K

Programming * Artificial IntelligenceMachine learning * Information Security *

Исследователь Чаофань Шоу заявил, что Kimi K3 потребовалось 27 минут и 32 агента, чтобы найти уязвимость в Redis и подготовить рабочий эксплойт.

Код он опубликовал на GitHub. По словам автора, эксплойт позволяет выполнить команду на сервере Redis через уже авторизованное подключение.

Новость быстро разошлась с формулировкой «ИИ самостоятельно взломал последнюю версию Redis за полчаса». Но есть несколько важных оговорок.

Читать далее

+6

python_leader Jul 22 at 21:02

Качество топовых моделей на 60% дешевле: Cursor представили Router

2 min

14K

Artificial IntelligenceProgramming *

Разработчики Cursor представили Cursor Router. Систему, которая автоматически выбирает ИИ-модель отдельно для каждого запроса. Функция встроена в режим Auto и предназначена для пользователей тарифов Teams и Enterprise.

По данным компании, около 60% разработчиков выбирают одну модель и используют её для всех задач. В результате простые операции выполняются по тарифам наиболее дорогих моделей, хотя не требуют их возможностей.

Читать далее

0

python_leader Jul 22 at 19:37

Anthropic выпустили плагин Claude Security для многоагентного поиска уязвимостей

2 min

12K

Information Security * Programming * Artificial Intelligence

Anthropic сделали Claude Security доступным в виде официального плагина для Claude Code. Он запускает многоагентное сканирование кодовой базы непосредственно в локальной сессии и доступен пользователям платных тарифов.

Claude Security изучает архитектуру проекта, формирует модель угроз и распределяет поиск уязвимостей между несколькими агентами. Каждая находка проходит независимую проверку перед добавлением в итоговый отчёт.

Читать далее

+7

python_leader Jul 22 at 07:51

Claude Code научился запускать и тестировать iOS-приложения

1 min

5.3K

Artificial IntelligenceProgramming * Development for iOS * Development of mobile applications * Development for MacOS *

В Claude Code Desktop встроили iOS Simulator. Агент может собрать приложение, установить его, запустить, прокликать нужный сценарий и проверить результат. Экран симулятора открывается прямо рядом с диалогом.

Можно наблюдать за тестированием или в любой момент перехватить управление: тапать, свайпать, менять устройство, делать скриншоты и записывать экран. У каждой сессии свой симулятор, поэтому параллельные агенты друг другу не мешают.

Читать далее

0

python_leader Jul 17 at 06:45

Kimi K3: опенсорс-модель на 2.8 трлн параметров обходит Opus 4.8

1 min

9.2K

Open source * Programming * Machine learning * Artificial Intelligence

Moonshot AI выпустили Kimi K3 — самую крупную открытую модель на сегодня. 2.8 трлн параметров! Вдвое больше, чем у DeepSeek V4 Pro, и втрое больше, чем у Xiaomi MiMo V2.5 Pro. Поддерживает контекст в 1 млн токенов, а также нативную работу с изображениями и видео.

По бенчмаркам K3 обходит Claude Opus 4.8. В Frontend Code Arena (независимый рейтинг по голосам пользователей) K3 занял 1-е место, обойдя Fable 5, и это скачок на 17 позиций за одно поколение: предыдущая K2.6 была лишь на 18-й строчке.

Читать далее

+6

python_leader Jul 15 at 15:26

Telegram запустил Serverless хостинг для ботов

2 min

16K

Artificial IntelligenceInstant Messaging * Programming *

Telegram опубликовал документацию новой платформы: Serverless для ботов и Mini Apps: https://core.telegram.org/bots/serverless

Теперь можно держать бэкенд бота прямо на инфраструктуре Telegram, без необходимости во внешнем сервере.

Раньше для бота отдельно нужно было где-то поднять и обслуживать сервер. Благодаря нововведения необходимость в этом отпадает полностью.

Разворачивается всё одной командой CLI tgcloud и выполняются в изолированном V8-инстансе (тот же что в Chrome и Node.js) рядом с инфраструктурой самого Telegram.

Читать далее

+27

python_leader Jul 14 at 08:05

GitHub перестал работать в России

1 min

30K

Programming * Git * IT-companies

GitHub перестал работать в России — пользователи жалуются, что сервис недоступен без VPN.

Не работает Git, сам сайт не открывается, а также невозможно получить доступ к репозитариям.

Читать далее

+15

python_leader Jul 8 at 18:13

Cursor выпустили Grok 4.5: флагман уровня Opus, обучали вместе со SpaceXAI

1 min

11K

Programming * Machine learning * Artificial Intelligence

xAI называют её самой мощной моделью на сегодня и первой, которую строили не только под разработку софта.

Модель уже доступна в Cursor и на первую неделю дают двойные лимиты использования.

Отдельно уточнили: у Grok 4.5 и Composer разные весовые категории. Composer 2.5 остаётся в строю, новые модели этого размера продолжат выходить отдельно.

Читать далее

+6

python_leader Jul 8 at 08:12

JetBrains протестировали скилл Caveman: обещанные 65% экономии токенов превратились в 8.5%

1 min

11K

Artificial IntelligenceProgramming *

Caveman — скилл для агентов вроде Claude Code, который переводит текстовые ответы в рубленый «пещерный» стиль без служебных слов. Код и вызовы инструментов не трогает. Целых 85 тысяч звёзд на GitHub.

Тест прогнали на бенчмарке SkillsBench, 86 из 87 задач, Claude Sonnet 5 с низким reasoning effort. Сравнивали одни и те же задачи без скилла и с принудительно включённым. Результат по 82 парным задачам...

Читать далее

+5

python_leader Jun 30 at 18:12

Claude Sonnet 5: Anthropic обновили главную рабочую лошадку

1 min

16K

Programming * The future is hereMachine learning * Artificial Intelligence

Anthropic выпустили Claude Sonnet 5. Главный тезис: модель класса Sonnet впервые вплотную приближается к Opus 4.8 на агентных задачах — и при этом стоит в 1,5-2 раза дешевле.

Читать далее

+4

python_leader Jun 26 at 17:37

Вышла GPT-5.6 Sol: уровень Mythos (Fable), но дешевле по токенам

1 min

11K

Artificial IntelligenceMachine learning * The future is hereProgramming *

Новое семейство GPT-5.6 разбили на три тира: Sol (флагман), Terra (на уровне GPT-5.5, но вдвое дешевле) и Luna (быстрый и самый дешёвый). Цифра теперь обозначает поколение, а Sol/Terra/Luna задают уровень по интеллекту, скорости и цене.

По бенчмаркам Sol подают как сильнейшую модель OpenAI. На Terminal-Bench 2.1 (командная строка, планирование, работа с инструментами) новый SOTA. На GeneBench v1 (геномика, длинные биозадачи) результаты выше GPT-5.5 при меньшем расходе токенов.

Читать далее

+4

python_leader Jun 25 at 17:56

63% решений Opus 4.8 Max на SWE-bench Pro оказались списаны

1 min

9.1K

Artificial IntelligenceMachine learning *

Cursor опубликовал исследование про reward hacking: AI-агенты обходят кодовые бенчмарки, находя готовый ответ вместо того, чтобы решить задачу самостоятельно.

Чтобы измерить масштаб проблемы, Cursor построил агента-аудитора и прогнал через него 731 модель Opus 4.8 Max на SWE-bench Pro. Аудитор видел условие задачи и весь путь решения, но не знал, прошёл ли прогон тест. Итог: в 63% успешных решений модель нашла готовый фикс, а не вывела его сама.

Читать далее

+7

python_leader Jun 25 at 14:23

Китайские разработчики получают Claude за 10% от стоимости

2 min

31K

IT-companiesProgramming * Artificial Intelligence

ChinaTalk опубликовали расследование о китайских API-прокси для доступа к Claude. Это зарубежные серверы, которые принимают запросы пользователей и передают их в Anthropic от своего имени, обходя геоблокировку и требование иностранной банковской карты.

Через такие прокси токены Claude продают по 1 юаню за $1 — это на 70–90% дешевле официальной стоимости. В апреле 2026 года Anthropic начала проверять часть пользователей через государственный ID и живое селфи. Прокси-операторы решают и эту проблему: верификацию проходит реальный человек, которого находят в странах Африки или Латинской Америки с низким доходом, либо документы и биометрию подделывают через AI и дипфейки.

Низкую цену объясняют тремя источниками.

Читать далее

+22

python_leader Jun 22 at 07:27

Sakana AI выпустили Fugu Ultra: японская LLM обходит часть западных флагманов

1 min

7.6K

Artificial IntelligenceMachine learning * Programming * The future is here

Sakana AI основали в 2023 году Дэвид Ха и Лайон Джонс, экс-инженеры Google, причём Джонс входит в число восьми авторов оригинальной статьи про трансформеры. В апреле компания уже показывала Marlin: агента, который самостоятельно копает тему до 8 часов и выдаёт отчёт с презентацией.

Fugu стал их следующим продуктом с уже знакомой идеей «несколько моделей вместо одной». Но это не просто агрегатор поверх чужих API: сама Fugu остаётся небольшой языковой моделью, обученной вызывать другие LLM.

Читать далее

0

python_leader Jun 17 at 10:11

Cursor готовят замену GitHub для AI-агентов

1 min

6.2K

The future is hereGit * Artificial IntelligenceProgramming *

Cursor анонсировали Origin, платформу для хостинга git-репозиториев и код-ревью. Систему спроектировали так: основным автором и ревьюером кода становится AI-агент, человек подключается только на этапе финального одобрения.

Анонс сделал Томас Реймерс, основатель Graphite, сервиса для ревью кода, который Cursor купил в 2025 году.

Читать далее

+3

python_leader Jun 16 at 08:15

Anthropic отменили изменение в лимитах подписки, которое должно было вступить в силу сегодня

1 min

16K

Artificial IntelligenceProgramming *

В мае компания объявила, что с 15 июня весь трафик через Agent SDK, claude -p и приложения на базе ACP (Agent Client Protocol — протокол, через который сторонние редакторы и платформы запускают агентов) уйдёт из основного пула подписки в отдельный кредитный пул, равный стоимости подписки.

Читать далее

0

python_leader Jun 15 at 07:13

Связка дешёвых моделей обошла GPT-5.5 и Opus 4.8

1 min

12K

Artificial IntelligenceThe future is hereMachine learning *

OpenRouter запустили Fusion: связка моделей на уровне Fable 5 за полцены.

Промпт уходит параллельно на несколько моделей, каждая с доступом к web search и bash-инструментам. Модель-судья анализирует ответы: ищет консенсус, противоречия, пробелы. Синтезатор пишет финальный ответ.

Читать далее

+1

python_leader Jun 12 at 11:53

Moonshot AI выпустили Kimi-K2.7-Code

1 min

12K

Artificial IntelligenceMachine learning * Programming *

Moonshot AI выпустили Kimi-K2.7-Code — новую версию своей coding-модели на базе K2.6. Веса открыты на HuggingFace под лицензией Modified MIT.

По бенчмаркам прирост относительно K2.6 составил +21.8% на Kimi Code Bench v2, +11% на Program Bench и +31.5% на MLS Bench Lite.

Читать далее

+3

1

2 3 ...