Comments / Profile of dkeiz / Habr

Константин@dkeiz

https://github.com/dkeiz

0,9

Rating

В «Яндексе» ответили на заявления Грефа о зависимости компании от китайского ИИ

есть мнение, что железо есть в сингапуре, и немножко железа есть в средней азии.
Привезти ещё 4 раза по столько же задача сложная, стоит 100 млрд так ещё и размещать негде, о чем Греф и говорит. Если бы у яндекса железа было бы не меньше, то их модели давно вышли на уровень хотя бы qwen120b, но чет их нет. Максимум - фотогенерация, а для этой задачи как раз много железа не нужно.
Все таки одно дело - разово на хайпе слить бюджет и попробовать натренировать модель, другое дело каждый год выделять трлн бюджета чтобы бежать третьим эшелоном на бесперспективном рынке.

Маск вот купил железа, но не смог модель обучить, так он сдал свои датацентры атропикам, получил 30млрд с этого, купил курсоров, обучих их модель у себя, а сейчас с их помощью дообучает модель чтобы соревноваться с опусом.
А у нас даже один такой ДЦ построить не смогут, да и сдавать некому.

Moonshot.ai выпустили Kimi K3

dkeiz Jul 16 at 19:18

Первая публичная 3T модель. Серьезная заявка, вот бы локальное железо для такие моделей за адекватные деньги.

Claude Code умеет всё, кроме одного — слушаться вашу программу. Чиним это протоколом ACP

dkeiz Jul 15 at 11:00

хорошо, у меня тогда более глубокий вопрос, на который я сам себе ответить не могу, что лучше реализовывать, A2A с подобным протоколом, что удобно, ведь из коробки, или все это через шину, с алгоритмическим управлением event'ов.
Если у пользователя идет общение с родительским агентом, то все event сообщения от вторичного агента становятся контекст-спамом, на который агент для пользователя будет отвлекаться. Если скипать, то где тогда event'ы брать?
Городить шину поверх A2A? или в AG2 есть хорошие решения?

Claude Code умеет всё, кроме одного — слушаться вашу программу. Чиним это протоколом ACP

dkeiz Jul 15 at 05:57

что я не поняло, так зачем плодить сущности, и делать отдельный ACP и A2G если все равно оно работает через A2A.
Сам все это гоняю, и в отсутствие единого стандарта аля MCP получается какая каша.

GPT-5.6 Sol в режиме Ultra случайно стёрла все файлы пользователя на Mac, а потом сама призналась в ошибке

dkeiz Jul 12 at 18:55

да кто эти минусы считает, просто в подтверждение новые твиты от Тибо,
в кратце: шторм тестирование серверов продолжается, для этого в очередной сбросили лимиты и убрали 5-часовые лимиты.
Перед сбросом попробовал 5.6 sol ultra fast - 100% квоты сгорело за 3 минуты и 120к контекста чтением.
Суммарно насчитал 5 полных сбросов квоты с анонса.
Распробовал 5.6 sol medium - очень хорошо работает.

GPT-5.6 Sol в режиме Ultra случайно стёрла все файлы пользователя на Mac, а потом сама призналась в ошибке

dkeiz Jul 11 at 18:43

у релиза 5.6 Sol есть несколько проблем.
Во первых, модель сильно дрифтует от первоначального промпта пользователя, такое же было и на 5.5. При чем может дрифтануть, а может все сделать слово в слово.
Во вторых openAI по сути запустило стресс-тестирование для своих моделей на живых пользователях, лимиты рестартили уже раза 4, или может 5.
Стресс нагрузка приводит к известной деградации - кучу ошибок на уровне системных сообщений, которые мешают модели работать, а пользователь их даже не видит.
Высокая нагрузка на систему кэшей - ваш кэш сессии может быть вытеснен, модель начнет пересчитывать всю сессию, в лучшем случае у вас уйдет квота на пересчет сессии (и все токены испарятся), в худшем - модель сама придумает себе задание.
В любом случае, моделька классная, умная, пользоваться ей можно только на опус лимиты кончились.

-1

DeepSeek уже год разрабатывает ИИ-чип, чтобы не зависеть от Huawei и Nvidia

dkeiz Jul 7 at 16:15

продайте им эльбрусы, прикрутят ddr5 на 8-канале или hgm прикрутят и будет им ai-inference чип из коробки. Хоть для чего то эльбрусы сгодятся.

GigaChat 3.5 — меньше, быстрее, сильнее

dkeiz Jul 6 at 16:43

MTP особенно полезен на крупной модели. На 432 миллиардах параметров каждый шаг генерации дорогой, а без MTP он даёт только один токен.

Но ведь у вас MoE'шка 432B-A28B , а значит MTP ускорят не 432b генерацию, а 28B генерацию. Казалось бы это понятно, но статья такими фразами вводит в заблуждение.

В целом, как я понял, переезд с deepseek v3-alike архитектуры на qwen-alike архитектуру и обучение на собственных датасетах лучшего качества. Размеры только странные, вроде похоже на qwen397-a17b, но активация сильно выше.
Хотелось бы конечно посмотреть бенчи в сравнении с каким-нибудь qwen27b, но что есть то есть.
Спасибо за статью, спасибо за модель.

Галлюцинации: почему LLM «тупеют» от «умных» промтов

dkeiz Jul 5 at 17:33

она просто старая и с очень малой активацией, это была экспериментальная модель для новой архитектуры.

Упс, они сделали это снова? Почему ваш ИИ тупеет ровно перед выходом новой модели

dkeiz Jul 2 at 21:54

дело не в контексте, дело в аренде новых серверов у маска за 30 млрд

IT-пузырь лопнул: почему одни айтишники не могут найти работу, а других всё равно не хватает

dkeiz Jul 1 at 14:07

не подготовлен, а полностью написан, особенно вот этот оборот Это не противоречие. Это новая реальность

+78

Рунет без Google Login: что теперь делать с авторизацией

dkeiz Jun 30 at 09:33

Не понятно только зачем делать любой сервис в РФ если база пользователей тебе больше не принадлежит, а принадлежит случайным чиновникам. Кроме сервисов со сверхбыстрой ремонетизацией.
Чебурнет без пользователей и без сервисов. Зато отчетов будет нарисовано.

Китайские разработчики получают Claude за 10% от стоимости

dkeiz Jun 26 at 11:28

сдуваются совсем фродовые, другие живут без проблем.

Китайские разработчики получают Claude за 10% от стоимости

dkeiz Jun 26 at 06:39

ещё через пол года они узнают про подписки openai за 50 баксов на год, или даже гемини про по 10 баксов на 18 месяцев. Оперативно работают

Норвегия вводит почти полный запрет на использование ИИ в начальной школе

dkeiz Jun 22 at 04:41

сколько же мракобесия в комментариях

Ну и пригодились тебе твои синусы?

dkeiz Jun 21 at 04:08

так я ж ответил уже "все подряд объясняют через синус"
по итогу у людей очень разное представление о природе синуса и он кажется им чем то сложным

Ну и пригодились тебе твои синусы?

dkeiz Jun 20 at 21:19

синус это на столько примитивная абстракция что непонятно в чем претензия. Проблема в том что этих ротационных движений и проекций в жизни так много, что все подряд объясняют через синус.

Мертвый интернет ожил? DeepSeek подключили к World of Warcraft серверу с 1800 ботами

dkeiz Jun 19 at 18:56

есть две проблемы: умные LLM будут подключаться по облаку, устанете за api платить. Локальные занимают vram - вместе с игрой не поместиться.
Вторая проблема - добиться консистентности, т.е. в каждом запросе к LLM добавить - болтай с игроком, но по итогу выведи разговор на _*task1*_, а потом всю логическую цепочку проверить taskov-goalov. И так проблематично, а теперь ещё сложность LLM добавляется, когда глупая не работает, а умная - дорого.

Ну и реальность - мало кто с этим умеет работать, год назад LLM в бизнес внедрять физически было некому, а тут эксперты по Ai-персонажам в рамках игрового процесса только появляются.
Все будет, просто не за день.

Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic

dkeiz Jun 18 at 22:25

так оно ж уже год решилось простой просьбой фактчекинга. а факты могут и локально в методичке лежать

Местами лучше Claude Fable 5: открытая GLM-5.2 показала сильные результаты в бенчмарках

dkeiz Jun 18 at 22:24

а этот граф ресурсов прям очень нужен? стандартного списка и поиску по списку не хватает? я вот думаю в свою систему запилить к глобальной системе знаний семантический поиск, и то уже пол года думаю зачем?

2 3 ...

10 11