Pull to refresh

Comments 1

2 вопроса из контента статьи:

1. Вы пишите, что MiMo гораздо меньше Qwen3 235B, но в ее документации указано, что она имеет 309B параметров, упакованных в MoE структуру по 15B на одного эксперта. Мы говорим о разных моделях?

2. Gemini 2.5 Flash.

Пока мы писали эту статью и восхищались скоростью Xiaomi (11 секунд), Google выкатил превью Gemini 2.5 Flash"

Мы точно о 2.5 Flash говорим? Я ей уже около полугода пользуюсь, как превьюшками, так и финальной.

Наверное, я что-то упустил или не понял, заранее извиняюсь за душноту, просто интересно стало.

Sign up to leave a comment.

Articles