Comments 1
2 вопроса из контента статьи:
1. Вы пишите, что MiMo гораздо меньше Qwen3 235B, но в ее документации указано, что она имеет 309B параметров, упакованных в MoE структуру по 15B на одного эксперта. Мы говорим о разных моделях?
2. Gemini 2.5 Flash.
Пока мы писали эту статью и восхищались скоростью Xiaomi (11 секунд), Google выкатил превью Gemini 2.5 Flash"
Мы точно о 2.5 Flash говорим? Я ей уже около полугода пользуюсь, как превьюшками, так и финальной.
Наверное, я что-то упустил или не понял, заранее извиняюсь за душноту, просто интересно стало.
Sign up to leave a comment.
Xiaomi Mimo V2: Как бесплатная модель от вендора смартфонов обошла Qwen 235B в генерации образовательного контента