Обновить
8K+
5
Даниил Иванов@daniel_ivanov

Пользователь

11
Рейтинг
3
Подписчики
Отправить сообщение

Как за 30 000р дообучить модель, которая работает на уровне GPT-5.4 — на задачах российских учителей

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели11K

В первой статье мы протестировали 30 нейросетей на задачах российских учителей — российские модели оказались последними. На 9 месте стоит наша: дообученная Qwen3.5-27B за 30 000 рублей, работающая локально, на уровне GPT-5.4 на образовательных задачах. Рассказываем, как сделали — включая провал 32B-версии.

Читать далее

Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский

Время на прочтение4 мин
Охват и читатели6.3K

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское образование — это ФГОС, технологические карты уроков, ОГЭ, чувашский язык — и ничего из этого ни один бенчмарк не покрывает.

Мы сделали EduBench-RU — первый бенчмарк для оценки LLM на задачах российского образования в школах. 50 промптов, 22 модели, двойная оценка. И нашли кое-что неожиданное.

Читать далее

Информация

В рейтинге
660-й
Зарегистрирован
Активность

Специализация

Директор по продукту
Ведущий
Английский язык
Управление проектами
Руководство стартапом
Next.js
GraphQL
Golang
Стратегическое управление
Управление людьми
Машинное обучение
Видеостриминг