Обновить
4
Дмитрий@dshelukh

Инженер-программист

Отправить сообщение

Потому что для задач, на которых мы тестировали, только российские модели отказались отвечать на вопросы. Вопросы были связаны с выделением названий организаций, имён и фамилий из текста новости. Вариации запроса проблему решить не помогали. А так да, у многих моделей есть цензура, но во многих реальных задачах эта цензура не помешает получить ответ

Когда мы смотрели на Mistral, он показывал себя довольно слабо на русском языке. А вот интеловский neural, основанный на Mistral, действительно показывает хорошие результаты. Ещё есть mixtral 8x7b - тоже перспективная модель с количеством параметров 46.7B (но для каждого токена используется не более 12.9B параметров). Её мы толком ещё не посмотрели

Информация

В рейтинге
Не участвует
Откуда
Нижний Новгород, Нижегородская обл., Россия
Дата рождения
Зарегистрирован
Активность