dshelukh 2 фев 2024 в 12:28

Обзор по LLM

10 мин

16K

Блог компании ТензорNatural Language Processing * Искусственный интеллектМашинное обучение *

Обзор

+17

Комментарии 5

QtRoS 3 фев 2024 в 01:31

Ещё Mistral довольно интересно выступила, вполне неплохо себя показывает на русском после дообучения на сайге.

dshelukh 3 фев 2024 в 09:37

Когда мы смотрели на Mistral, он показывал себя довольно слабо на русском языке. А вот интеловский neural, основанный на Mistral, действительно показывает хорошие результаты. Ещё есть mixtral 8x7b - тоже перспективная модель с количеством параметров 46.7B (но для каждого токена используется не более 12.9B параметров). Её мы толком ещё не посмотрели

kramcat 3 фев 2024 в 09:37

А почему только в российских моделях написано про цензуру? Все неиросети так или иначе подвергаются цензуре...

dshelukh 3 фев 2024 в 09:47

Потому что для задач, на которых мы тестировали, только российские модели отказались отвечать на вопросы. Вопросы были связаны с выделением названий организаций, имён и фамилий из текста новости. Вариации запроса проблему решить не помогали. А так да, у многих моделей есть цензура, но во многих реальных задачах эта цензура не помешает получить ответ

vilky 4 фев 2024 в 09:38

Странный обзор, где есть Grok и совершенно никакая YandexGPT, но нет Claude.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий