Как стать автором
Обновить

Nvidia представила LLM Llama-3.1-Nemotron-70B. Качественный файнтюн Llama 3.1 для рассуждений

Время на прочтение1 мин
Количество просмотров4.5K
данные актуальны на 01 октября 2024
данные актуальны на 01 октября 2024

Файнтюн выполнен по методу RLHF (в частности REINFORCE) и показывает хороший результат для задач рассуждений и логики.

Новая модель занимает высокое место в метрике Arena Hard, включающая в себя 500 сложных запросов от пользователей, в основном это задачи логики, загадок, рассуждений и математики. В этих задачах эта модель показывает себя лучше чем Llama-3.1 размером 405B или версии gpt-4o от 13 мая.

При этом модель не обучалась для написания кода, поэтому тут модель показывает себя на 3.7% хуже, чем просто Llama-3.1-70B.

Бенчмарк Aider’s code editing benchmark

Размер контекста такой же как и у Llama 3.1 и составляет 128k токенов.

Карточка модели: https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

gguf файлы: https://huggingface.co/bartowski/Llama-3.1-Nemotron-70B-Instruct-HF-GGUF

Демо онлайн:

Как запускать модели локально на обычном ПК (без видеокарты просто на CPU, на видеокартах включая 8Гб памяти, и на AMD видеокартах).

Теги:
Хабы:
Всего голосов 6: ↑6 и ↓0+10
Комментарии5

Другие новости

Ближайшие события