Pull to refresh

Новая LLM для русского языка - краткий обзор.

Основные показатели при обучении
Основные показатели при обучении

Завершено обучение первой языковой модели для русского языка с 1.6 млрд. параметров на TPU v4-128.

  • 4096 контекстное окно

  • Llama в качестве основной архитектуры

  • 128k vocab

  • 32B токенов в датасете

aeonium/Aeonium-v1-BaseWeb-1B

Tags:
Total votes 3: ↑3 and ↓0+4
Comments4

Articles