Комментарии 5
Только один нюанс. Обучение LLM и даже дообучение готовой модели требует весьма немаленьких затрат, т.к. всё упирается в дорогие вычислительные мощности и не просто в CPU, а GPU. При чем даже самая мощная видеокарта годится для этого.
Разработка llm с нуля это когда ты не знаешь что такое
Токенизатор (BPE)
Эмбеддинги (Токенов и Позиционные)
Блок Декодера:
Multi-Head Attention
FeedForward-слои
Остаточные связи
Вероятностная генерация
И пилишь это всё с нуля. В заголовке явно ошибка 😁
Не понимаю почему на статью накидали так много минусов(
Отличное начинание, передача знаний. Мне еще и концепция нравится - попробовать руками пройтись по базовым кирпичикам.
Выражаю поддержку автору!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Разработка LLM с нуля