slivka_8329 сен в 12:07Разработка LLM с нуля. Новые моделиВремя на прочтение1 минОхват и читатели8.2KЯ пиарюсьОбзорВсего голосов 1: ↑1 и ↓0+2Добавить в закладки54Комментарии4
ahdenchik29 сен в 20:37Комментарий был измененДля разработки будем использовать только Python и низкоуровневый PyTorchНасколько низкоуровневый?(Тоже подумываю сделать нейросеть. Но не на питоне)
Dimoyok30 сен в 06:51Комментарий был измененПоказать предыдущий комментарийnn.Linear как раз является высокоуровневой обёрткой над torch.nn.functional.linear. Боюсь спросить, а что выше, чем nn.Linear?) TransormerEncoderLayer?
slivka_8330 сен в 07:01Показать предыдущий комментарийда, готовые блоки типа nn.Transformer не используем.
Разработка LLM с нуля. Новые модели