Comments 4
Выдумать заголовок и статью чтобы в конце написать это старый добрый kv-cache
Никогда не подумал бы по заголовку, что это окажется самым наглядным объяснением принципов работы LLM из всех, что я встречал. Отлично!
В оригинальной статье можно потыкать по интерактивным графикам, табличкам и схемам, которые тут в виде гифок.
Статья как по мне одна из лучших по работе нейросетей!
Sign up to leave a comment.
Prompt Caching: токены LLM в 10 раз дешевле — но за счёт чего?