Все потоки

alexwortega7 авг 2021 в 10:04

Краткий пересказ Towards Pretrained Transformers As universal Computation Engines

4 мин

1.8K

Natural Language Processing *

Recovery Mode

+2

Комментарии 3

Kilorad 9 авг 2021 в 11:42

Мощно. Интересно, сколько времени такая модель исполняется и сколько памяти требует... Наверное, столько, сколько GPT-3

alexwortega 10 авг 2021 в 18:17

Таким способом можно затюнить любой трансформер

ohld 2 ноя 2022 в 17:56

Однозначно лайк за годный контент, жду продолжения

Зарегистрируйтесь на Хабре, чтобы оставить комментарий