Pull to refresh

Comments 2

transfer learning между датасетами

scale через увеличение датасетов

механизмы курации

потенциал социального импакта

Предлагаю вам еще немного потренировать вашу языковую модель, а то генерируются несвязные токены из разных языков а каждый абзац не имеет смысловой связи с другими абзацами и тем более с заголовком текста.
AGI конечно вряд ли будет достигнут, но до уровня 11 класса точно дотянете при достаточном времени тренировки на Multi-gpu уроках русского языка.

Если не учитывать язык и структуру, my fault, какие аргументы, что масштабирование потенциально не может вести к более универсальным навыкам?

Sign up to leave a comment.

Articles