Comments 2
transfer learning между датасетами
scale через увеличение датасетов
механизмы курации
потенциал социального импакта
Предлагаю вам еще немного потренировать вашу языковую модель, а то генерируются несвязные токены из разных языков а каждый абзац не имеет смысловой связи с другими абзацами и тем более с заголовком текста.
AGI конечно вряд ли будет достигнут, но до уровня 11 класса точно дотянете при достаточном времени тренировки на Multi-gpu уроках русского языка.
+10
Sign up to leave a comment.
Foundational models: приведет ли масштабирование к AGI