Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!

ну вообще, это очевидно. вот когда доберётесь до физики латентного пространства там будет интересно.
Латентное пространство не новость, согласен, но многим все же неочевидно) Мне было интересно декодить до токена и точка появления эмерджентности. Вывел для себя 7b как нижний порог, на 0,5b и 3b "ручка" не работает.
Плюсом это подготовительный слой для shared cache с ранним контролем для мульти-инстансовой модели, оценить план на этапе концепции (по задумке) должно быть дешевле, чем на этапе токенизации) Ну и еще некоторые штуки хочется к модели прикрутить, но надо проверять сперва.
А под физикой что конкретно имеете в виду?
Они умеют думать. Как я искал (и нашёл) язык, на котором «думает» LLM