daniilshat 20 сен 2024 в 03:13Alibaba Group обновила семейство языковых моделей Qwen 2.5Время на прочтение1 минКоличество просмотров3.8KМашинное обучение*Искусственный интеллектВсего голосов 3: ↑3 и ↓0+4Добавить в закладки7Комментарии3
orekh 20 сен 2024 в 05:52может обрабатывать контекст до 128 токеновДумаю, что всё-таки побольше должна, но в ссылке на источник не нашёл этой цифры.
Kristaller486 20 сен 2024 в 08:50Показать предыдущий комментарий128 000 токенов через YARN, но родной контекст 32 000.
chebbit 20 сен 2024 в 09:01Показать предыдущий комментарийContext length support up to 128K tokens and can generate up to 8K tokens.
Alibaba Group обновила семейство языковых моделей Qwen 2.5