В чате вполне могут использоваться и методы сжатия контекста (поиск/переупаковка участков) и кэш, но вот по api только кэш, оптимизация контекста - забота разработчика
Именно квадратичной сложности от размера контекста не осталось после flash attention. Взялась она из матрицы попарного внимания между токенами, с нюансами вроде: внимание считается для всего что левее конкретного токена
Нижняя граница зависит от потребностей в первую очередь. примерно 1.3 от размера необходимых весов + немного на контекстное окно. На 3060 6 Гб запускал квантованные веса для автокомплита кода, работает достаточно шустро
Насчёт данных 21 года - думаю это просто актуальность fact storage, валидация свежих фактов может влететь в копеечку. Дообучение дешевле выйдет, вполне могли придумать способ конвертации 4х смежных окон по 4k токенов в одно на 16k
По второму пункту. Озвученной ЦА сервиса, место публикации не очень соответствует
По третьему. Все в открытом доступе. Какой смысл заявлять об отсутствии в свободном доступе если опровергается за 5 секунд? Huggingface и civit.ai - качай сколько влезет..
В разрешении 1024*1024 генерировать особого смысла нет, гораздо удобнее батчем 4*512*512 а потом апскейлить то что понравилось. Гит там не необходим (но иногда может помочь). Есть возможность задать количество шагов или семплер? Задать вес конкретному токену в промте?
От 12 gb vram? Прекрасно работает на 6-и, на 4-х запускают без особых проблем.
В чате вполне могут использоваться и методы сжатия контекста (поиск/переупаковка участков) и кэш, но вот по api только кэш, оптимизация контекста - забота разработчика
Именно квадратичной сложности от размера контекста не осталось после flash attention. Взялась она из матрицы попарного внимания между токенами, с нюансами вроде: внимание считается для всего что левее конкретного токена
Да, надо было писать на visual basic и делать xbox эксклюзивом
Добрый день. Ограничение max len в 8к, это для а100 подобрано?
Есть в планах тюн для qwen2.5 b14?
Сравнивали свой тюн с RuadaptQwen1.5b ?
Тут суверенными будут даже попугаи, удобно
А вычислить максимум из максимумов по батчам не считается?
Да уж лучше сюда гранты, чем самизнаетекуда
Нижняя граница зависит от потребностей в первую очередь. примерно 1.3 от размера необходимых весов + немного на контекстное окно. На 3060 6 Гб запускал квантованные веса для автокомплита кода, работает достаточно шустро
Тогда уж две части: одна душеприказчику, другая жене. Ваши четверо посторонних могут и без жены консенсус организовать
Вся эта конструкция на убунте заведется вообще?
Насчёт данных 21 года - думаю это просто актуальность fact storage, валидация свежих фактов может влететь в копеечку. Дообучение дешевле выйдет, вполне могли придумать способ конвертации 4х смежных окон по 4k токенов в одно на 16k
По второму пункту. Озвученной ЦА сервиса, место публикации не очень соответствует
По третьему. Все в открытом доступе. Какой смысл заявлять об отсутствии в свободном доступе если опровергается за 5 секунд? Huggingface и civit.ai - качай сколько влезет..
В разрешении 1024*1024 генерировать особого смысла нет, гораздо удобнее батчем 4*512*512 а потом апскейлить то что понравилось. Гит там не необходим (но иногда может помочь). Есть возможность задать количество шагов или семплер? Задать вес конкретному токену в промте?
От 12 gb vram? Прекрасно работает на 6-и, на 4-х запускают без особых проблем.
У деревьев нет весов. Да, все поняли о чем речь, но это не веса.
Какое доброе отделение банка Вам досталось. В четверг заходил в два офиса - для открытия счета требовался депозит в 5к usd. Анталия, ВНЖ нет.
Перед каждым пыхом включать звук, например, заряжающейся вспышки. Или просто, соседней сетью детектировать людей в зоне поражения.
Можно вытащить и визуализировать веса, но да, чем глубже тем сложнее интерпретировать даже визуализацию.
А сети со входом 64х64 тогда проверяют
проверками )
Излишне упрощено кмк.
Ps Странный гибрид семисегментника и растра с выпадающими пикселями.
Насчёт [512, 256, 256] вопрос, третья размерность это 256 шагов поворота на полный круг?