Shannon 12 ноя 2024 в 05:54

Вышла Qwen2.5-Coder 32B. Открытая локальная модель для кода небольшого размера конкурирующая с GPT-4o

2 мин

34K

Искусственный интеллект

+17

Комментарии 11

janvarev 12 ноя 2024 в 08:44

Глянул - спасибо, сеть выглядит очень неплохо, генерации радуют.

Если кому нужна упомянутая 32B сеть по API для Continue или чего-то еще - можете взять на моем сервисе (ссылка в профиле). Скорость по API около 25 токенов/секунду, вероятно, будет повыше чем на локальной машине - все-таки не у всех есть GPU с большим объемом памяти.

EuLeEr 13 ноя 2024 в 07:00

Посмотрел на сервис- все , кажется , ясным, кроме того , что с сервисом надо работать на VPN ? Или я что-то не так прочитал ?

janvarev 13 ноя 2024 в 07:34

Нет, как раз наоборот - все без VPN.

ndacoder 14 ноя 2024 в 16:01

а на каком железе оно крутится ?

FreeNickname 12 ноя 2024 в 13:40

А кто-нибудь уже сделал плагины хотя бы для того же VS Code, чтобы подцеплять такие модели а-ля Copilot?

alhimik45 12 ноя 2024 в 13:50

В конце поста ссылка на Continue. Как раз именно то. Для VS code он хорош. Единственный недочёт что я встретил: для автокомплита не учитывает ограничение на количество стоп токенов, из-за чего мой LLM провайдер ошибки возвращает, но до выхода Qwen2.5 я именно для tab completions использовал Qwen2 7B запускаемый локально, и проблема меня не трогала, сейчас грустно.

У них также есть плагин для JetBrains IDE. Там проблем с автокомплитом нет. Но лично у меня как-то криво работает. Не смотрит на DPI, из-за чего сильно мельче всего остального интерфейса, нет почему то кнопок акцепта всех изменений, только поблоково принимать, что боль если сетка рефачила файл на 100+ строк.

FreeNickname 12 ноя 2024 в 13:52

А, точно. Криво смотрел, мои извинения. Там же русским по белому)

Спасибо!

alhimik45 13 ноя 2024 в 08:43

Насчёт tab completion в Continue: в последней пререлизной версии, скачанной с гитхаба (в сторе более ранняя) баг с отсутствием ограничения стоп токенов судя по всему был пофикшен.

alhimik45 13 ноя 2024 в 08:48

А вот и та самая "Synthetic data" использовавшаяся для обучения :)

max-daniels 14 ноя 2024 в 05:27

Чето я совсем запутался... Какую версию модели лучше всего скачать для RTX4090 с 24 VRAM? Оперативка 64Гб.

GennPen 14 ноя 2024 в 07:07

В LM Studio найдите эту модель, там будет подсказка какая версия совместима чтобы полностью в видеопамяти помещаться.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий