Pull to refresh

Comments 21

Уважаемый автор. Расскажите пожалуйста какое железо надо чтобы это добро запустить. Просто для информации интересно. Спасибо!

Так я понял, это добро на китайском облаке где-то. Иначе зачем было упоминать российские IP и прочее.

Ага, qwen доступен бесплатно из китайского облака, качество сравнимо с chatgpt и grok-code-fast, периодически сам пользуюсь

иногда думает дольше остальных, и рассуждает на китайском, а так я с вами соглашусь, достойный конкурент западным нейросетям)

А что там с нашенским GigaCode или как его там?

Там на уровне llama 3

Здравствуйте, важен только доступ в интернет (https://chat.qwen.ai/), все вычисления производятся на китайских мощностях. Ограничений по кол-ву использований чат-бота Qwen я не обнаружил.
Почему бесплатно, без ограничений? Мне кажется, что Китай решил во всем конкурировать с Европой, например автомобилестроение, ИИ, роботизация. Им необходимо получить пользователей, поэтому мы можем без ограничений пользоваться их моделями.

Я вот тут писал как запустить QWEN3-VL локально у себя на 48GB VRAM:

https://habr.com/ru/articles/953514/

Сейчас уже вышли модели этой серии 8B и 4B, которые можно запустить даже на 16GB VRAM, а может даже и меньше.

Я использую QWEN3-VL 30B для генерации лэндингов. Весьма доволен.

QWEN3-coder тоже можно запустить у себя.

А вот QWEN3-Max - модель недоступна для загрузки, только через API.

Я смог запустить qwen 2.5 coder 14b 32k окно на rtc 5080, приятель смог запустить 5090 32b 70k. Не хватает инфы по этому поводу в инете. Спасибо за инфу.

Любое железо подойдёт, но чем мощнее тем быстрее будет работать.
Спросите сам Qwen https://chat.qwen.ai/
Что то вроде..

Ты эксперт по ИИ с большим опытом работы с локальными моделями.
Подбери мне какие модели скачивать, если железо такое то.

После скачивания потом можете их юзать в..
для картинок https://Krita.org + расширение
для кода VS Code и подобные ему форки с каким нибудь расширением по типу Kilo Code
для всего остального в отдельном ComfyUI или в том что установлен вместе с Krita расширением

Так же есть удобный менеджер LM-Studio для поиска, скачивания и чатом ии
может служить провайдером для других приложений

Удачи в путешествию по всему этому :)

Да не. Любое не подойдёт. Вы можете и на 285B у себя на ЦПУ запустить при 128гигах оперативы, только ждать инференса вы будете до следующей жизни. Поэтому вопрос и поднимаю. Нужно чтобы хотя бы 100t/s выдавала. Чуть выше привёл то что у меня получалось разумно запустить.

Интересно было бы услышать про другие модели серии Qwen3. Какая для чего лучше подходит?

Здравствуйте, ранее обозревал часть моделей Qwen 2.5 Max, Wan - нейросеть от создателей Qwen, которая специализируется на генерации картинок и видео (https://habr.com/ru/companies/selectel/articles/896200/)
https://habr.com/ru/companies/selectel/articles/878362/ - в этой статье тестировал в том числе Qwen 2.5 на логику, генерацию картинок и написание кода.
Так же в планах рассказать про еще три модели Qwen, так что ждите новостей)

Что-то Qwen3-Coder меня отшил.
Говорит что вообще садовод :)
Перед этим в других чатах (с Qween3-Max) задавал вопросы о растениях. Подглядывает в другие чаты что ли?

Qween3-Max - всё знает, всё ответил.

Я думаю они все подглядывают. В chatgpt ребенку историю про Майнкрафт сочиняли, после картинки генеририл. Через некоторое время для хоррора в новом чате делал наброски. Попросил следующую главу, так он по Майнкрафту стал писать продолжение

В дополнение отмазка GPT из истории диалога:

Ага... кажется есть отгадка. Он не подглядывает в другие чаты напрямую. У него есть "память", в которую он самостоятельно сохраняет свои заметки/впечатления по ходу общения.
Памятью можно управлять (забывать).
Эта "память" общая на все чаты.

Надо создавать новый чат для вопросов из разных тем)
Ну и сейчас ещё они обновили и теперь он запоминает контекст из разных чатов)

Потому стоит придерживаться только своих конкретных увлечений, дабы не было такого казуса

Ммм, в 2025 сравнивать кодинг на единичном промпте не в режиме агента, печально(

Немного дополню информацию по квену: qwen 3 coder доступен бесплатно 2К промптов в день через qwen code, но в целом при наличии GLM 4.6 и обновлённого Kimi k2 по копеечным ценам квен не сильно актуален если нет погони за халявой.

По гпт: там вообще есть gpt5-codex для агентного кодинга через codex, ну или хотя бы через курсор, а не тупо в чатике, но тут кому надо и так всё знают.

Qwen3-max выдает часто непроверенные ответы, после указания на ошибку говорит что "дурак, исправлюсь..."

Я его спросил что значат все эти цифры/буквы в названии моделей qwen3. Сказал что 235b это просто цифры написанные для рекламы. А когда я спросил почему на офф сайте chat.qwen.ai модели не соответствуют заявленным, он сказал что сайт chat.qwen.ai не является официальным и домен продан компанией алибаба, и нужно идти на китайский сайт.

Sign up to leave a comment.

Information

Website
slc.tl
Registered
Founded
Employees
1,001–5,000 employees
Location
Россия
Representative
Александр Шилов