Юзаю openclaw и lm studio, особых проблем в настройке не было. Qwen3.5-9b хорошая модель, но в openclaw она все же туповата. Забывает вызывать инструменты на долгих связках в задачах. Рекомендую перепроверять за ней после успешного отчета по выполнению:) А вот Qwen 3.5 35B A3B уже вполне себе юзабельна, прям чувствуется уровень. И если такую связку .юзать с внешним claude cli (gemini, qwen) через acpx, то вполне себе локальный личный ассистент с передачей только сложных задач внешнему агенту
50-70 токенов не получится ни как на видеокартах с 12-16гб памяти на вышеупомянутых моделях. На моей 5070ti 12gb новая gemma даёт 15 токенов в секунду на amd r9 9950
Кому ни будь ещё это интересно? Api шмапи. Уже все прогрессивное сообщество переходит к автоматизации ПК/браузера, а не вот это все. Вот есть озон магазин с небольшим ассортиментом. Надо автоматизировать проверку новых заказов и отправкой штрих кодов по новым заказам в ТГ например, плюс работа с отзывами и все это без api, т.к озон жадные и хотят за полнофункциональный api 25тыс в месяц. Тоже самое Авито. Api сейчас доступны вроде в бесплатном тарифе, но для работы нужен домен, внешний адрес и прочая лабуда. Чатгпт за api тоже платить надо. Но все можно сделать через автоматизацию браузера с использованием тарифов pro на gpt или gemini
В openclaw пользуете? У меня про, но хватает очень не надолго. 6 агентов, подключен gemini, codex, qwen ,cloud вся эта банда высасывает лимиты за пару часов активной работы. Думаю переходить на gemini ultra, но говорят и Гугл банит за cli
Есть claude подписка, есть и gemini. Все юзаю в cli. Обычно над проектом работают оба, один идей накидывает по задаче, второй одобряет, отклоняет/ дополняет. Но что заметил, так claude все усложняет. Простую вещь надо усложнить и в итоге сломать. Потом с родненьким gemini починяем за ним:) Делаю личный RAG
Qwen топовые модели для локального запуска. На постоянке для личного бота ассистента использую qwen3 8B. Влезает и 14b с квантованием, но тут как говорится умнее не всегда нужно. И вот в этих весах лучше чем qwen для общих задач и с хорошим русским моделей тупо нет, или я не встретил.
Юзаю openclaw и lm studio, особых проблем в настройке не было. Qwen3.5-9b хорошая модель, но в openclaw она все же туповата. Забывает вызывать инструменты на долгих связках в задачах. Рекомендую перепроверять за ней после успешного отчета по выполнению:) А вот Qwen 3.5 35B A3B уже вполне себе юзабельна, прям чувствуется уровень. И если такую связку .юзать с внешним claude cli (gemini, qwen) через acpx, то вполне себе локальный личный ассистент с передачей только сложных задач внешнему агенту
попробовал Qwen 3.5 35B A3B дает на моей связке 35токен, что в целом вполне юзабельно, а вот gemma кратно хуже по скорости
50-70 токенов не получится ни как на видеокартах с 12-16гб памяти на вышеупомянутых моделях. На моей 5070ti 12gb новая gemma даёт 15 токенов в секунду на amd r9 9950
Покупают за 1 условный бакс эти ключи обычно юзеры для домашних ПК, что бы тупо не заморачиваться с "бесплатными активаторами"
Кому ни будь ещё это интересно? Api шмапи. Уже все прогрессивное сообщество переходит к автоматизации ПК/браузера, а не вот это все. Вот есть озон магазин с небольшим ассортиментом. Надо автоматизировать проверку новых заказов и отправкой штрих кодов по новым заказам в ТГ например, плюс работа с отзывами и все это без api, т.к озон жадные и хотят за полнофункциональный api 25тыс в месяц. Тоже самое Авито. Api сейчас доступны вроде в бесплатном тарифе, но для работы нужен домен, внешний адрес и прочая лабуда. Чатгпт за api тоже платить надо. Но все можно сделать через автоматизацию браузера с использованием тарифов pro на gpt или gemini
В openclaw пользуете? У меня про, но хватает очень не надолго. 6 агентов, подключен gemini, codex, qwen ,cloud вся эта банда высасывает лимиты за пару часов активной работы. Думаю переходить на gemini ultra, но говорят и Гугл банит за cli
Есть claude подписка, есть и gemini. Все юзаю в cli. Обычно над проектом работают оба, один идей накидывает по задаче, второй одобряет, отклоняет/ дополняет. Но что заметил, так claude все усложняет. Простую вещь надо усложнить и в итоге сломать. Потом с родненьким gemini починяем за ним:) Делаю личный RAG
Qwen топовые модели для локального запуска. На постоянке для личного бота ассистента использую qwen3 8B. Влезает и 14b с квантованием, но тут как говорится умнее не всегда нужно. И вот в этих весах лучше чем qwen для общих задач и с хорошим русским моделей тупо нет, или я не встретил.