Search
Write a publication
Pull to refresh

Comments 14

Работа с урезанной версией LLM полна страданий. Модель понимает только очень простые вещи. Если плохо понимает на русском языке - необходимо переходить на английский.

Попробуйте gemma3.

gemma3 не заявлена как поддерживающая вызовы инструмента, по крайней мере у ollama.

Попробовал gemma3 в Ollama, не работает генерация эмбеддингов (OllamaEmbeddingGenerator), т.е. как минимум RAG не сделать. Возможно позже у Ollama появится поддержка для этой модели.

Подскажите, что мешает использовать для эмбеддингов отдельную модель? Qwen 3 Embeddings 0.5B, например, великолепные эмбеддинги.
И ещё можете для чата попробовать новую Gemma 3n

Ничто не мешает. Добавил уточнение в тексте, дополнил код. Спасибо.

А разве для эмбеддингов не нужна специальная модель?

Наконец-то что-то полезное на тему моделей, а не очередная статья "ИИ оставит вас без работы". Большое спасибо.

Мда, и это питон-то тяжелый. Столько трудов и не получилось ничего. На питоне + llm + whisper подобная штука пишется дня за 3 с перекурами. Но использование мелких моделей это однозначно минус (нужна видеокарта), но опять же совсем простые команды в том же питоне можно заскриптовать прям в коде, без всяких LLM.

Тяжела и неказиста нейрожизнь без питониста =)

Заметил, что qwen3 плохо работает с функциями в ollama. Но если подключиться через OpenAI API к Ollama, то все хорошо (http://127.0.0.1:11434/v1).

Сравнил. На 30B и 32B версиях разницы не заметил.

Значит мне так "везло" - qwen в мыслях делал вызовы, а в результате "смотри, все готово". А по факту - он только думал о том, что и как вызывать...
Использовал Qwen3-30B-A3B:Q4_K_M.

А че, так можно было что ли?

Это я так себя чувствовал, когда открыл статью. Последнюю неделю мучаю свою видеокарту в попытках выдать интересные диалоги через sillytavern + oogabooga, но получается слишком медленно для голосового помощника и слишком нестабильно. Хотелось добавить индивидуальности, которая есть у той же Алисы.

Спасибо автору за много примеров в статье. Вдохновляют написать что-то свое, а не пытаться собрать Франкенштейна из опенсорсных решений.

Ну все работает, жаль словари маленькие пока! Имена не понимает, например - Вика кто? ответ должен быть сестра, а он не распознает Имя

Sign up to leave a comment.

Articles