tripolskypetr Mar 21 2025 at 16:56

Cohere Command — революция, которую мы пропустили

Easy

3 min

26K

TypeScript * JavaScript * Python * Artificial IntelligenceMachine learning *

Tutorial

+14

Comments 14

sergeym69 Mar 21 2025 at 22:31

Qwen2.5-7B и Llama-3.1-8B с простыми функциями хорошо работают, если же надо более сложные вещи, типа сгенерить SQL запрос без ошибок и вызвать функцию, то нужно уже что-то типа Qwen2.5-14B

Это для квантизизованных Q4 моделей

tripolskypetr Mar 22 2025 at 12:42

Эти модели плохо работают для русского языка. Подробнее в статье

https://habr.com/ru/articles/892468/

sergeym69 Mar 25 2025 at 22:36

Вы слишком многого хотите от 8b моделей да еще и квантизованных. Ollama по умолчанию грузит квантизованные q4 модели - а они более тупые чем полная 8B модель и дает больше ошибок . Та же Qwen2.5-14B довольно хорошо отвечает на русском и понимает вопросы даже квантизованная, а модель на 32B будет еще лучше работать.

c0ntr0ller Mar 22 2025 at 15:19

Извините, а ошибки прямо в первом абзаце - это демонстрация того, что статья написана человеком?

tripolskypetr Mar 22 2025 at 15:29

Это бейт на коммент, говорят, для алгоритмов хорошо

Jeisooo Mar 24 2025 at 06:29

За такое обычно подсвечниками бьют:)

tripolskypetr Mar 24 2025 at 08:53

Мышка не сможет прийти и нагадить, если её не пригласил алгоритм...

Idakopas Mar 22 2025 at 17:36

Мне еще в десятых годах пришло письмо "от гугловского рекрутера", в тексте тоже была ошибка - сразу подумалось, что ее поставили, чтоб заставить автоспам выглядеть "написанным от руки".