Комментарии 2
мощь языковых моделей с СУБД, чтобы извлекать из данных реальную пользу
Проблема LLM в том, что нейросеть иногда не обладает фундаментальными знаниями(не знаю почему, наверное экономили на обучении) и поэтому может дать неверный ответ .
Например одна известная нейросеть не знает чем отличается положительная корреляция от отрицательной. Поэтому спрашивать у этой нейросети информацию о корреляционном анализе ожиданий СУБД , например, в общем то - бесполезно.
Понятно, что использовать в работе , советы такой нейросети нельзя.
Всё зависит от выбранной модели, её размера, квантизации, обвязки и параметров семплирования. Настолько фундаментальными знаниями обладают даже небольшие модели, например, из той же линейки Qwen3 от Alibaba. Про ChatGPT и DeepSeek думаю говорить не стоит, они крайне умны и обладают широким спектром фундаментальных знаний во всех областях.
Спросил у нашей модели про корреляцию, попросил посчитать на реальной базе - результат ожидаемо хороший.

Наша платформа реализует ReAct-агента на базе Qwen3-Next-80B-A3B с 4-bit AWQ квантизацией. Это хоть и большая, но не гигантская модель по современным меркам, особенно учитывая используемую квантизацию.
Информация
- Дата регистрации
- Дата основания
- Численность
- 501–1 000 человек
- Местоположение
- Россия
- Представитель
- Иван Панченко
Профессия ML-инженер: как кошка съела акулу и почему ИИ должен дружить с БД