Обновить

Профессия ML-инженер: как кошка съела акулу и почему ИИ должен дружить с БД

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели10K
Всего голосов 9: ↑8 и ↓1+8
Комментарии2

Комментарии 2

мощь языковых моделей с СУБД, чтобы извлекать из данных реальную пользу

Проблема LLM в том, что нейросеть иногда не обладает фундаментальными знаниями(не знаю почему, наверное экономили на обучении) и поэтому может дать неверный ответ .

Например одна известная нейросеть не знает чем отличается положительная корреляция от отрицательной. Поэтому спрашивать у этой нейросети информацию о корреляционном анализе ожиданий СУБД , например, в общем то - бесполезно.

Понятно, что использовать в работе , советы такой нейросети нельзя.

Всё зависит от выбранной модели, её размера, квантизации, обвязки и параметров семплирования. Настолько фундаментальными знаниями обладают даже небольшие модели, например, из той же линейки Qwen3 от Alibaba. Про ChatGPT и DeepSeek думаю говорить не стоит, они крайне умны и обладают широким спектром фундаментальных знаний во всех областях.

Спросил у нашей модели про корреляцию, попросил посчитать на реальной базе - результат ожидаемо хороший.

Наша платформа реализует ReAct-агента на базе Qwen3-Next-80B-A3B с 4-bit AWQ квантизацией. Это хоть и большая, но не гигантская модель по современным меркам, особенно учитывая используемую квантизацию.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.postgrespro.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия
Представитель
Иван Панченко