Articles / Profile of EZlogic / Habr

Александр @EZlogic

User

ProfileArticles4PostsNewsComments3

EZlogic Oct 8 at 06:00

Тестирование качества работы RAG. Описание и сравнение метрик

Easy

17 min

365

Artificial Intelligence

Review

В современном мире часто встречаются задачи с большим объемом данных, выполнение которых либо невозможно, либо сложно или затратно по времени/ресурсам автоматизировать обычными функциями и методами.

Одним из способов решения для таких случаев является применение AI с использованием RAG.

В этой статье мы постарались привести метрики для оценки качества работы подобных решений.

EZlogic Aug 11 at 05:00

Как мы искали лучшие AI-модели (Часть 3)

Easy

54 min

Artificial Intelligence

В предыдущих статьях мы описали начало нашего пути тестирования AI моделей на предмет определения лучших и описали основные метрики, с помощью которых можно проводить такой анализ.

В этом тексте приведен список найденных метрик для более детального и глубокого рассмотрения качества работы AI, а также результаты тестирования моделей по выбранным ранее метрикам.

Составляя этот материал, мы хотели поделиться своим опытом использования различных метрик для оценки ответов AI моделей. Для тех из них, которые мы не смогли полноценно использовать в ходе своих исследований, мы подготовили описание с практическими примерами.

EZlogic Jul 30 at 05:30

Как мы искали лучшие AI-модели (Часть 2)

Easy

12 min

1.6K

Artificial Intelligence

В прошлой статье мы погрузились в оценку самых популярных AI продуктов.

По итогам ручного тестирования и попытки автоматизации по выбранным критериям был сделан вполне себе ожидаемый вывод о невозможности применения одних и тех же метрик к оценке задач разного рода.

Поэтому было принято решение ознакомиться с основными метриками для оценки качества ответов AI продуктов.

Такими метриками стали: Precision, Recall, Specificity и Confusion matrix, а также MAP и MRR.

Для чего такие метрики нужны?

EZlogic Jul 23 at 13:15

Как мы искали лучшие AI-модели (часть 1)

Easy

17 min

3.5K

Artificial Intelligence

From sandbox

AI используется всё чаще. Кому‑то это упрощает ежедневную рутину, кому‑то заменяет психолога, кому‑то помогает приобретать новые знания. Есть и те, кто хочет существенно усовершенствовать процессы в уже работающем бизнесе или создает на основе AI свои продукты (наш вариант — последний).

В начале этого года нам понадобилось провести тестирование AI‑моделей на предмет имеющегося функционала и возможностей AI‑моделей для оценки перспективности использования в тех или иных продуктах.

Данная серия статей про результаты такого тестирования — от простого до самого продвинутого.

Тестирование качества работы RAG. Описание и сравнение метрик

Как мы искали лучшие AI-модели (Часть 3)

Как мы искали лучшие AI-модели (Часть 2)

Как мы искали лучшие AI-модели (часть 1)

Information

Specialization