Обновить
-15

Пользователь

0,1
Рейтинг
Отправить сообщение

Пока эти гуру спорят скромные неизвестные инженеры делают CSS

А где можно посмотреть скорость локальных ллм? Мне для rag надо чтото быстрое

Под линукс нет)

Лучше для скайрима локации генерил с квестами а то запарился ждать

Даже pandadoc не умеет нормально конвертировать ворд в md. Так что я использую libreoffice как конвертор через ком строку в обычный текст

Зачем ссылка на демку которая не работает? А если работала то сделайте картинку с результатом работы и покажите. Или текстом. А то выглядит как обман

Какая сейчас самая быстрая локальная модель для RAG?

С 5% ни за что заработала миллиард . Поздравляем что теперь ее распиарят феминистки

Это где тестил?

Я делаю систему и прочитав статью обнаружил что она соответствует принципам ДДД. Забавно. Выходит я неплохой разраб. Поэтому предположу что можно еще привнести в ддд (тк сам это использую):

  • Маршрутизатор/роутер для событий - удобно расширять функционал и не надо знать вообще куда посылать событие и кто его обработает

  • Команды вместо событий. Событие это постфактум сообщение о произошедшем типа «я прочитал письмо» а команда это «прочитай письмо» - их можно использовать если есть строгая известная иерархия исполнения (как в процессоре)

  • Хорошо написанные команды составляют «язык системы» и его можно записать в файл как программу или отправить на исполнение в копию системы

  • Адресация данных: желательно адресовать их не только через ИД но и через путь

  • И тд

Удачи!

Ну так что в результате получилось? Есть примеры вопрос-ответ?

Хорошо когда документ помещается в контекст. А я столкнулся с потерей связности в чанках на больших документах и пока не нашел нормального решения

посмотрите что такое дигай

Это забавно что автор не догадался попросить ИИ придумать сложные задачи

Мила делала, а Миша помогал. Лол.

Зачем использовать qwen с 32кб контекстом если есть модели побыстрее и на 128кб?

Всего одна модель перерабатывала всю эту кучу документов?

Все эти чанки из какой бд и какой эмбеддер?

Обычно в доках пишут в конце на основе каких НД и РД а сверху пишут какой отдел и тд - этой информации должно хватать для понимания на основании чего проверять)

Эмбеддер лучше сделайте свой или категоризацию предварительную

Это не программисты а менеджеры всякие

Это наверное сотый бесполезный текст про RAG где так и не написано как лечить его болячки. Предлагаю внедрить на хабр ИИ который будет оценивать подобные тексты

Если бы все в контекст помещалось то и раг не нужен )))

Информация

В рейтинге
5 065-й
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, Архитектор программного обеспечения
Средний
От 70 000 ₽
Golang
Обработка естественного языка
Docker
SQL
Git
Redis
Linux
PostgreSQL
REST