Я делаю систему и прочитав статью обнаружил что она соответствует принципам ДДД. Забавно. Выходит я неплохой разраб. Поэтому предположу что можно еще привнести в ддд (тк сам это использую):
Маршрутизатор/роутер для событий - удобно расширять функционал и не надо знать вообще куда посылать событие и кто его обработает
Команды вместо событий. Событие это постфактум сообщение о произошедшем типа «я прочитал письмо» а команда это «прочитай письмо» - их можно использовать если есть строгая известная иерархия исполнения (как в процессоре)
Хорошо написанные команды составляют «язык системы» и его можно записать в файл как программу или отправить на исполнение в копию системы
Адресация данных: желательно адресовать их не только через ИД но и через путь
Зачем использовать qwen с 32кб контекстом если есть модели побыстрее и на 128кб?
Всего одна модель перерабатывала всю эту кучу документов?
Все эти чанки из какой бд и какой эмбеддер?
Обычно в доках пишут в конце на основе каких НД и РД а сверху пишут какой отдел и тд - этой информации должно хватать для понимания на основании чего проверять)
Эмбеддер лучше сделайте свой или категоризацию предварительную
Это наверное сотый бесполезный текст про RAG где так и не написано как лечить его болячки. Предлагаю внедрить на хабр ИИ который будет оценивать подобные тексты
Пока эти гуру спорят скромные неизвестные инженеры делают CSS
А где можно посмотреть скорость локальных ллм? Мне для rag надо чтото быстрое
Спасибо. Ноль полезной инфы
Под линукс нет)
Лучше для скайрима локации генерил с квестами а то запарился ждать
Даже pandadoc не умеет нормально конвертировать ворд в md. Так что я использую libreoffice как конвертор через ком строку в обычный текст
Зачем ссылка на демку которая не работает? А если работала то сделайте картинку с результатом работы и покажите. Или текстом. А то выглядит как обман
Какая сейчас самая быстрая локальная модель для RAG?
С 5% ни за что заработала миллиард . Поздравляем что теперь ее распиарят феминистки
Это где тестил?
Я делаю систему и прочитав статью обнаружил что она соответствует принципам ДДД. Забавно. Выходит я неплохой разраб. Поэтому предположу что можно еще привнести в ддд (тк сам это использую):
Маршрутизатор/роутер для событий - удобно расширять функционал и не надо знать вообще куда посылать событие и кто его обработает
Команды вместо событий. Событие это постфактум сообщение о произошедшем типа «я прочитал письмо» а команда это «прочитай письмо» - их можно использовать если есть строгая известная иерархия исполнения (как в процессоре)
Хорошо написанные команды составляют «язык системы» и его можно записать в файл как программу или отправить на исполнение в копию системы
Адресация данных: желательно адресовать их не только через ИД но и через путь
И тд
Удачи!
Ну так что в результате получилось? Есть примеры вопрос-ответ?
Хорошо когда документ помещается в контекст. А я столкнулся с потерей связности в чанках на больших документах и пока не нашел нормального решения
посмотрите что такое дигай
Это забавно что автор не догадался попросить ИИ придумать сложные задачи
Мила делала, а Миша помогал. Лол.
Зачем использовать qwen с 32кб контекстом если есть модели побыстрее и на 128кб?
Всего одна модель перерабатывала всю эту кучу документов?
Все эти чанки из какой бд и какой эмбеддер?
Обычно в доках пишут в конце на основе каких НД и РД а сверху пишут какой отдел и тд - этой информации должно хватать для понимания на основании чего проверять)
Эмбеддер лучше сделайте свой или категоризацию предварительную
Это не программисты а менеджеры всякие
Это наверное сотый бесполезный текст про RAG где так и не написано как лечить его болячки. Предлагаю внедрить на хабр ИИ который будет оценивать подобные тексты
Если бы все в контекст помещалось то и раг не нужен )))