Обновить
6
17
Andrei Nosov@Tianno

AI Architect

Отправить сообщение

Не совсем про чанкинг)), но смотри, если нужно просто добавить новый договор или клиническую рекомендацию, Weaviate отлично справляется с CRUD-операциями на лету. Мы просто загружаем новые объекты. Благодаря тому, что Weaviate (в отличие от, например, FAISS) — это полноценная БД, она сама управляет блокировками и консистентностью. Индекс HNSW обновляется динамически.

А вот Blue-Green - это, наверно, в контексте версионирования - очень на это похоже, здесь мы по классике делаем: часто меняются не просто документы, а логика их интерпретации (или мы меняем модель эмбеддинга) - тогда логично создаем новую коллекцию (Class) в Weaviate с суффиксом версии, заливаем туда данные в фоновом режиме, прогоняем наши CI/CD автометрики (DeepEval) на новой коллекции, если метрики не просели - мы переключаем алиас на уровне API-шлюза или внутри кода приложения на новую коллекцию, старая коллекция живет еще некоторое время как бэкап, затем удаляется. Это гарантирует Zero Downtime и защищает от выкатки битого индекса.

Да, очевидно, так и есть и мы не отвергаем такого подхода, а наоборот активно его внедряем. Кстати, не так давно было неплохое интервью по этому вопросу https://www.youtube.com/watch?v=6TJDriX1CAo&t=2140s

Информация

В рейтинге
452-й
Откуда
Пермь, Пермский край, Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Технический директор
Старший
От 350 000 ₽
Управление людьми
Управление проектами
Управление продуктами
Разработка программного обеспечения
Python
SQL
Git