Информация
- В рейтинге
- 452-й
- Откуда
- Пермь, Пермский край, Россия
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Технический директор
Старший
От 350 000 ₽
Управление людьми
Управление проектами
Управление продуктами
Разработка программного обеспечения
Python
SQL
Git
Не совсем про чанкинг)), но смотри, если нужно просто добавить новый договор или клиническую рекомендацию, Weaviate отлично справляется с CRUD-операциями на лету. Мы просто загружаем новые объекты. Благодаря тому, что Weaviate (в отличие от, например, FAISS) — это полноценная БД, она сама управляет блокировками и консистентностью. Индекс HNSW обновляется динамически.
А вот Blue-Green - это, наверно, в контексте версионирования - очень на это похоже, здесь мы по классике делаем: часто меняются не просто документы, а логика их интерпретации (или мы меняем модель эмбеддинга) - тогда логично создаем новую коллекцию (Class) в Weaviate с суффиксом версии, заливаем туда данные в фоновом режиме, прогоняем наши CI/CD автометрики (DeepEval) на новой коллекции, если метрики не просели - мы переключаем алиас на уровне API-шлюза или внутри кода приложения на новую коллекцию, старая коллекция живет еще некоторое время как бэкап, затем удаляется. Это гарантирует Zero Downtime и защищает от выкатки битого индекса.
Да, очевидно, так и есть и мы не отвергаем такого подхода, а наоборот активно его внедряем. Кстати, не так давно было неплохое интервью по этому вопросу https://www.youtube.com/watch?v=6TJDriX1CAo&t=2140s