Comments 1
А с практической точки зрения то что? Как проверяли результат и чего достигли?
Мультимодальные модели это самый верх мейнстрима, их создавать то не просто, а уж тюнить без потери их качества и подавно сложно, а вы собираетесь их peft-ом тюнить с 8-битной квантизацией?
99% проблем при работе с изображениями - они не всегда как следуют распознаются, а дальше модели делают на основе этих ошибок неверные рассуждения, умножая процент ошибки на процент галлюцинации.
Sign up to leave a comment.
Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных