Пользователь
В целом можешь посмотреть в сторону модели LLaVA/vacuna на ее основе есть на huggingface демка которая позволяет генерить описание по фото.
В целом можешь посмотреть в сторону модели LLaVA/vacuna на ее основе есть на huggingface демка которая позволяет генерить описание по фото.