Комментарии 2
Модели хорошо работающие с картинками можно по пальцам одной руки пересчитать и они все поддерживают json output.
К вопросу о цене - гугол дает бесплатный апи к джемини почти безлимитно, 1500 запросов к 2.0 флеш и 500 к 2.5 в сутки на один аккаунт, а их можно сделать несколько.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Какая GPT-модель лучше распознаёт аннотации книг?