Обновить

Комментарии 3

Попробовал сделать ocr pdf таким способом. Получил текст с первых 3 страниц. Это ограничение бесплатной версии или что?

Это не ограничение бесплатной версии, а специфика Google Drive OCR. Для тяжелых файлов он бывает извлекает только 3-10 страниц. В задаче формирования каталога/описания этого достаточно. А для полного OCR проще использовать вызов мультимодальной модели (gemini-3.5-flash или gemini-3.1-flash-lite) и передавать им файл через File API или прямо в запросе.

Обычной модель для ocr не подходит (в чистом виде). Как минимум ей надо нарезать pdf на части, у нее максимальный размер ответа ограничен. А еще надо бороться с ее глюками, то она не весь текст вернет, то исправит его, то вообще откажется потому что ии-цензура сработала - детей и лекарства(drugs) в одном предложении рядом увидела.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации