Search
Write a publication
Pull to refresh

Comments 3

Но, я решил пойти по пути собственного распознавания текста изображений, с помощью своего скрипта на Питоне. Ну, хотя бы, ради творческого любопытства.

Жесть, столько лишней работы, когда можно было просто в VLLM кадры засунуть (даже Gemini Flash с французским справится вообще без проблем)

Жесть, столько лишней работы, когда можно было просто в VLLM кадры засунуть (даже Gemini Flash с французским справится вообще без проблем)

Ну, я ж написал, что «в данном случае, проще всего использовать «FineRider» (если его правильно настроить, то он очень хорошо распознает ключевые кадры видео)». Думаю, что это даже проще вашего «Gemini».

А творческие эксперименты дают гораздо больше удовольствия, чем готовые ответы от нейросетей…

Sign up to leave a comment.

Articles