Comments 3
О! Лаваш!
Но, я решил пойти по пути собственного распознавания текста изображений, с помощью своего скрипта на Питоне. Ну, хотя бы, ради творческого любопытства.
Жесть, столько лишней работы, когда можно было просто в VLLM кадры засунуть (даже Gemini Flash с французским справится вообще без проблем)
Жесть, столько лишней работы, когда можно было просто в VLLM кадры засунуть (даже Gemini Flash с французским справится вообще без проблем)
Ну, я ж написал, что «в данном случае, проще всего использовать «FineRider» (если его правильно настроить, то он очень хорошо распознает ключевые кадры видео)». Думаю, что это даже проще вашего «Gemini».
А творческие эксперименты дают гораздо больше удовольствия, чем готовые ответы от нейросетей…
Sign up to leave a comment.
Роль данных при изучении иностранного языка