Comments 6
Привет, скажите а что за детектор текста? "Работает далеко не идеально, но может быть полезным в большинстве случаев."
Вы делаете хороший проект и я бы вам дал хороший детектор текста (по моему мнению), довольно быстрый
Привет. Строчки 402-421 модели для определения текста перед удалением. Используется CNN VGG16. Дело больше не в том, что он плохо выделяет (в редких случаях не выделяет текст), дело в том что он может выделить текст на упаковках, одежде, итд, т.е. где совсем не хочется. Больше поможет доработка логики, чтобы текст выделялся только в фиксированной области. Но это усложнит логику + плюс как мы знаем текст может двигаться из одной области в другую или скрещиваться. Пока не придумал одно решение на всё.
На данный момент, есть параметр delay в секундах, пользователь его выбирает, чтобы за это время открыть директорию, где эти маски хранятся и подправить дефектные маски. Пока универсальное решение такое, оно не усложняет логику, но к сожалению имеет ручной подход.
Возможно, сработала бы идея, если указывать какой именно текст удалять, т.е. поле для текста, пользователь вводить туда текст, и если определенный текст совпал с полем, тогда удаляем. А этом случае надо ещё добавить детекции текста на мульти языки.
Я понял что vgg16_east.pth сам детектор текста, а для чего нужна модель vgg16_baseline.pth размером 500 МБ?
Я к чему веду, в вашем проекте я нашел для себя много полезного, ценен он еще открытым исх.кодом, за что отдельное спасибо поэтому если есть желание можете подключить мой детектор напишите, без проблем, размер 45 МБ, 300 мсек. на картинку
Спасибо за предложение, буду знать. На текущий момент приоритет довести до ума клонирование голоса и v2, а дальше посмотрим. До совершенства можно вечно доводить, а с каждым годом появляются всё лучше готовые решения. Оставайтесь в telegram wladblog, чтобы узнавать о статусе разработки. Пока не большой перерыв от Wunjo.
Разбираем использование open-source Wunjo AI в ваших проектах с искусственным интеллектом и просто нейронные сети