Pull to refresh

Comments 6

Я делаю кое что похожее. :)

PaddleOCR из коробки умеет детектить повернутый текст - по-моему зря вы его вращаете. Еще у меня он плохо детектил на стандартном разрешении, приходится масштабировать до 600 dpi. Но есть проблема, как правильно определить нужный масштаб и долгое время обработки на высоком разрешении.

Для YOLO моделей вы файн тюнинг делали? Датасеты вручную размечали?

Добрый день! На примерах часто PaddleOCR/EasyOCR и другие плохо работают с большим размером файлов. Чертежи часто это большая страница с многими мелкими текстами. Поэтому, чтобы достигать большой точности, мы помогаем OCR.

Мы под домен чертежей с его спецификой разметили сами и дообучили легкую yolo модель, она идеально находит текст, а далее ocr ее понимает. Более того, чтобы достигать большей точности мы дообучали сам OCR на разметке, потому что он часто ошибался.

Привет, Автор статьи. Занимаюсь тем же самым уже года 3 минимум.Слежу за вашим проектом с начала запуска. Многие вещи делаете правильно. У нас не совсем такая задача как у вас мы ищем только макс размеры и отстраиваем иерархию проекта. Подскажите удалось ли найти способ поиска трех габаритных размеров если деталь корпусная прямоугольная видов на чертеже больше 5 и материал задан хим. составом (сталь 45, 40х или прочие)? У вас большая команда?

А технические требования не обрабатываются?

Там может быть информации о термообработке или покрытии деталей, что может существенно изменить техпроцесс.

Спасибо, очень интересное направление и разработка)

Детекция разбита на шесть специализированных YOLO

  • Через что разметку делали (LM Studio)?

  • Подключали ли авто-разметку через LLM?

  • Получается для каждого типа графических объектов (слоя?) обучали YOLO модель (какая версия и размер используется в production, если не секрет)?

Sign up to leave a comment.

Articles