Комментарии 4
Я делаю кое что похожее. :)
PaddleOCR из коробки умеет детектить повернутый текст - по-моему зря вы его вращаете. Еще у меня он плохо детектил на стандартном разрешении, приходится масштабировать до 600 dpi. Но есть проблема, как правильно определить нужный масштаб и долгое время обработки на высоком разрешении.
Для YOLO моделей вы файн тюнинг делали? Датасеты вручную размечали?
Добрый день! На примерах часто PaddleOCR/EasyOCR и другие плохо работают с большим размером файлов. Чертежи часто это большая страница с многими мелкими текстами. Поэтому, чтобы достигать большой точности, мы помогаем OCR.
Мы под домен чертежей с его спецификой разметили сами и дообучили легкую yolo модель, она идеально находит текст, а далее ocr ее понимает. Более того, чтобы достигать большей точности мы дообучали сам OCR на разметке, потому что он часто ошибался.
Привет, Автор статьи. Занимаюсь тем же самым уже года 3 минимум.Слежу за вашим проектом с начала запуска. Многие вещи делаете правильно. У нас не совсем такая задача как у вас мы ищем только макс размеры и отстраиваем иерархию проекта. Подскажите удалось ли найти способ поиска трех габаритных размеров если деталь корпусная прямоугольная видов на чертеже больше 5 и материал задан хим. составом (сталь 45, 40х или прочие)? У вас большая команда?
А технические требования не обрабатываются?
Там может быть информации о термообработке или покрытии деталей, что может существенно изменить техпроцесс.

Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика