Комментарии 12
Натренировать нейросеть класса Semantic Segmentation с целью выделить границы кода. На выходе получим ломаный контур кода
любопытно, а что эта задача без нейросети не решается?
Обычно это и решается поиском на основании патерна статических элементов кода. Классический алгоритм распознавание так и работает. Но в случае сильной деформации - велик риск не найти или потратить непредсказуемое количество времени.
В случае нейросети - появляются зоны вероятной схожести с обученными данными (причем достаточно быстро), зная точно что код на фото только один, и он примерно ХХХ пикселей по площади - становится намного проще их отфильтровать и взять контур кода, который бы на 99.9% был именно кодом, а не чем-то на него похожим.
Использовать не L-код (который, как было отмечено, предназначен для размещения на твёрдых поверхностях), а тот, который с самого начала предназначен для гибких? Да не, ерунда какая — давайте будем георически преодолевать проблему, которую создали себе сами!
+1
Мне изначально очень нравилась идея RFID меток: набрал тележку с таким маркированным товаром, вывез её через рамку и карточку приложил - и всё куплено. Никаких тебе штрихкодов, касс, кассиров не надо... Но реальность выглядит немного иначе)
Только вот, что это за код для изогнутых поверхностей?
что это за код для изогнутых поверхностей?
(Участливо:) А, в гугле забанили? Примите мои соболезнования!
(Участливо) Как интересно, PDF417 лучше читается на мятой и блестящей упаковке чем DM? А на чем основано такое мнение?
Странно, что статьей рассмотрены восстановление геометрии кода нейросетью + выпрямление классическим алгоритмом, и полное декодирование данных нейросетью (как фантастика), но не промежуточный вариант где нейросеть на выходе давала бы datamatrix с исправленной геометрией
Я сейчас пытаюсь это реализовать, но пока не нашёл способ, который бы надёжно работал. Буду признателен за любые идеи, которыми вы можете поделиться!
Сам нейросети не обучал, но вообще выглядит очень похоже на Stable Diffusion, который обучается сначала подачей на вход синтетических изображений DataMatrix с минимальными искажениями, а потом с постепенным увеличением шума / перспективного наклона / прочих трансформаций, пока не сможет работать с реальными изображениями.
Как улучшить распознавание маркировки с помощью нейросети