Как стать автором
Обновить

Комментарии 12

Натренировать нейросеть класса Semantic Segmentation с целью выделить границы кода. На выходе получим ломаный контур кода

любопытно, а что эта задача без нейросети не решается?

Обычно это и решается поиском на основании патерна статических элементов кода. Классический алгоритм распознавание так и работает. Но в случае сильной деформации - велик риск не найти или потратить непредсказуемое количество времени.

В случае нейросети - появляются зоны вероятной схожести с обученными данными (причем достаточно быстро), зная точно что код на фото только один, и он примерно ХХХ пикселей по площади - становится намного проще их отфильтровать и взять контур кода, который бы на 99.9% был именно кодом, а не чем-то на него похожим.

Использовать не L-код (который, как было отмечено, предназначен для размещения на твёрдых поверхностях), а тот, который с самого начала предназначен для гибких? Да не, ерунда какая — давайте будем георически преодолевать проблему, которую создали себе сами!

+1

Мне изначально очень нравилась идея RFID меток: набрал тележку с таким маркированным товаром, вывез её через рамку и карточку приложил - и всё куплено. Никаких тебе штрихкодов, касс, кассиров не надо... Но реальность выглядит немного иначе)

Ага. Непонятна стоимость итоговая. Может дублирование rfid-ом дешевле будет.
И вообще, в рамках пиления и воровства бюджетов - всё переделать на rfid - это же золотое дно (Может это нам на новый год?).

Только вот, что это за код для изогнутых поверхностей?

Потому что это, условно говоря, набор одномерных кодов, расположенных один под другим, а с чтением одномерного кода с помятой упаковки проблемы редко возникают.

А на «блестящей упаковке» печатается прямоугольник белой краской, а уже на нём — код.

Странно, что статьей рассмотрены восстановление геометрии кода нейросетью + выпрямление классическим алгоритмом, и полное декодирование данных нейросетью (как фантастика), но не промежуточный вариант где нейросеть на выходе давала бы datamatrix с исправленной геометрией

Я сейчас пытаюсь это реализовать, но пока не нашёл способ, который бы надёжно работал. Буду признателен за любые идеи, которыми вы можете поделиться!

Сам нейросети не обучал, но вообще выглядит очень похоже на Stable Diffusion, который обучается сначала подачей на вход синтетических изображений DataMatrix с минимальными искажениями, а потом с постепенным увеличением шума / перспективного наклона / прочих трансформаций, пока не сможет работать с реальными изображениями.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации