Comments / Profile of SmartEngines / Habr

Пользователь

ProfileArticles174PostsNews50Comments429

Аугментация (augmentation, “раздутие”) данных для обучения нейронной сети на примере печатных символов

SmartEngines Aug 20 2015 at 10:38

Если Вы посмотрите наш предыдущий комментарий, то увидите, что в примере, мы увеличиваем выборку всего на 20% при добавлении всех типов искажений. 400 — кратного увеличения выборки никто применять не призывает. Отличие нашего метода от описанного Вами второго подхода лишь в том, что мы осуществляем предварительную аугментацию данных. Это позволяет оптимизировать проведение несколько одновременных экспериментов по обучению сетей и эффективно использовать аппаратные ресурсы. К тому же мы не разу не говорили о применении случайных преобразований при создании данных. Применение случайных искажений, а в особенности их комбинаций, сильно усложняет задачу обучения нейронной сети и далеко не всегда приводит к уменьшению ошибки на тестовой выборке.

0

Аугментация (augmentation, “раздутие”) данных для обучения нейронной сети на примере печатных символов

SmartEngines Aug 18 2015 at 15:42

1. Вы правы.
2. Нам не ясно, что значит «неправильно», и какой эксперимент это показывает. Вычислительные мощности, очевидно, не зависят от порядка применения операций (далее вы сами, противореча себе, написали "… и по времени то же самое"). Размер профита в нашем случае опубликован, статья ровно об этом. Какая цифра вам показалась слишком маленькой? Заранее сделать аугментацию, как мы предлагаем, это (-) потратить много места на диске, (+) получить возможность архивирования удачного варианта раздутия, (+) возможность передать выборку согласно договору, не раскрывая алгоритмов ее создания. Но наша статья — не об этом, а о «профите» от собственно аугментации, вне зависимости от того, на каком этапе она производится.
3. Насколько нам подсказали наши эксперты, большинство победителей (если не все из них) последних лет на MNIST-e использовали раздутие обучающей выборки. Что бы нового мы могли сообщить об этом? В данной публикации мы не предлагаем никакого распознающего алгоритма, мы сосредоточены на выборке. И аугментация, конечно же, известный подход. Нашей целью было показать, насколько хорошо или плохо он работает. При этом раздутие на рукописных символах, очевидно, иное, чем на печатных. Для ниста обычно используются деформации сглаженным случайным полем смещений.
4. Нам тоже интересно, но, к сожалению, мы не являемся специалистами в этой области.

0

Аугментация (augmentation, “раздутие”) данных для обучения нейронной сети на примере печатных символов

SmartEngines Aug 14 2015 at 14:35

Подобные методы построения обучающей выборки действительно могут улучшать финальное качество распознавания. Если интересна данная тематика, можем написать про это еще статью.

0

Аугментация (augmentation, “раздутие”) данных для обучения нейронной сети на примере печатных символов

SmartEngines Aug 13 2015 at 14:20

Размер обучающей выборки возрастает на 20% при добавлении всех типов искажений, время обучения в среднем возрастает на 30%.

0

Поиск четырёхугольников документов на мобильных устройствах

SmartEngines Jun 30 2015 at 20:42

А, идея ясна. Да, это действительно быстро, но на классе изображений и документов, которые хорошо поддаются бинаризации. Должны быть видны все 4 стороны и не должно быть полос внутри, иначе фейл. Неплохо подходит к съемке чего-либо формата А4 на столе, а розовые права в руках или всевозможные карточки/визитки (прозрачные, полосатые, ~~серые в ёлочку~~) с бинаризацией не дружат.

0

Поиск четырёхугольников документов на мобильных устройствах

SmartEngines Jun 30 2015 at 19:29

Если вопрос только в скорости работы схемы перебора, то вы меня немного удивили.
Куча линий состоит из 12 штук — по 3 кандидата для каждой стороны (да, это не указано в статье, но не выписывать же сюда всю конфигурацию?), т.е. 81 возможный четырёхугольник. Почти все операции по анализу углов и начислению штрафов — это O(1), кроме штрафов за вылезание — они О(n), где n — число пикселей за точкой пересечения, которые мы примем во внимание, а не длина картинки или даже региона.
Собственно, выкладка по времени в конце статьи говорит о том, что это далеко не самая затратная часть алгоритма.

К вашему варианту — мне не вполне понятны первые два шага.
К чему применять порог и что вы понимаете под отсечением цельных краёв?

0

Использование монад в С++. Часть 1: монада списка

SmartEngines Jun 24 2015 at 16:22

Такую задачу можно решить одним циклом с std::next_permutation(...) и простой проверкой правильности ответа.

Приведите, пожалуйста, пример задачи (подозреваю, что она будет довольно «промышленной»), которую действительно есть смысл решать с помощью монад на С++, причем без сильного оверхеда. Еще лучше, если у вас уже был такой опыт.

+3

Проблемы распознавания ID-документов на мобильных устройствах на примере машинно-читаемых зон

SmartEngines Jun 9 2015 at 14:04

Нашу демо-программу можно скачать в App Store и Google Play. Информация по лицензированию и цене пока что предоставляется по запросу. Если у вас есть вопросы, мы с удовольствием на них ответим, наш адрес указан на сайте.

0

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 4 2015 at 13:43

Не совсем так — в данном случае мы заранее знаем, что перед нами паспорт, но хотим понять, есть ли на нем голографический узор (где именно он находится мы тоже хотим понять, но про это мы напишем в одной из следующих статей). Дело в том, что до сих пор широко распространены паспорта старого образца, в которых голографический узор отсутствует.

0

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 2 2015 at 18:30

Каждая квадратная точка — это один пиксель. Такая решетка из пикселей получается по той же причине, что и в одномерном случае — спектр гауссианы умножается на спектр периодической решетки (который, как мы показали, также является периодической решеткой), с которой она свернута.

0

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 2 2015 at 16:21

Под полученными периодическими элементами имелись в виду случайные контрастные фоновые элементы, которые, при повторении, могут в Фурье-спектре внезапно выглядеть, как требуемые периодические. Хотя, при должном рассмотрении, эта ситуация должна решаться.

Добить нулями с изменением модели изображения можно, но анализ станет значительно сложнее, поскольку к простому произведению спектров добавится свертка со сложным спектром, который совсем не похож на решетку из пиков.

+1

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 2 2015 at 15:47

Спасибо, исправили — очень неудобно ТеХовые формулы писать не напрямую, а через сторонние сайты перегонять в картинки.

0

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 2 2015 at 15:30

Мы проверяли, что при 5% ошибке обрезки метод все еще работает, а разметка в наших датасетах имеет значительно меньшую ошибку.

0

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 2 2015 at 14:28

Спасибо за ценное замечание! Действительно, если число периодов не целое, но хотя бы один период присутствует, то можно продолжить картинку до целого числа периодов и свести задачу к описанной.
С другой стороны, появляется риск получить периодические элементы там, где их изначально не было, а также возможны небольшие проблемы со «стыковкой» периодических элементов шаблона.

+1

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

SmartEngines Jun 2 2015 at 10:22

В данный момент для нас основным приоритетом является система распознавания паспортов РФ, поэтому первоначальное тестирование проводилось именно на паспортах. Метод должен работать и для других типов документов с периодическими шаблонами.

+1

Технология распознавания этикеток на примере ярлыков из IKEA (2 видео)

SmartEngines Apr 14 2015 at 12:54

Методы обработки изображений, которые использовали наши стажеры, уже были реализованы в нашей бибилиотеке обработки изображений, которая оптимизирована под ARM архитектуру. Использовать огромный и не очень быстрый на мобильниках Tesseract, когда у нас есть свои наработки, которые отлично решают задачи распознавания, видится лишенным смысла.

0

Технология распознавания этикеток на примере ярлыков из IKEA (2 видео)

SmartEngines Apr 14 2015 at 11:59

Ядро распознавания готово, интерфейс в разработке.

0

Распознавание Паспорта РФ на мобильном телефоне. (UPD: 28.03.2015 + выложили программу в App Store)

SmartEngines Mar 18 2015 at 14:31

УЭК будем распознавать. Насчет паспортов и ID карт других стран — ведем работы, самое сложное это найти массивы для обучения, настройки и отладки — персональные данные. Нюансов, конечно, множество, но это и интересно. Фрагментация по процессорам и камерам требует внимания и если его прикладывать, то в конечном итоге, качество только растет.

0

Распознавание Паспорта РФ на мобильном телефоне. (UPD: 28.03.2015 + выложили программу в App Store)

SmartEngines Mar 18 2015 at 10:57

Такой сервис, в случае обеспечения безопасности и хорошего уровня QoS, был бы весьма полезен. Логично, чтобы он был услугой предоставляемой государством.

-1

Распознавание Паспорта РФ на мобильном телефоне. (UPD: 28.03.2015 + выложили программу в App Store)

SmartEngines Mar 18 2015 at 10:54

В данный момент опубликована сборка под ARM, требования: наличие автофокуса. С Dell Venue будем разбираться, если не сложно уточните модель и версию операционной системы.

0

1 2 ...

20