All streams
Search
Write a publication
Pull to refresh
79
0

Пользователь

Send message
Это во многом зависит от разных факторов: каким образом менять скорость обучения, какие раздутия применять, как часто проверять качество на валидационной выборке и т.д. Под конец соревнования на одном Titan X, со всеми раздутиями и без отписывания результатов на валидационной выборке по мере обучения сети время обучения составляло ~ 12 часов. Вечером поставил учиться, утром пришёл и смотришь чему научилась сетка.
Организаторы соревнования вместе с оригинальной статьей планировали выложить ещё и некоторые решения, насколько я знаю. Думаю, что можно будет взять оттуда и от души наиграться =)

Сетка полностью убрала рамку, поскольку рамка мало похожа на рукопись или печатный текст =). Есть некоторые артефакты при бинаризации 7-ки в «2017» на второй строке — но они есть и в оригинальном изображнении.
По методу Виолы и Джонса детектор (классификатор) представляется в виде каскада сильных классификаторов. Каждый сильный классификатор состоит из слабых классификаторов. Каждый слабый классификатор базируется на одной фиче. Сильный классификатор — линейная комбинация слабых классификаторов, то есть при вычислении сильного классификатора порядок фич не важен.
Нюансы есть во всех архитектурах и их реализациях, Эльбрус не исключение, а так это нормальная работа. Пока главная проблема в том, что мало кто этим занимается и нет публичных ресурсов где можно спросить совета или обменяться знаниями — нужно общаться напрямую с разработчиком, что радует в этом проблем у нас нет. Правда у нас есть бонус — мы расположены рядом с МЦСТ и всегда можем сходить пообщаться.
Размер бинарного файла нашего sample-приложения внутри .app архива для одной архитектуры растет до примерно 7 мегабайт после линковки к статической библиотеке ядра распознавания. Кроме того, каждый новый документ добавляет около 1 мегабайта конфигураций. В следующей версии мы планируем еще сильнее уменьшить размер конфигурации для случая большого количества документов.
Это вопрос к производителю в лице МЦСТ, передадим, если ответят, то разместим его тут.
Применений множество и притом не всегда очевидных, вопрос настройки, доработки, развития под конкретные задачи.
Эталонные изображения превращаем в дескрипторы, дальше дескрипторы укладываются в специальное поисковое дерево, в котором потом уже ищем. Дерево храним на устройстве, устройство не требует подключения к сети, сетевое соединение потребляет энергию, кроме того его может и не быть. Сам по себе подход можно сделать и онлайновым была бы задача.
Метод универсален, можно использовать в качестве источника и Яндекс.Панорамы, и вообще любые видео- фото- ряды с привязкой к координатной сетке, в том числе и подстилающей поверхности. Гугл был использован по причине простоты получения исходных данных.
компилировали действительно Community Edition со включенными оптимизациями
МЦСТ предоставляет возможность тестирования без необходимости покупки, а покупать дорогую(очень) машину только для тестов наша компания не может, да и не хочет. Заказчиков использующих Itanium у нас нет, больших перспектив тоже нет, если Intel предложит мы всегда за.
Вот пример, одного из предварительных результатов оптимизации одной из функций только с помошью интринсиков Эльбруса-4С. Для ARM и Intel велась еще более серьезная алгоритмическая оптимизация под архитектуру.
Сравнивали с ВК Эльбрус 401-PC на борту один Эльбрус-4С на 800МГц
Везде где возможно и реально заметна разница мы стараемся использовать целые числа. Еще одно важное замечание — для 4С мы уже провели оптимизацию нескольких функций с помощью интринсиков уже получили 4х кратное преимущество, но это уже тема для другой статьи.
Было бы интересно сравнить, но где его достать…
Для Эльбрус-8С нет, у нас был в распоряжении только однопроцессорный вариант, для Эльбрус-4С в этой статье можно посмотреть наши эксперименты на 4 процессорном сервере.
Там все специальное, матплата и мосты. Исходники чего?
Мы уважаем закон, для тестирования мы взяли 50 паспортов своих сотрудников и сделали из них 1000 различных изображений (повороты и сдвиги на разных сканерах, фотографии разными телефонами в разных условиях, ксероксы), для видео мы просто сделали 100 роликов на разных вебкамерах по 10 кадров.

Information

Rating
Does not participate
Registered
Activity