Обновить
20

Пользователь

Отправить сообщение
Пожалуй вверну пару тезисов.
Во-первых сверточные сети, в некоторой степени обманка(в плане того что не надо считать фичи),
ибо фичи считаются внутри сети(convolution и pooling слои), и получается вместо инженерии фич
вы занимаетесь инженерией архитектуры сети и слоёв,
у глубоких полносвязных нейросетей правда внутри этого нет(только архитектура варьируется), но не знаю так ли они хороши как сверточные для работы с изображениями.
И еще забавно что сам Ян Лекун отрезал последний слой сверточной сети и на конец вешал SVM и точность была выше!(т.е. по сути нейронная сеть использовалась только для преобразования пикселей в фичи)
И еще по сетке обученной на одной базе например MNIST можно обучить новую сеть используемую для другой похожей базы(других цифр), вроде это называется transfer learning.
вот тут где сетка похожая на рогатину
events.yandex.ru/lib/talks/2431/

Думаю задачу близко ли деревья к электропроводам можно решить сегментируя картинки(были работы и используя сверточную сеть) т.е. мы должны иметь базу отсегментированную вручную, а может быть даже и пихая на вход сами изображения, только потребуется намного больше данных.
В описании в основном олдовые методы детекторов особых точек без оглядки на сравнение к инвариантности к повороту и скейлу\трансформациям и засветкам.
Или вы разделяете понятия детектор углов и детектор особых точек? Если нет, то почему не было про тот же SIFT и кучу других детекторов например из opencv? Если да, то для чего используются именно детекторы углов?

вот довольно обширные сравнения
http://www.robots.ox.ac.uk/~vgg/research/affine/
http://homes.esat.kuleuven.be/~tuytelaa/FT_survey_interestpoints08.pdf
Там в коде используется пирамида для ускорения вычислений, а еще там куча параметров, что не радует, так как не понятно как их настраивать, но по ощущениям код работает быстро.

Какого то полномаштабного сравнения не производил, но я попробовал на реальных автомобильных номерах(надо выбирать рект ближе к номеру(чтобы было поменьше фона), не всегда срабатывает правильно, т.е. не доворачивает), а так же на лицах.Но на самом деле для лиц нам нужен не просто разворот, а нам нужно совмещение лиц(обычно делают просто совмещение по глазам и рту) и есть модификация основанная всё на той же кухне которая это делает, возможно я напишу об этом статью попозже.

Ошибки он делает, я даже привел в статье случаи, и бывает еще хуже если он за что то уцепиться и сойдется не туда, биения я не наблюдал.

пример для лиц с детектором матлаба

ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%82%D1%80%D0%BE%D0%B2%D0%B0%D1%8F_%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D0%BA%D0%B0
ru.wikipedia.org/wiki/%D0%9F%D0%B8%D0%BA%D1%81%D0%B5%D0%BB%D1%8C

Растровые картинки как бы уже сами по себе матрицы без преобразования(ну если уж совсем вдаваться в подробности то они хранятся как список чисел в массиве в расжатом виде, но например в matlab imread('mycoolImg.jpg') выдает изображении в виде матрицы и можно делать с ним всё что угодно как с обычной матрицей)

Код есть в конце, но он скажем так не тривиальный:)
Скрытые марковские модели, глубокая нейронная сеть, рекуррентная нейронная сеть и всё в 1 месте!

Почему используется MFCC? вроде как DNN может работать и с «сырыми данными», во всяком случае с изображениями работает на уровне пикселей(хотя там свёрточные сети скорее).

можно ли как то дообучить модель под конкретного человека?
Попробовал webasr.yandex.net/ пока получается примерно так:
Как то вы странно базу выложили, как по ней производить тестирование точности детектирования и распознавания?
По идее надо было выкладывать первый архив(«база необрезанных фотографий автомобилей») и дополнительно к ней метаинформацию в виде координат описанных прямоугольников вокруг номеров для задачи детектирования и текстового описания что на номере изображено для задачи распознавания.
Пробовали ли вы как то автоматизировать процесс? Например применить сегментацию изображений или 3Д реконструкцию по срезам?

Как называется эта область которой вы занимаетесь(желательно по английски, а лучше ссылку на пару документов)? что то типа неразрушающего контроля, верификации плат\чипов?

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность